Чайтанья Бангур, директор по геномике, Microsoft Health
Геномика лежит в основе развития целевой терапии и точной медицины. Достижения в технологиях секвенирования ДНК привели к революции в исследованиях, основанных на геномике, и помогают лучше понять биологию человека и причины его болезней. Полученные знания позволяют разрабатывать индивидуальные медицинские стратегии, помогающие эффективно предотвращать, диагностировать и лечить различные заболевания.
Секвенирование геномов на уровне всей человеческой популяции потребуется для расшифровки геномного отпечатка болезни, прогнозирования индивидуальных изменений в течение заболевания и реакции на лечение, а также для разработки моделей клинических решений. Стремительное развитие исследований геномных данных и вычислительная мощность, необходимая для анализа, потребуют более простого и гибкого управления, безопасности данных и доступа к масштабируемой памяти.
Выбор в пользу облачных решений здесь очевиден. Инструменты с открытым исходным кодом будут все чаще необходимы для обеспечения доступа к данным, взаимодействия между программными продуктами и получения надежных результатов и моделей. Microsoft не только поддерживает проекты с открытым исходным кодом, но делает активный вклад в их развитие, облегчая использование таких инструментов и программного обеспечения в Azure.
С этой целью команда Microsoft Genomics выпустила несколько проектов с открытым исходным кодом на GitHub, включая Cromwell в Azure, Genomics Notebooks, а также обеспечила поддержку Bioconductor для Azure. Мы также сделали доступным постоянно увеличивающийся список общедоступных наборов данных по геномике, реализованный на платформе Azure Open Dataset.
Масштабируйте и автоматизируйте геномные рабочие процессы в Azure с помощью Cromwell
Cromwell – это система управления рабочими процессами с открытым исходным кодом, ориентированная на проведение научных экспериментов, первоначально разработанная Broad Institute. С помощью Cromwell в Azure пользователи могут ускорить свои геномные исследования с помощью гипермасштабируемых вычислительных возможностей Azure. Cromwell управляет динамической подготовкой вычислительных ресурсов через пакетную службу Azure и интегрируется с учетной записью хранилища BLOB-объектов Azure, что значительно облегчает доступ к данным.
Развитие нового метода определения характеристик COVID-19 на основе секвенирования нового поколения (NGS) с помощью Biotia
Biotia – это новый стартап, ориентированный на создание платформы, использующей секвенирование ДНК следующего поколения (NGS) и искусственный интеллект (AI) для точного обнаружения и диагностики заболеваний. Команда стартапа искала подходящее облачное решение для управления своими конвейерами NGS, и Cromwell в Azure смогла удовлетворить их ключевые требования.
Обеспечьте совместный и повторяемый анализ данных с помощью Genomics Notebooks на базе Jupyter Notebooks в Azure
Jupyter Notebooks предоставляет пользователям среду для анализа данных с использованием R или Python и обеспечивает возможность многократного использования различных методов и повторного получения результатов. Исследователи, работающие в области биомедицины, а также IT-специалисты, все чаще используют ноутбуки для анализа геномных данных и для построения моделей машинного обучения на основе мультимодальных наборов данных (геномных, фенотипических, клинических, EMR, демографических и т. д.).
Проект Microsoft Genomics Notebooks с открытым исходным кодом предоставляет растущую коллекцию предварительно настроенных записных книжек, которые пользователи могут легко запускать и использовать в своей рабочей области Azure. Эти предварительно сконфигурированные записные книжки охватывают сценарии от обнаружения вариантов геномики, фильтрации, аннотации до преобразования геномных, фенотипических и клинических данных в мультимодальные фреймы данных, необходимые для запросов данных и построения моделей машинного обучения.
Использование геномных данных для оценки воздействия на окружающую среду совместно с Министерством рыболовства и океанов Канады
Канадский департамент рыболовства и океанов (DFO) отвечает за сохранение водных природных ресурсов страны. Исследователи DFO из Бедфордского института океанографии в Дартмуте (Новая Шотландия) использовали геномику, чтобы выявить влияние климатических изменений и человеческой деятельности на миграцию, генетическое разнообразие и количество популяции таких рыб, как атлантический лосось и атлантическая треска.
Исследовательские группы начали с секвенирования сотен рыбьих геномов, ища решения на основе Azure для масштабирования и оптимизации возрастающих потребностей в геномике и анализе данных. Команда успешно развернула и протестировала Cromwell в Azure в масштабе и теперь планирует принять его в качестве универсальной платформы для работы с геномикой в различных учреждениях.
Легкий доступ к обширному набору инструментов биоинформатики, созданных с помощью Bioconductor в Azure
Bioconductor – это проект с открытым исходным кодом, который направлен на создание репозитория расширяемых статистических и графических пакетов программного обеспечения, разработанных на базе R. Он предназначен для анализа геномных и биомедицинских данных. Microsoft сотрудничает с командой Bioconductor в обеспечении поддержки Azure для этого обширного репозитория программного обеспечения OSS.
Специалисты в области биоинформатики, а также IT-специалисты теперь могут легко использовать программные пакеты Bioconductor в Azure, развернув предварительно настроенный образ Docker Bioconductor, размещенный в реестре контейнеров Microsoft на Docker Hub. Кроме того, пользователи могут также использовать шаблоны виртуальной машины Azure для развертывания Genomics Data Science с предварительно настроенными инструментами для исследования, анализа, машинного обучения и разработки моделей глубокого обучения.
Ускорьте обработку экзома и генома с помощью Microsoft Genomics в Azure
Microsoft Genomics – это высокомасштабируемая служба Azure для выполнения вторичного анализа генома человека с помощью программного обеспечения с открытым исходным кодом Burrows-Wheeler Aligner (BWA) и Genome Analysis Toolkit (GATK). Услуга сертифицирована по ISO, позволяет клиентам соблюдать HIPAA и подпадает под действие Соглашения Microsoft Business Associate Agreement (BAA). Microsoft продолжает оптимизировать производительность службы, используя инновации в высокопроизводительной вычислительной инфраструктуре . Это дает возможность клиентам получать необходимую информацию из полного секвенирования генома (WGS) в течение нескольких часов.