Дмитрий Кривошеев: геном и искусственный интеллект

313

Генетика — одна из самых быстрорастущих областей современной науки. Благодаря искусственному интеллекту и биоинформатике мы учимся читать «главную молекулу» человека — ДНК — и предсказывать, как она влияет на здоровье, способности и даже личные вкусы. О том, как устроен геном, что такое AlphaFold и зачем сегодня секвенируют коров, рассказал в Ельцин Центре в Екатеринбурге Дмитрий Кривошеев — молекулярный биолог и сотрудник компании Genotech, занимающейся потребительской генетикой и биоинформатикой.

Его лекция стала подробным экскурсом в историю генетики, объяснением революционных технологий работы с ДНК и — главное — рассказом о том, как искусственный интеллект меняет науку о человеке.

Как мы научились читать ДНК

История современной генетики началась в 1869 году в монастырском саду в Брно, где монах Грегор Мендель вывел закономерности наследования признаков у гороха. «Он скрещивал растения и обнаружил, что признаки не смешиваются, а передаются дискретно. Естествоиспытатель предположил, что существуют некие единицы наследственной информации. По сути, он предвосхитил понятие гена», — пояснил Дмитрий Кривошеев.

Позже, благодаря опыту Томаса Моргана с дрозофилами (Колумбийский университет, Нью-Йорк, 1910 год), стало ясно: гены располагаются на хромосомах, и именно они отвечают за передачу признаков от родителей к потомкам. А настоящей революцией в науке стало открытие структуры ДНК Джеймсом Уотсоном и Фрэнсисом Криком в 1953 году:

«После этого учёным стало понятно, как работает наследственность. ДНК — это не метафора, это действительно текст, в котором записана вся информация о живом организме», — сказал эксперт.

— ДНК состоит из четырёх нуклеотидных пар («букв») — аденина (A), тимина (T), гуанина (G) и цитозина (C) — и вся жизнь на планете построена именно на их бесконечно длинных комбинациях. Например, геном человека содержит три миллиарда нуклеотидных пар, в которых закодирована информация обо всём организме, — отметил Дмитрий Кривошеев.

Важно, что две цепочки ДНК связываются по принципу комплементарности: если на одной аденин, то на другой тимин; если на одной гуанин — на другой цитозин. Это позволяет не только точно копировать информацию при делении клеток, но и восстанавливать повреждённые участки. «Благодаря этому механизму повышается надёжность хранения и передачи генетической информации. Если одна цепь повреждается, вторая служит образцом для восстановления первой», — пояснил лектор.

Геном, секвенирование и искусственный интеллект

Генетика совершила гигантский скачок в последние двадцать лет — главным образом, благодаря появлению технологий секвенирования ДНК и развитию искусственного интеллекта.

«Сегодня мы можем не только прочитать ДНК, но и анализировать её как текст, используя методы big data и машинного обучения. Без искусственного интеллекта мы бы не справились с такими объёмами информации», — подчеркнул Дмитрий Кривошеев.

Он напомнил, что в 2000 году завершился международный проект «Геном человека». Первая расшифровка стоила порядка трех миллиардов долларов — столько же, сколько в человеческом геноме нуклеотидных пар. Сегодня полное секвенирование генома обходится уже в районе 100 тысяч рублей, а отдельные генетические тесты стоимостью от 10 до 30 тысяч рублей стали доступны миллионам людей.

Значимые различия в 0,1%

Почему мы можем делать «короткие» тесты, а не читать весь геном целиком?

Оказывается, люди между собой крайне похожи: на 99,9% ДНК у всех одинакова. Основные отличия — в точечных вариациях, так называемых single nucleotide polymorphisms (SNP, или «снипы»). Анализируя именно эти участки, мы можем узнать о предрасположенности к болезням, особенностях обмена веществ и даже способностях, пояснил Дмитрий Кривошеев.

Различия спрятаны в одном промилле, но именно эта доля процента и определяет, почему один человек не переносит лактозу, а другой обладает абсолютным слухом. Некоторые мутации приводят к заболеваниям. Яркий пример — серповидно-клеточная анемия. Одна «опечатка» в гене гемоглобина — и эритроциты меняют форму, ухудшается доставка кислорода к тканям. Но в условиях малярии такая мутация может оказаться полезной: плазмодий не выживает в изменённых клетках.

Искусственный интеллект и прогнозирование белковых структур

Ключевое открытие последних лет в биоинформатике связано с тем, как ДНК кодирует белки. Из 20 базовых для человеческого организма аминокислот можно собрать десятки тысяч разных молекул — от ферментов до гормонов. Но чтобы белок заработал, он должен правильно «сложиться». Эта пространственная структура — фолдинг — раньше была трудной загадкой.

Всё изменилось, когда DeepMind, дочерняя компания Google, создала под руководством Демиса Хассабиса и Джона Джампера программу AlphaFold. Она способна по тексту ДНК точно предсказать, как именно сложится белок, какую форму примет — а значит, каким будет его функционал. Ранее на такие вычисления уходили годы и гигантские ресурсы. Поэтому неудивительно, что за разработку ИИ-решения учёные были удостоены Нобелевской премии по химии в 2023 году.

«Благодаря системам искусственного интеллекта мы можем создавать наномашины, обладающие свойствами, которых нет в природе. Мы как будто взламываем природу и учимся делать прогнозы, которые ранее были невозможны для человеческого разума», — сказал Дмитрий Кривошеев.

Как ИИ меняет медицину

Самое интересное начинается, когда генетика соединяется с искусственным интеллектом. Это дало жизнь направлению GWAS — полногеномным ассоциативным исследованиям. «Суть простая: берём сотни тысяч геномов и ищем, какие варианты ДНК чаще встречаются у людей с тем или иным признаком — например, диабетом второго типа или абсолютным слухом», — объясняет Кривошеев.

По этой методике были обнаружены 74 участка ДНК, ассоциированные с длительностью получения образования. Потом ИИ дал участникам тест и угадал, кто сколько учился. Впечатляюще — но не пугающе.

«Главный вывод из популяционной генетики: в среднем люди средние. У кого-то больше мутаций „в плюс“, у кого-то „в минус“, но решающее значение всегда будут иметь среда, воспитание и образ жизни»,— подчеркнул лектор.

Сегодня ИИ и big data помогают рассчитывать полигенные шкалы риска. Это как банковский скоринг, только не про кредиты, а про болезни. Дмитрий Кривошеев рассказал, что современные генетические тесты позволяют:

  • выявлять предрасположенность к сотням заболеваний (например, диабету, болезням сердца, некоторым формам рака);
  • оценивать вероятность развития наследственных болезней;
  • выявлять индивидуальные особенности обмена веществ (переносимость глютена, лактозы и др.);
  • предсказывать, как организм реагирует на разные препараты (фармакогенетика).

«Мы уже сегодня умеем маршрутизировать пациентов — это меняет саму парадигму здравоохранения: мы переходим к персонализированной медицине, где профилактика и диагностика строятся на индивидуальном генетическом профиле», — подчеркнул Дмитрий Кривошеев.

Генетика в сельском хозяйстве и борьбе с ковидом

Геном сегодня читают не только у людей, но и у коров. Генетическая селекция позволяет заранее оценить, насколько молочной будет тёлка, ещё до её взросления. Это экономит годы работы и миллионы рублей.

Одним из самых ярких примеров современной генетической инженерии является технология редактирования генома CRISPR/Cas9. Она позволяет точечно изменять ДНК живых организмов с высочайшей точностью, что открыло новые горизонты для медицины, биотехнологий и сельского хозяйства.

В качестве примера Дмитрий Кривошеев рассказал о бельгийских голубых быках, которые от природы обладают увеличенной мышечной массой благодаря одной точечной мутации в гене миостатина. Сегодня учёные могут воспроизводить и контролировать такие мутации с помощью CRISPR/Cas9, создавая породы животных с заданными характеристиками и повышая продуктивность сельского хозяйства.

Компания Genotech, где работает Дмитрий Кривошеев, в 2020 году вошла в международный консорциум по изучению генетических факторов, влияющих на тяжесть COVID-19. Оказалось, некоторые люди от природы устойчивы к вирусу и переносят его бессимптомно — в том числе из-за определённых генетических вариантов.

«Иногда генетика работает не только в прошлом — в том, что вы унаследовали. Но и в будущем — в том, как вы отреагируете на новую болезнь, которую мир ещё не знал», — отметил Дмитрий Кривошеев.

Этические вопросы и вызовы времени

В финале лектор поднял важный вопрос: почему в обществе сохраняется настороженность и даже страх перед генной инженерией и биотехнологиями? Многие до сих пор воспринимают генные технологии как «что-то аморальное». Но, как считает Дмитрий Кривошеев, это вопрос образования:

«Чтобы во всём этом разобраться, надо постараться. Гораздо проще не понять, а потом бояться. Но если мы не будем заниматься просвещением, то страхи будут мешать развитию технологий, которые могут спасти миллионы жизней».

Эксперт также обратил внимание на важность открытости и анонимности при работе с генетическими данными, а также на то, что вся информация, получаемая при тестировании, хранится обезличенно и не может быть использована против клиента.

По словам лектора, мы живём в эпоху, когда генетика, искусственный интеллект и биоинформатика переписывают основы медицины, аграрной науки и экологии. Но благодаря этому подходу мы можем решить многие фундаментальные проблемы человечества — от диагностики до продовольственной безопасности.

«Будущее уже наступило. И оно закодировано в четырёх буквах: A, T, G, C. Всё остальное — вопрос расшифровки», — сказал Дмитрий Кривошеев, завершая лекцию.

ИСТОЧНИК: Ельцин Центр https://yeltsin.ru/news/dmitrij-krivosheev-genom-i-iskusstvennyj-intellekt/