Фазовый переход в исследованиях белка

12.08.2024
263

Романтический период в изучении сворачивания белка кончился; исследование белковых агрегатов только начинается

Алексей Финкельштейн
Алексей Финкельштейн

Алексей Витальевич Финкельштейн, специалист в области молекулярной биологии и белковой инженерии, докт. физ.-мат. наук, профессор МГУ, чл.-корр. РАН, зав. лабораторией физики белка Института белка РАН, беседует с Михаилом Гельфандом в рамках медиапроекта Сколтеха и РНФ «Разговоры за жизнь» 1.

Михаил Гельфанд

— Позволю себе вспомнить две байки. Первая. Мы с Джимом Фиккетом, который был одним из отцов GenBank еще в Лос-Аламосе, где-то в конце 1990-х обсуждали, за что бы могли дать Нобелевскую премию в биоинформатике, и решили, что только за предсказание структуры белка по последовательности. Так кому давать-то? «Гуглу», который сделал AlphaFold2?

— Основа AlphaFold — это гигантские банки данных, т. е. гигантская библиотека. И заслуга AlphaFold — в том, что он блестяще с ними работает.

AlphaFold
AlphaFold

Программа на базе искусственного интеллекта, которая выполняет предсказания конечной пространственной структуры белка при его сворачивании.

AlphaFold имеет две основные версии. Команда исследователей, использовавшая AlphaFold 1, заняла первое место в декабре 2018 года в общем рейтинге 13-й СASP (Critical Assessment of protein Structure Prediction — критическая оценка предсказания белковых структур, масштабный эксперимент по предсказанию белковых структур, который устраивают раз в два года с 1994-го). Программа оказалась особенно успешной в предсказании точных структур белков в категории, которую организаторы конкурса оценивали как самую сложную, — когда для белков с частично похожей последовательностью не было доступно существующих шаблонных структур.

Команда разработчиков AlphaFold 2 участвовала в следующем конкурсе CASP в ноябре 2020 года и достигла гораздо большей точности, чем любая другая группа. Модель набрала более 90 баллов примерно для двух третей белков в тесте GDT, который измеряет степень, с которой структура, предсказанная вычислительной программой, подобна структуре, определенной лабораторным экспериментом (число 100 соответствует полному совпадению). Результаты AlphaFold 2 в CASP были охарактеризованы как «поразительные». В то же время некоторые исследователи отметили, что точность недостаточно высока для оставшейся трети прогнозов и что не раскрывается механизм и правила сворачивания белка, чтобы проблема сворачивания белка считалась решенной. 15 июля 2021 года статья об AlphaFold2 была размещена в Nature в качестве публикации для предварительного доступа вместе с программным обеспечением с открытым исходным кодом и доступной для поиска базой данных с различными видами белков.

8 мая 2024 года в Nature была размещена статья о новой версии программы — AlphaFold 3.

— Но предсказывает он хорошо?

— У меня есть претензии, о которых я скажу потом, если придется к слову… Но предсказывает он хорошо. Впрочем, к слову: древнеегипетские жрецы, с их гигантскими архивами, прекрасно предсказывали затмения солнца и луны, хотя считали землю плоской…

— А стали ли мы умнее?

— Вот именно, об этом и речь. AlphaFold — это 21 миллион подгоночных параметров…

— Как любая нейросеть.

— Как любая нейросеть… плюс 100 млрд бит (или байт) информации в банках белковых данных. А для предсказывания структур белков «по физике» нужно лишь примерно 50 тыс. параметров.

405-0047

— С другой стороны, «по физике» пытались предсказывать пятьдесят с лишним лет.

— Да, и не смогли.

— Когда я только-только пришел на работу в Институт белка и подумал, почему бы мне не заняться предсказанием вторичной структуры белков, мне старший Шахнович 3 сказал: «Миша, ну вы изобретете четырнадцатый алгоритм предсказания структуры». Прошло сорок лет (тогда старшему Шахновичу было лет тридцать, а младшему — лет пять), и прогресс был не очень большой.

— Не очень большой, потому что взятые из физики параметры не вполне точны. И с этими тысячами не вполне точных параметров пытались определить ту из триллионов возможных структур белковой цепи, что стабильнее всех остальных. А тысячи малых погрешностей всё портили… Поэтому так и получилось.

А.В. Финкельштейн (в центре) с сотрудниками лаборатории физики белка Института белка РАН (2016 год). protres.ru/unit/laboratoriya-fiziki-belka
А.В. Финкельштейн (в центре) с сотрудниками лаборатории физики белка Института белка РАН (2016 год). protres.ru/unit/laboratoriya-fiziki-belka

— Есть ли шанс, что параметры будут известны достаточно точно? Или это настолько плохо обусловленная задача, что бессмысленно и пытаться?

— Я думаю, что не бессмысленно пытаться, но это очень муторная задача. И после того, как был сделан алгоритм, так сказать, библиотечного предсказания, — уже не очень интересно.

— Потому что всех же интересует практическая польза?

— Ну да. Об этом я и говорю.

— И что, отдел физики белка в Институте белка можно закрывать за ненадобностью?

— В значительной степени да, потому что в физике белка было две задачи, которые первоначально считались одной. Первая задача: как белок вообще может свернуться за несколько минут, если для полного перебора нужен возраст жизни Вселенной или сто возрастов, или тысяча? Вторая задача: что получится после того, как белок свернется?

— То есть предсказание структуры.

— Так вот, оказалось, что задачи две. Сначала считалось, что если будет решено «как?», то и «что?» получится автоматически. Не получилось. Потому что задача «как он может свернуться?» была решена нами в конце 1990-х4. Но предсказания структуры из этого не получилось.

— Потому что это плохая задача. Результат очень неустойчив и зависит от небольших ошибок в параметрах.

— Да, предсказания структуры неустойчивы. А вот для того, чтобы понять, почему белок может свернуться за короткое время, точности параметров не нужно. Нужно просто понять, где примерно находится перевальная точка, «переходное состояние» на пути сворачивания структуры белка, примерно оценить его стабильность — и всё. Это очень просто делается. Наука сворачивания структуры белка, грубо говоря, на этом закончилась.

Коллаж из моделей белков и ферментов. Илл. Astrojan / «Википедия»
Коллаж из моделей белков и ферментов. Илл. Astrojan / «Википедия»

— Значит, «как?» поняли уже давно. А «что?» не поняли, но сделали.

— Да, вот не поняли, а сумели. AlphaFold сумел.

— Интересно, потому что в биологии есть два способа использовать нейросетки. Первый — когда интересуют результат. AlphaFold, медицинские сетки, которые предсказывают диагнозы…

— Там только результат важен.

— А с другой стороны, есть совершенно отдельная наука про интерпретируемые сетки, когда вас не очень интересует результат, вы предсказываете то, что проще померить непосредственно, но вас интересует, что она выучила по дороге. Мой любимый пример — когда по последовательности ДНК предсказывали открытость хроматина в разных клеточных линиях 5. А сетка выучила мотивы связывания факторов транскрипции: из первого слоя нейронов вынули весовые матрицы.

— Только из первого?

— Да, потому что первый слой — это весовые матрицы, а дальше уже всё нелинейное. А потом половина из них оказалась известными мотивами связывания транскрипционных факторов. Задним числом понятно почему: потому что места, в которых меняется открытость хроматина, — это регуляторные области, а это места, в которых много потенциальных сайтов. И можно полагать, что вторая половина — это мотивы для факторов, которых мы экспериментально еще не изучали.

— Забавно, не знал.

405-0044

— Было несколько такого сорта работ, но это, пожалуй, самая яркая и простая6.

А про белок можно переформулировать задачу так, чтобы из сетки вынимать что-то биологическое? Если мы не хотим закрывать отдел физики белка? Или Институт белка не хотим закрывать?

— Институт белка не только этим занимается.

— Ну, Институт белка еще и не только таким способом можно закрыть, это мы понимаем.

— Да, это тоже верно.

— Это отдельный сюжет…

Тем не менее, если пофантазировать, можно ли переформулировать какую-нибудь белковую задачу так, чтобы она, возможно, не имела практического очевидного выхода, а при этом сетка имела шанс выучить что-то интересное?

— Расплывчатый вопрос. И будет еще более расплывчатый ответ.

— Если бы у меня был конкретный вопрос, я бы уже пошел статью писать.

— Да, это я понимаю.

— Ну хорошо, расплывчатый ответ?

— Не расплывчатый: не знаю. Потому что не знаю, что можно выучить у AlphaFold еще.

— С библиотеками еще до сеток была похожая идеология. Вся наука про threading — это та же идея, у нас есть библиотека структур, и мы смотрим, какая лучше подходит под заданную аминокислотную последовательность.

— Совершенно верно. Более того, про пред-предка AlphaFold. Алёша Мурзин 7 на CASP2 или CASP3, не помню, сделал несколько очень хороших предсказаний структур белков 8 и рассказал, «как». Информация об этих структурах еще не была опубликована, но про них можно было вычитать между строк в журналах, сравнивая между собой разные статьи, и он это показал.

— А что там было между строк?

— Я уже не помню, все-таки это было тридцать лет назад. Главный тезис его доклада был в том, что в литературе содержится очень много всего. Там нет цифр, координат и т. д., но что на что похоже, там сказано, и если этим заняться и подумать, то можно предсказать структуру белка, которую никто не видел.

Ведь люди дают для предсказаний на CASP последовательность белка, структуру которого они уже знают, но еще не опубликовали, — но оказывается, что где-то они обмолвились (они или их коллеги), и это можно вытащить.

405-0046

— Хорошо, а чем тогда сейчас интересно заниматься?

— Чем я лично занимался последнее время? Я занимался белками-антифризами и белками-нуклеаторами льда. Антифризы настолько непохожи друг на друга при одной и той же функции… Они маленькие, они большие, они свернуты вправо, они свернуты влево, они не свернуты вообще, они альфа-спиральные, они бета-структурные — всё, что угодно. Сейчас мы готовим атлас по белкам-антифризам и белкам-нуклеаторам льда.

Белки-антифризы

Белки, связывающие лед (IBP), также называемые белками-антифризами (AFP), синтезируют различные организмы для выживания при отрицательных температурах. Эти белки впервые обнаружены в крови рыб, обитающих в арктических и антарктических водах, где температура падает до –2 °С.

Молекулярная биология, 2022, T. 56, № 2, стр. 343-352

— Но это пока зоология.

— Да.

— А можно ли по белку предсказать, будет ли он антифризом? По последовательности?

— Пока не пробовали. Не знаю.

— Откуда они берутся эволюционно? Они же обычно довольно молодые.

— Из чего угодно.

— Например?

— Ну один, по-видимому, произошел просто из случайного места в геноме.

— Как вы можете это доказать?

— Ничего гомологичного не видно.

— Он мог откуда-то прыгнуть. Олег Гусев изучает своего комара 9, который высыхает. У него есть белки, которые позволяют его личинке высыхать, а потом размачиваться. А у представителей того же рода, но не высыхающих, таких белков нет. Но известно, что они прыгнули из бактерий.

— Может быть. Нужно спросить Серёжу Гарбузинского 10, который этим занимался. По-моему, он увидел не кодирующую белок область генома, из которой ген антифриза произошел. По эволюции антифризов есть довольно много статей, которые меня не очень интересовали, поэтому Серёжа их читал, а я нет.

405-0048

— Что должно быть у белка, чтобы он стал антифризом? Это физический вопрос?

— Да. Считалось, что у него должна быть поверхность, покрытая треонинами.

— Почему именно треонинами?

— Не знаю. Почему серины (с такой же OH-группой) не годятся? Может быть, потому что серины для бета-структуры плохо подходят, а треонин, как и любой остаток с двумя тяжелыми гамма-атомами, очень хорош для бета-структуры.

— Вы сказали, что антифризы бывают альфа-структурными.

— Да. Там треонина нет или мало.

— То есть треониновые — это именно бета-структурные?

— В основном бета-структурные.

— Не любой же бета-структурный белок будет антифризом?

— Не любой, он должен быть покрыт кислородными атомами — в частности, из OH-групп треонинов, которые имитируют атомы льда, и это покрытие должно более или менее совпадать с ледяной решеткой.

— Но это же нужно и для нуклеакции…

— И для нуклеакции, и для антинуклеакции. Традиционно считается, что антифризы мешают росту льда. Но антифризы прежде всего мешают его нуклеации. Если взять воду и начать ее замораживать, при скольких градусах она замерзнет?

— Если не тревожить, довольно долго не замерзнет.

— Долго — это что?

— Не знаю.

— Экспериментально: если нет твердых поверхностей, на которых лед может конденсироваться, вода замерзает при –40 °C.

— Но вода куда-то налита, значит, какие-то поверхности есть.

— Минус 40 °C — это для аэрозоля или для капли воды в масле. Масло не может дать центр нуклеации, потому что оно не твердое, а жидкое и жирное. На твердой поверхности пробирки из пластика, в экспериментах, которые мы делали с Богданом Мельником 11, вода замерзает примерно при –10 °C; а на крупинках нуклеатора CuO — при –4 °C. Причем понижение температуры на десятую градуса дает ускорение нуклеации образования льда почти на порядок. Потому что это фазовый переход, а его нуклеация требует «правильного» налипания на «правильную» поверхность сразу многих молекул воды.

— Я не понимаю. Вы делаете дополнительный, хороший центр нуклеации с кислородами, которые расположены на правильных расстояниях друг от друга. Казалось бы, наоборот, лед будет сильнее образовываться.

— Лед будет образовываться, но еще сильнее эта штучка будет прилипать к той уже готовой твердой поверхности, что может нуклеировать лед. Кстати, антифризы могут нуклеировать лед, но для того, чтобы нуклеировать лед при температуре –5… —10 °C, нужна достаточно большая поверхность, нужна поверхность диаметром 20 нм примерно. Иначе ядрышко льда не образуется, поэтому маленькие антифризы работают только антифризами, т. е. прилипают на большие поверхности, которые могут нуклеировать лед.

— Просто экранируют?

— Да.

— А большие антифризы?

— Прекрасно нуклеируют лед — если нет тех поверхностей, к которым они могут еще сильнее прилипнуть.

— Почему они тогда антифризы, если они нуклеируют лед?

— Потому что они могут прилипать на те поверхности, что еще сильнее нуклеируют.

Алексей Финкельштейн
Алексей Финкельштейн

— Понял. Мне-то как раз всегда была интересна эволюция. Антифризы — один из двух примеров, которые я знаю, когда может очень резко поменяться функция белка. Они перестали быть ферментами, теперь они только антифризы, а второй пример — это кристаллины глаза.

— С ними не работал.

— Их много разных, они независимо становились кристаллинами, понятно, за счет чего. Нужно, чтобы белок образовывал прозрачный упругий кристалл. Если он так может, то неважно совершенно, что он делал раньше.

— Я знаю бета-структурные кристаллины, но, по-моему, есть и другие.

— Белков, у которых функция ферментативная — грубо говоря, химическая, — сколько угодно разных. А если взять такие, у которых интересная физическая функция, может быть такое, что они чаще бета-структурные, чем альфа-, и нет ли в этом закона природы?

— Не думаю. На физике прекрасно без всяких альфа- и бета-структур работают коллагены, правда?

— Да, фибриллярные белки все работают на физике.

— Мембранные белки тоже особая история, они в основном спиральные, хотя и не обязательно, конечно. Есть и бета-цилиндры.

— Согласился. Хорошо, фибриллярные и мембранные отдельно, а теперь глобулярные белки, которые работают на физике. Не связано ли это как-нибудь с тем, что бета-лист — нелокальная структура?

— Не готов ответить сразу.

— Это разумный вопрос?

— Вскрытие покажет. Пока нет ответа, непонятно, разумный вопрос или нет.

— Ну почему? Бывают вопросы, про которые сразу понятно, что они неразумные.

— Нет, вопрос разумный, но ответа совершенно нет. Антифризы работают на физике, но в данном случае речь идет о больших поверхностях. Это может иметь отношение к бета-структуре, но опять-таки большие антифризы могут работать и как нуклеаторы льда. С нуклеаторами дело обстоит хуже, потому что нуклеаторы льда — это большие белки, структуры которых в основном не расшифрованы. Но AlphaFold дает возможность их увидеть.

— Мы верим в этом месте AlphaFold, даже если это белок, которого не было в той самой вавилонской библиотеке, которую он хранит внутри себя? Ваша же критика AlphaFold состоит в том, что он просто знает очень много примеров.

— Он знает очень много примеров, он знает очень много деталей и может состыковывать их, а вот детали зависят от физики, это точно.

— Как белок сворачивается правильно?

— Парадокс Левинталя понятен?

— Давайте мы его все-таки обсудим, потому что это кто-то будет читать. Чтобы мне потом не писать примечания на полстраницы.

— Если считать, что каждый аминокислотный остаток имеет три конформации — альфа-, бета- и еще какую-то, — то белок из ста аминокислотных остатков имеет 3100 конформаций, что превосходит любое нормальное число, и их перебор занимает много больше времени, чем время жизни Вселенной.

— Таким рассуждением креационисты объясняют, что Бог всё создал, потому что случайным перебором аминокислот вы никогда не сделаете разумного белка.

— Ну примерно. Только сюда креационисты еще не забредали — иначе они вынудили бы Бога сворачивать каждый белок, причем не только в каждой живой клетке, но и в каждой пробирке каждой биолаборатории… Однако, поскольку белок может не только спонтанно сворачиваться, но и разворачиваться (при небольшом изменении среды), то всегда существует аналогичный вопрос, который почему-то никто не задавал, для спонтанного разворачивания белка. Так вот, через разворачивание белка гораздо проще оценить время его сворачивания, потому что смотришь — и сразу видишь, где находится бутылочное горло разворачивания. Есть свернутый белок, теперь он разворачивается. Это можно проще всего представить себе следующим образом. Половина белка расплавилась, развернулась, половина осталась как была. И тогда оказывается, что время — или, точнее, самая высокая свободная энергия на пути разворачивания — зависит от поверхности раздела между свернутой и развернутой частью. А эта поверхность раздела зависит уже не от числа аминокислотных остатков в белковой цепи, а от числа остатков в степени 2/3…

Я боюсь, что закопался в такую математику, которую никто не поймет…

— Ничего-ничего, хорошо.

— Если белок должен перебирать 3100 степени конформаций, это очень долго. Вселенная и так далее. А если белок должен перебирать 31002/3, то это всего порядка 320, и это уже вполне укладывается в минуту. 80 порядков величины тройки, т. е. порядка 1038, на переходе от объемов к поверхности теряется.

— Сворачивание-разворачивание белка проходит по одному пути? Просто как фильм, который прокручен назад?

— Да, потому что у белка есть точка динамического равновесия между свернутым и развернутым состояниями. А в физике есть принцип детального равновесия, который показывает, что если при одних и тех же внешних условиях пути «туда» и «обратно» идут по-разному, то получается вечный двигатель второго рода. Сюда идет так, обратно идет так — получается круг, вечный двигатель второго рода, с чем и поздравляю.

— Была наука про то, что можно объяснить быстрое сворачивание тем, что перебора конформаций не происходит, а сначала сворачиваются маленькие кусочки, а потом уже комбинируются после того, как их зафиксировали. Это не работает?

— Над этим работали очень много. Убедительного ответа нет — если не полагать, что свернутое состояние белка много-много стабильнее развернутого. А это не так.

— В каком смысле нет убедительного ответа?

— Чтобы можно было не на пальцах, но на формулах показать, что это действительно сработает. Тут есть ведь вот какая вещь. Белок может сворачиваться и разворачиваться, причем существуют экспериментально определенные много раз во многих белках точки динамического равновесия, где белок сворачивается и разворачивается с одной скоростью — задача решается проще всего. Но сворачивание белка, который находится не в равновесии, всего в сто раз или в тысячу раз быстрее, чем белка, который находится в равновесии. Но поскольку нам нужно бороться с не менее, чем 20-ю порядками величины, эти три порядка просто ничего не дают. Есть способы, чтобы ускорить сворачивание белка, но не в 1040 или 1020 раз, а всего в 102, в лучшем случае в 105. И всё.

— Значит, про сворачивание мы понимаем, про структуры мы понимаем, и нам осталось теперь исследовать механизмы работы разных интересных функциональных групп белков? Континенты открыты, теперь давайте острова перепишем, и география закончится?

— Примерно так, да.

— Раз так, имеет ли смысл человеку, который начинает чем-то заниматься, вообще заниматься белками, если это «сделанная наука», или надо что-то другое?

— Я понимаю, этот вопрос меня тоже волнует. Романтический период в изучении сворачивания белка кончился точно. Что люди еще надумают, какую задачу? Не знаю.

Почему, в частности, я занялся антифризами? Я занимался вообще образованием структур — структур белков, структур с белками и структур из белков. Так вот, исследование белковых агрегатов только начинается.

— Прионы?

— В частности, прионы. Я буду говорить амилоиды, потому что амилоиды — это более широкое понятие; прионы — это те амилоиды, очень вредные, которые образуются очень-очень медленно. Образование амилоидов — это тот же самый фазовый переход. Слипаются пептиды небольшой величины, много их слипается. Но для того, чтобы они слиплись, нужна нуклеакция. Нуклеация бывает первичная и вторичная. Первичная — это значит, что они выстраиваются друг за другом в цепочку. А вторичная — это когда уже образовавшийся амилоид начинает ветвиться. Медленная стадия в фазовом переходе — это нуклеация. И она бывает и для одномерной системы, когда она растет. А бывает, когда вбок уходит, зародившись на уже готовой нити.

— И тогда это быстрее.

— В зависимости от соотношения параметров скорости нуклеации. Иногда быстрее, а иногда очень медленно.

— Начинает ветвиться медленно, но когда у тебя уже много веточек, у них много концов, на которых можно дальше ветвиться. Это как цепная реакция, вполне может быть и экспоненциально.

— Это очень похоже на цепную реакцию, совершенно верно. И так же, как цепная реакция, может начаться в любом месте. Если следить за одним атомом урана, он будет распадаться, грубо говоря, за время жизни Вселенной, но когда их очень много, один из них распадется за секунду, осколки ударят другого-третьего, тогда и рванет.

Алексей Финкельштейн
Алексей Финкельштейн

Примерно то же самое с любым зародышем кристаллизации. Вот капля, пока она маленькая, она не растет, она распадается, потому что большая площадь поверхности и маленький объем. Но вот она доросла до момента, когда новый прибавленный атом делает ее стабильной. И вот тут-то всё пошло.

— Доросла случайным образом. Какой-то повезло — и она не успела распасться.

— Да, но это именно какой-то повезло, а не потому, что она была такая хорошая.

— Так остались аспиранты? Я имею в виду здесь и сейчас.

— У нас в лаборатории одна аспирантка есть, у Богдана Мельника — другая, которая как будто бы не собирается уезжать.

— Одна-две аспирантки на отдел — это немного. Это был структурный дефект в идее Академгородка, что так получилось?

— Какой?

— Что нет аспирантов.

— То они есть, то их нет. В биоинформатику аспиранты идут гораздо больше, чем в физику белка. Они, видимо, тоже почувствовали, что с физикой белка романтическая стадия окончилась, а что дальше делать?

— В биоинформатике романтической стадии никогда не было. Биоинформатика — это вообще не наука.

— С моей точки зрения, все-таки наука.

— Биоинформатика — это набор инструментов. Все задачи в биоинформатике вырастают либо из функциональной биологии, либо из эволюции, которая тоже биология. В функциональной биоинформатике задачи прикладные: «Что делает белок?» Ты правильно предсказал, ты молодец, всё. Как ты это делал, никого не касается.

— Да.

— Фундаментальная биоинформатика — это молекулярная эволюция. Но романтического периода там, кажется, не было, были важные методические продвижения.

— Просто рынок труда. На что ориентируются молодые люди? В пропорции девяносто девять к одному. На то, чем они потом будут заниматься, где могут быть потом востребованы.

— Все-таки от Пущино у меня ощущение, что это город, в котором есть институты, но нет университета…

— Неправильный город?

— Несамоподдерживаемый 12.

— Да.

— Его можно заселить сначала молодыми людьми — и будет романтика, новостройки, новые институты. А потом… В России, наверное, единственный хороший пример — в Новосибирске.

— Да, это хороший пример. Сюда же относится Дубна.

— Дубна, во-первых, международная. А во-вторых, университета там не было. Точнее, есть какой-то университет 13, но он не очень понятный.

— Не то университет, не то филиал, я не помню.

— Его-то как раз сделали… Он совсем молодой. А почему в Пущино не удалось университета сделать?

— В Пущино есть какой-то университет…

— Вот именно, что какой-то.

— Недоразвитый.

— А почему не получилось?

— Не знаю.

— Слишком близко Москва?

— Не знаю. Может быть, но не знаю. Или нет в Пущино «не-естественных наук»?

— Ну хорошо, а что тогда здесь через двадцать лет будет? Я понимаю, про все остальные места тоже можно задать такой вопрос. Но в предположении отсутствия катаклизмов. Если business as usual.

— Как известно, лучшее предсказание звучит так: то же, что и сейчас.

— Это вторая байка, которую я хотел вспомнить. Тост Алексея Витальевича Финкельштейна на банкете по случаю защиты докторской диссертации Андрея Александровича Миронова 14. Как известно, Алексей Витальевич был оппонентом Андрея Александровича.

— Да, это я помню.

— Дружеская критика биоинформатики, но с известной долей сарказма, состояла в том, что вся ваша биоинформатика — это предсказание по похожести на уже известное. Это функция белка по гомологии.

— Возможно, не помню.

— Я очень хорошо помню. Я студентам рассказываю каждый раз. В качестве иллюстрации была приведена история про то, как во время Манхэттенского проекта, как раз в Лос-Аламосе, который упоминался в первой байке, скучающие физики развлекались тем, что предсказывали, что будет происходить на театре военных действий в Европе.

— Я помню.

— И выигрывал у всех, если я правильно помню, Ферми.

— Да.

— Который предсказывал, что будет то же самое, что происходит сегодня.

— То же самое. Все выдающиеся события проморгал.

— Но выиграл.

— Но по сумме выиграл.

— Ну, это как синоптик, который будет завтра предсказывать сегодняшнюю погоду…

— Примерно так, да. В пустыне это особенно хорошо.

— …и будет самым успешным.

— Это зависит от того, в чем меряется его успех.

— Но теперь у меня есть контрпримеры. За это время накопились.

— Давайте.

— Ну, например, РНК-переключатели. Они случились через пару лет после этого. Это регуляторные РНК-структуры, которые принимают разную конформацию, в зависимости от непосредственного связывания с малым лигандом. И одна конформация позволяет экспрессию гена, а другая не позволяет — образуется терминатор. Это придумал мой аспирант Лёша Витрещак в 2002 году, просто сравнивая последовательности. Ни одного известного примера такой штуки не было.

— Здо́рово!

— Сами консервативные структуры мы с Мироновым увидели за несколько лет до этого, поняли, что они связаны с регуляцией, но без механизма. Наш биологический соавтор, который эту задачу нам принес, Юрий Иванович Козлов из ГосНИИГенетика, с которым Миронов работал, заставил нас в конце статьи 15 написать, что, возможно, там участвует прямое связывание лиганда. Мы говорили, что это ниоткуда не следует, зачем мы это будем писать? Но он уговорил.

— Молодец.

— Он очень долго искал фактор транскрипции, который регулирует конкретные гены. И убедился генетически, что никакого белка там нет. Но если нет белка, то остается малый лиганд. А что аптамеры бывают, люди уже знали, и он предположил, что это может быть такой природный аптамер. А механизм придумал Лёша Витрещак, только сравнивая последовательности, больше ничего.

— Это я не знал.

— А вторая история из нашей жизни — это когда другой молодой человек, Дима Родионов, придумал, что есть транспортные белки, которые могут работать и как АТФ-зависимые, и как вторичные транспортеры.

— Вторичные — это что?

— Запускает одну молекулу против градиента, а за это выпускает две молекулы по градиенту. Было два разных мира — были АТФ-зависимые транспортеры, а были вторичные, с принципиально разным механизмом. Он придумал, опять-таки, разглядывая последовательности: какие гены как регулируются (предсказано), какие находятся рядом, — что есть такие вторичные транспортеры, которые в одних бактериях работают сами, а в других бактериях, такой же точно, гомологичный белок образует комплекс с АТФ-азой и работает как АТФ-зависимый. И, более того (что тоже он придумал), эта АТФ-аза может быть одна на несколько разных транспортеров с разной специфичностью. В геноме закодированы несколько вторичных транспортеров, которые могут работать сами, и универсальная АТФ-аза, которая превращает вторичный транспортер в более эффективный АТФ-зависимый.

— А, она садится на этот транспортер. Но всё равно с точки зрения энергетики это одно и то же.

— Это разная химия. Гидролиз АТФ как источник энергии и пропускание иона по градиенту. Энергия, может быть, по величине одна и та же, но механизм совершенно разный…

Возвращаясь к вашим словам: а почему неинтересно думать про эволюцию?

— Почему неинтересно?

— Это вы сказали, что не думаете про эволюцию, а Гарбузинский думает.

— В этой работе я думал про фазовые переходы. Гарбузинский биолог по образованию, он читает статьи про эволюцию.

— Я математик по образованию, я тоже читаю статьи про эволюцию. Слушайте, кто там кем был по образованию полвека назад…

— По образованию — это значит по душевному настрою. В данном случае. Не то, что мне неинтересно читать статьи про эволюцию… не статьи, скорее обзоры.

— Завершающий вопрос. Чем сейчас в биологии интересно заниматься? Если выйти за пределы физики белка?

— Всегда интересно заниматься раком, потому что это гадкая болезнь.

— Или диабетом?

— Или диабетом. Но раком все-таки как-то романтичнее… А еще — программируемым старением. Зачем оно нужно? Непонятно. И как от него избавиться, тоже непонятно.

— Может быть, оно непрограммируемое и не нужно низачем, а просто оно есть.

— Может быть. Лучше было бы нужно зачем-то, потому что тогда можно было бы вмешиваться. А если оно просто, грубо говоря, энтропийно получается… По-моему, этим интересно заниматься. Но как? Не знаю. А еще — перенесением памяти из мозга в компьютер и обратно. Но как? Не знаю совершенно.

Фото Тимура Сабирова


1 read.skoltech.ru

2 См. врезку ниже.

3 Евгений Исаакиевич Шахнович — профессор Гарвардского университета. Эмигрировал в США в 1990 году, до этого работал в лаборатории физики белка Института белка РАН под руководством Олега Борисовича Птицина (chemistry.harvard.edu/people/eugene-i-shakhnovich). Борис Евгеньевич Шахнович — биоинформатик, выпускник Бостонского университета.

4 Finkelstein A.V., Badretdinov A.Ya. Rate of protein folding near the point of thermodynamic equilibrium between the coil and the most stable chain fold. Folding & Design, 1997, 2:115-121

5 Клональная популяция клеток, происходящих от одной предковой клетки.

6 genome.cshlp.org/content/early/2016/05/03/gr.200535.115.abstract

7 Алексей Мурзин — сотрудник Лаборатории молекулярной биологии Медицинского исследовательского совета (Кембридж, Великобритания) с 1991 года; до этого работал в лаборатории физики белка Института белка РАН; создатель базы данных белковых структур SCOP (www2.mrc-lmb.cam.ac.uk/research/past-group-leaders/alexey-murzin/).

8 Murzin A. G., Bateman A. Distant homology recognition using structural classification of proteins // Proteins, 1997, Volume 29, Issue S1.

9 Гельфанд М. Биология суперспособностей: как нигерийские комары сделали ПЦР-тест на Covid-19 доступнее. «Разговор за жизнь» с биологом Олегом Гусевым // Naked Science, 28.07.2022 naked-science.ru/article/interview/biologiya-supersposobnostej

10 Сергей Александрович Гарбузинский — сотрудник лаборатории физики белка Института белка РАН.

11 Богдан Степанович Мельник — руководитель группы спектроскопии белка Института белка РАН (protres.ru/unit/gruppa-spektroskopii-belka).

12 Материалы ТрВ-Наука, посвященные перипетиям научной и политической жизни Пущино: trv-science.ru/tag/pushhino/

13 uni-dubna.ru

14 Андрей Александрович Миронов — профессор факультета биоинженерии и биоинформатики МГУ: istina.msu.ru/workers/377586/

15 cell.com/trends/genetics/abstract/S0168-9525(99)01856-9

ИСТОЧНИК: Троицкий вариант https://www.trv-science.ru/2024/06/fazovyj-perehod-v-issledovaniyah-belka/

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *