Исследователи пытаются сократить «генетический код» с 20 до 19 аминокислот

генетический код ии рибосома аминокислоты E. Coli arstechnica.com

Используя инструменты ИИ, команда переработала часть рибосомы, чтобы ей требовалась на одну аминокислоту меньше, пытаясь сократить генетический код с 20 до 19 аминокислот. — arstechnica.com

Генетический код лежит в основе жизни. С незначительными вариациями всё живое использует одни и те же наборы из трех ДНК-оснований для кодирования тех же 20 аминокислот. Мы не обнаружили крупных исключений из этого правила, что заставило исследователей прийти к выводу, что этот код, вероятно, восходит к последнему общему предку всего живого на Земле. Однако существует множество обоснованных предположений о том, как этот генетический код развивался изначально.

Большинство гипотез предполагает, что ранние формы жизни имели частичные генетические коды и использовали менее 20 аминокислот. Чтобы проверить эти гипотезы, команда из Колумбийского университета и Гарварда решила выяснить, могут ли они избавиться от одной из 20 используемых в настоящее время аминокислот. И в качестве первой попытки они сконструировали часть рибосомы, которая могла работать без использования другой, ранее необходимой аминокислоты: изолейцина.

Изменение кода

Во-первых, зачем это делать? Большая часть работы в этой области была сосредоточена на изменении генетического кода способами, которые полезны, например, на использовании более чем 20 аминокислот для обеспечения интересной химии.

Причина этого, по-видимому, заключается в том, что до последнего общего предка жизни на Земле организмы экспериментировали с различными генетическими кодами и, вероятно, использовали смесь белков и каталитических РНК для поддержания своего метаболизма. Хотя мы провели много исследований каталитических РНК, у нас гораздо меньше представлений о том, какая химия возможна с сокращенным генетическим кодом. И, как предполагают исследователи, инструменты на основе ИИ созрели настолько, что перепроектирование белков для использования меньшего количества аминокислот стало гораздо более реалистичным, чем всего несколько лет назад.

Изолейцин — одна из трех очень похожих аминокислот, наряду с лейцином и валином. В той части структуры, которая отличается от других аминокислот, все три имеют разветвленную структуру, состоящую исключительно из углерода и водорода. Это делает их все гидрофобными, и они часто располагаются внутри белков, что удерживает их от водной среды клетки. Таким образом, чисто логически, одна из этих трех аминокислот кажется хорошим кандидатом для устранения.

,

Исследователи подкрепили эту логику доказательствами. Они провели анализ генома E. coli, проверяя, какие аминокислоты были заменены другими в родственных белках из других видов. Изолейцин оказался аминокислотой, которую чаще всего заменяли другой. Поэтому исследователи решили начать отвечать на вопрос, действительно ли она нам нужна.

Редактирование всех примерно 4500 генов в E. coli было бы монументальной задачей, и такое количество изменений одновременно почти наверняка привело бы к гибели клетки, поэтому исследователи начали с гораздо меньших тестов. Для начала они взяли набор из 36 жизненно важных генов и заменили каждый изолейцин в них на валин, похожую аминокислоту, а затем вернули введенный ген в геном. Для 22 генов это привело к гибели клеток. Но это показывает, что 17 из них обошлись без изолейцина, включая один, где он был заменен в 45 различных положениях вдоль аминокислотной цепи.

Примечательно, что даже в тех случаях, когда клетки терпели изменения, их рост часто замедлялся по сравнению с нередактированными клетками. Это станет повторяющейся темой.

Перепроектирование рибосомы

Чтобы сосредоточить свой проект, исследователи решили начать конструирование рибосомы, свободной от изолейцина. Рибосома — это большой комплекс белков и РНК, который транслирует матричные РНК в белки — можно представить ее как нечто вроде аппаратного компонента, необходимого для загрузки живой клетки из генома. Очевидно, что многие белки в рибосоме обладают критически важными ферментативными активностями. Но сборка этого комплекса требует, чтобы эти белки взаимодействовали друг с другом и с РНК. Таким образом, рибосома представляет собой очень строгий тест на то, могут ли клетки переносить конструирование аминокислоты без нее.

,

В качестве предварительного теста команда провела замену изолейцина на валин для 50 различных отдельных генов, которые кодируют белки для рибосомы. Восемнадцать из них работали без видимых проблем, еще 19 росли медленнее, а изменения оказались летальными для оставшихся 13 генов. Затем команда сосредоточилась на 32 генах с пониженной приспособленностью и адаптировала программное обеспечение для проектирования белков на основе глубокого обучения, чтобы предложить альтернативные последовательности, не содержащие изолейцина.

Итеративное тестирование с использованием четырех различных программных пакетов позволило получить альтернативные последовательности белков для 25 из этих 32 белков, которые устранили проблемы с приспособленностью.

Для оставшихся пяти они вернулись и форсировали изменения в изолейцине. Затем они позволили программному обеспечению разработать изменения в аминокислотах, которые физически близки к нему в трехмерной структуре белка, с идеей, что изменение аминокислоты может нарушить структуру белка таким образом, что другие изменения в соседних аминокислотах смогут это компенсировать. Это привело к успешному перепроектированию четырех из пяти проблемных белков.

Хотя это впечатляющие достижения, тестирование их по отдельности не дает полной картины того, могут ли эти перепроектированные белки собрать функционально эквивалентную рибосому. Для этого исследователи решили удалить изолейцин из всех белков малой субъединицы рибосомы. Это в основном вопрос удобства. Гены 21 белка малой субъединицы сгруппированы рядом друг с другом на участке генома длиной 10 000 оснований, поэтому исследователи смогли заменить их все одновременно.

Мысля мало

Используя перепроектированные белки из предыдущих работ, они начали заменять все большие участки генов вдоль этого 10 000-основного участка ДНК. Начиная с одной стороны, они заменили 10 генов без каких-либо проблем. К тому времени, когда они заменили 17 из 21, клетки начали расти медленнее. Однако замена 18 генов одновременно привела к полной гибели клеток.

,

Поэтому они начали работать с другой стороны и обнаружили, что изменения переносятся до тех пор, пока они не достигнут того же гена, который был определен как проблемный при движении с другой стороны. Этот ген, называемый rplW, кажется критическим препятствием. Замена 20 из 21 гена и оставление rplW без изменений привели к выживанию клеток, которые не только выжили, но и росли со скоростью около 70 процентов от скорости необработанной клетки E. coli.

Поэтому они внимательно изучили изменения, предложенные программным обеспечением для rplW. Оказалось, что программное обеспечение компенсировало изменения изолейцинов, удалив некоторые небольшие участки аминокислот поблизости. Хотя это, по-видимому, сработало для получения функционального белка, оно отличалось настолько, что не могло работать в сочетании со всеми другими изменениями.

В этот момент команда просто решила проблему методом перебора. Они попросили программные пакеты предложить ряд альтернативных аминокислот для каждой из четырех позиций изолейцина в rplW и протестировали каждую возможную комбинацию из них (всего 16 вариантов дизайна). Один из этих вариантов дизайна позволил завершить сборку малую субъединицу без изолейцина, при этом полученный штамм рос примерно на 60 процентов от скорости необработанных клеток. Клетки выращивали в течение 400 поколений и обычно приобретали 20–30 мутаций, но ни одна из них не восстановила изолейцин ни в одном из рибосомных белков.

Примечательно, что если просто вернуть эту версию rplW в геном саму по себе, клетки погибают. Она переносится только в контексте всех остальных изменений в рибосоме, вызванных другими перепроектированными белками.

Несколько слов об использовании ИИ

Неясно, было бы что-либо из этого возможным без активного использования инструментов ИИ. Все инструменты для дизайна белков были основаны на ИИ, а их результаты проверялись с помощью AlphaFold 2, отмеченного Нобелевской премией программного обеспечения ИИ для определения структуры белков. Авторы статьи выделяют ряд случаев, когда программное обеспечение ИИ давало предложения, от которых большинство биологов уклонились бы. К ним относятся замена структурно гибкого, нейтрального изолейцина на заряженную аминокислоту или на аминокислоту, зафиксированную в жесткой структуре.

,

Тем не менее, результаты также показывают пределы работы с текущими моделями ИИ, в основном потому, что, в отличие от человека, они не могут по-настоящему объяснить процесс, посредством которого они принимают решения. Например, некоторые модели давали очень разные предложения друг от друга, что, по словам исследователей, подразумевает, что они исследуют разные области пространства возможных последовательностей. Но мы на самом деле не знаем, так ли это, или у каждой модели были математические причины не одобрять предложения другой.

Это один из ряда случаев в статье, когда исследователи пытались рассуждать о том, что делает модель, основываясь на ее выходе. По крайней мере, в одном случае программное обеспечение перепроектировало весь структурный элемент (альфа-спираль), в котором находился измененный изолейцин, по причинам, которые они даже не пытаются угадать.

Это хорошее напоминание о том, что в настоящее время эти программные пакеты являются инструментами: они позволяют нам делать то, что иначе было бы невозможно, но они на самом деле не помогают нам понять многое. Нам все еще приходится рассуждать о явлениях, используя нейронные сети внутри наших черепов.

Так не обязательно должно быть; мы могли бы уделить больше внимания раскрытию внутренней работы этого программного обеспечения при его разработке, чтобы получить некоторое представление о процессе принятия им решений. Но на данный момент, я думаю, акцент делался (вполне разумно) на получении чего-то, что работает.

Удивительное достижение, но полезно ли оно?

В целом, это поразительная работа. Эти белки должны взаимодействовать друг с другом, взаимодействовать с рибосомными РНК, транспортными РНК, матричными РНК, растущими белками, которые производит рибосома, — плюс все обычные белки на большой субъединице. Каждая из этих систем эволюционировала в течение миллиардов лет, чтобы научиться работать друг с другом. Тот факт, что мы смогли внести такие радикальные изменения в систему за пару лет, просто ошеломляет.

,

Мы до сих пор не знаем, что замедляет эти клетки в данный момент. Возможно, измененная рибосома менее точна, производя больше дефектных белков из-за более частых ошибок при сборке аминокислотных цепей. Или она может быть каталитически медленнее, становясь узким местом для роста клетки. Это то, что мы, безусловно, могли бы проверить, и предоставление штамму времени для эволюции может немного восстановить его скорость роста.

Можем ли мы использовать это в качестве отправной точки для создания генома без изолейцина? Я бы оценил это как все еще находящееся в категории «может быть». В клетке есть много других крупных белковых комплексов, и могут быть те, с которыми инструменты ИИ справятся с трудом. Посмотрим, хватит ли у этих лабораторий времени и финансирования, чтобы продолжить этот путь. Тем не менее, я скептически отношусь к тому, что это даст нам много информации о жизни до универсального общего предка, учитывая, как сильно изменилось все остальное в клетке за это время.

Однако это может оказаться полезным в этом отношении, поскольку может вдохновить других ученых на размышления об экспериментах, которые могут дать нам лучшее представление о том, как могут выглядеть клетки с ограниченным генетическим кодом.

Science, 2026. DOI: 10.1126/science.aeb5171  (Обзор DOI).

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: