Похоже, да не одно и то же

07.10.2013 • Вера Башмакова • Биология • 1 комментарий

Генетический код кодирует аминокислотную последовательность белков с помощью нуклеотидной последовательности нуклеиновых кислот. Нуклеотидов всего четыре, а аминокислот — двадцать. Если бы каждая аминокислота кодировалась одним нуклеотидом, то закодировать можно было бы всего 4 аминокислоты. Если бы двумя нуклеотидами, то закодировать можно было бы только 16 аминокислот. Поэтому, чтобы можно было закодировать все необходимые аминокислоты, каждая аминокислота кодируется сочетанием трех нуклеотидов, которое называется триплетом или кодоном.

Однако триплетов может быть 64, а аминокислот всего 20 (плюс стоп-кодон). Поэтому в генетическом коде возникает избыточность — ситуация, когда одну аминокислоту может кодировать несколько разных триплетов.

Задача

Как вы думаете, для чего эта избыточность может использоваться, какие дополнительные плюсы она дает?

Подсказка

Чем больше существует правильных вариантов написания слова, тем меньше вероятность ошибки.

Решение

Самым первым и очевидным ответом на данный вопрос является слово «стабильность». Если на одну аминокислоту приходится несколько похожих между собой триплетов, значит уменьшается вероятность того, что при точечной мутации в данном триплете мы получим в белке неправильную аминокислоту. Поэтому большинство кодонов, кодирующих одинаковую аминокислоту, отличается друг от друга всего лишь на одну нуклеотидную «букву». Чем больше кодонов кодирует данную аминокислоту, тем выше ее стабильность; поэтому самым большим количеством кодонов кодируются наиболее часто встречающиеся аминокислоты, например лейцин и аргинин; редкие же аминокислоты, например триптофан, наоборот, кодируются одним-единственным кодоном.

Сложно понять, что тут причина, а что следствие: то ли наиболее нужные аминокислоты стали кодироваться большим количеством кодонов (то есть потребность в стабильности привела к этой самой стабильности), то ли, наоборот, чем больше кодонов было у аминокислоты (то есть чем стабильней она была), тем чаще стала встречаться. Очевидно, ответ на этот фундаментальный вопрос сродни ответу на вопрос «что было раньше — курица или яйцо?» и уходит корнями в те доисторические и трудноисследуемые времена, когда только возник и оптимизировался генетический код.

Кроме того, глядя на распределение частоты аминокислот (рис. 1), можно заметить, что, в общем и целом, чем проще по структуре аминокислота, тем чаще она встречается (например, тот же триптофан, имеющий одну из самых «сложносочиненных» структур, встречается реже всего). Это тоже понятно, поскольку простая структура, как правило, означает стабильность; «простую» аминокислоту легче синтезировать и труднее «испортить», чем «сложную».

Рис. 1. Частота встречаемости аминокислот в белках. Изображение с сайта web.expasy.org

Однако стабильность и устойчивость к мутациям — это не единственная польза от избыточности генетического кода. Играя с альтернативными кодонами, можно тонко регулировать различные параметры, связанные с работой нуклеиновых кислот. И прежде всего тут нужно упомянуть так называемый «перекос по кодонам» (Codon usage bias).

«Перекос по кодонам» — это ситуация, при которой из нескольких синонимичных кодонов в данном организме отдается предпочтение только одному или двум (рис. 2). Хотя многократно было показано, что для многих организмов такой перекос — обычная ситуация, отчего он происходит, до сих пор толком неясно. Наиболее принятое в научном сообществе объяснение для этого загадочного явления состоит в следующем.

Рис. 2. «Перекос по кодонам» для пятидесяти произвольно выбранных генов различных организмов. Гены располагаются по строчкам, а кодоны — по столбцам; стоп-кодоны, а также кодоны для метионина и триптофана (для которых синонимичных кодонов просто нет) не показаны. Чем чаще используется данный кодон относительно синонимичных кодонов, тем краснее соответствующий участок на схеме. Слева показаны кодоны, которые заканчиваются на G или C, а справа — на A или Т. (Поскольку G и C связаны друг с другом тремя водородными связями, а не двумя, как A и T, то заканчивающиеся на них кодоны более «тугоплавкие», то есть образуемые ими связи тяжелее разрываются). Видно, что некоторые организмы предпочитают кодоны, заканчивающиеся на G или C, а другие, наоборот, на A или Т. У человека же в разных генах отдается предпочтение разным кодонам. Изображение из обзора Joshua B. Plotkin, Grzegorz Kudla, 2011. Synonymous but not the same: the causes and consequences of codon bias

Как известно, каждому кодирующему аминокислоту кодону соответствует своя тРНК. У некоторых организмов есть что-то вроде тРНК-«любимчиков», то есть тРНК для одного из синонимичных кодонов гораздо больше, чем для остальных. Если мы хотим, чтобы данный белок синтезировался быстро и правильно, нам лучше не экспериментировать с редкими кодонами, а собрать его последовательность из самых «попсовых» кодонов, тРНК для которых с большей вероятностью будут проплывать мимо рибосомы и не задержат трансляцию.

«Перекос» по различным тРНК наблюдается прежде всего у быстрорастущих организмов, которые нуждаются в «промышленном» синтезе определенных белков. Причем перекос по кодонам наблюдается прежде всего для белков, экспрессирующихся на высоком уровне, то есть для тех, для которых скорость и качество синтеза особенно важны. При этом природа возникновения перекоса по тРНК до конца не ясна, и что возникло раньше — перекос по кодонам или перекос по тРНК, также совершенно непонятно.

Однако, несмотря на всё изящество, данное объяснение можно подвергнуть справедливой критике. Дело в том, что уровень трансляции белка определяется прежде всего на стадии инициации (когда мРНК только садится на рибосому), а не элонгации (когда к белковой цепи присоединяются новые аминокислоты). А раз элонгация — это не лимитирующая стадия белкового синтеза, то возня с подбором сотен оптимальных кодонов для ее ускорения кажется не совсем оправданной.

Другая версия существования перекоса связана со вторичными структурами, образуемыми мРНК. Комплементарные области мРНК сворачиваются в участки двойной спирали — шпильки. Иногда эти шпильки играют важную роль в регулировке различных внутриклеточных процессов (подробней об этом рассказано в задаче «Форма и содержание»). Однако в общем и целом такие шпильки сильно отравляют существование аппарату белкового синтеза и замедляют трансляцию. Причем легко догадаться, что шпильки, богатые GC-парами (гуанин-цитозиновыми парами), будут держаться друг за друга крепче и расплетаться хуже, чем AU (аденин-урацил) богатые шпильки (потому что гуанин и цитозин связаны друг с другом тремя водородными связями, а аденин и урацил — всего двумя).

Поэтому возможной причиной предпочтения определенных кодонов является такая оптимизация мРНК, при которой на ней будет образовываться как можно меньше шпилек (или, возможно, будут образовываться нужные шпильки в стратегических местах). Особенно важно, чтобы остался «бесшпилечным» участок, кодирующий начало белка, возле которого происходит инициация трансляции, поскольку нарушения в инициации губительны для трансляции в целом (см. об этом совсем свежую статью Daniel B. Goodman, George M. Church, Sriram Kosuri, 2013. Causes and Effects of N-Terminal Codon Bias in Bacterial Genes).

Еще одна загадка перекоса по кодонам связана с тем, что в некоторых случаях отдается явное предпочтение редким кодонам, обычно нехарактерным для данного вида. Одна из версий для объяснения этой странной закономерности состоит в том, что редкие кодоны появляются там, где необходимо замедлить трансляцию (например, там, где проходит граница доменов белка, чтобы предыдущий домен успел свернуться до того, как начнет синтезироваться следующий). Однако, насколько я поняла, серьезных доказательств для этой версии пока нет. Надо отметить, что участки, кодирующие самое начало, N-конец, белка как правило очень богаты редкими кодонами; почему — тоже пока не до конца понятно.

Наконец, еще одна интересная работа свидетельствует, что, по крайней мере для одного организма, цианобактерии Synechococcus elongate, в группе циркадных (управляющих суточными ритмами) генов, наоборот, используется неоптимальный перекос по кодонам — то есть для кодирования данных генов используются не самые популярные кодоны (Yao Xu et al., 2013. Non-optimal codon usage is a mechanism to achieve circadian clock conditionality). Авторы предполагают, что таким образом, с помощью определенных молекулярных механизмов, нарушается экспрессия данных генов в холодных условиях, когда данной цианобактерии выгодней обходиться без суточных ритмов.

Послесловие

Практическое применение перекоса по кодонам прежде всего лежит в сфере биотехнологий. Дело в том, что сплошь да рядом в среде биотехнологов происходят печальные происшествия: какой-то ген, заботливо вставленный в данный организм биотехнологическим способом, наотрез отказывается там экспрессироваться или экспрессируется слишком вяло. Причина часто в том, что исследователи не учитывают несоответствие перекоса по кодонам, характерного для организма-донора (из которого берется ген) и организма-реципиента (в который этот ген вставляется). Изменив последовательность гена нужным образом, вставив туда кодоны, популярные в организме-реципиенте, можно исправить данную ситуацию и добиться высокого уровня экспрессии.

Это может быть полезно в самом широком диапазоне применений — от выращивания белков в бактериальных клетках до генной терапии, при которой в организм вместо поломанной, мутантной версии гена вставляется правильная.

Показать комментарии (1)

Свернуть комментарии (1)

taras 07.10.2017 13:13 Ответить

Каждому нуклеотиду однозначно соответствует другой нуклеотид второй спирали. И если все 4 несут информацию, то как различить спирали? А если только 2 нуклеотида несут информацию, а два других участвуют только во второй спирали, то получается двоичный трёх битный код. Но это всего 8 комбинаций. Но если нуклеотиду соответствует нуклеотид, то и триплету соответствует триплет. Половину комбинаций надо запретить, именно эти комбинации будут во второй спирали, имеющей просто однозначное соответствие первой спирали и дополнительной информации не несущей. Но 32 комбинации можно использовать, а аминокислот 20. Избыточность ещё 12 кодов. Не понятно. Для "контрольных сумм" что ли?

Ответить