Волосатики и степени свободы в эволюции белков

Александр Панчин,
кандидат биологических наук,
Институт проблем передачи информации имени А. А. Харкевича (Москва)
«Природа» №8, 2019

Теория эволюции, пожалуй, самая фундаментальная теория в биологии. В базе данных PubMed находятся сотни тысяч научных публикаций, посвященных проблемам эволюции. По результатам опроса Исследовательского центра Пью (Pew Research Center)*, среди членов Американской ассоциации содействия развитию науки (American Association for the Advancement of Science, AAAS) — крупнейшего сообщества ученых, издающих журнал Science, — уверены в эволюции человека 98% опрошенных (99%, если брать только активно работающих, т.е. получающих гранты исследователей). Вдохновленные идеями Дарвина, специалисты создали метод генетического программирования, который стал стандартным инструментом для новых программ, которые не написаны программистом, а выращены на основе случайных мутаций кода и направленного отбора. Успех таких методов подтверждает верность общих принципов эволюции и их применимость даже за пределами биологических объектов. Несмотря на все сказанное, эволюцию признают только 65% взрослого населения США. В России, по данным опроса Всероссийского центра изучения общественного мнения**, сторонниками теории эволюции Дарвина считают себя 35% опрошенных (45% среди высокообразованных респондентов), а приверженцами концепции божественного сотворения (креационизма) — 44%.

Среди популярных аргументов в пользу невозможности эволюции без вмешательства некоего разумного создателя — тезис о невероятности самопроизвольного получения тех или иных полимерных биологических молекул, лежащих в основе жизни. Например, на сайте американского Института креационных исследований (Institute for Creation Research) приводится такое рассуждение: «Предположим, что каждая мутация полезна или вредна с вероятностью одна вторая. Элементарная статистическая теория показывает, что вероятность 200 последовательных полезных мутаций — 0,5200, или один шанс на 1060. <...> Предположим, что на каждом из 1014 квадратных футов поверхности Земли существует миллиард мутирующих систем и на каждую мутацию требуется всего полсекунды. Каждая система может пройти через 200 мутаций за 100 с и, если ничего не получится, начать заново. <...> Перемножая все эти числа, мы получим, что за время существования Вселенной могло произойти 1039 попыток сборки системы из 200 компонентов». Дальше делается вывод, что даже 200-компонентный организм не мог эволюционировать, поскольку 1060 на порядки больше, чем 1039.

Забавно, что из подобных утверждений, опровергающих эволюцию, следует, что их авторы не понимают, в чем, собственно, главная идея и заслуга Дарвина. Предложенный им механизм эволюции основан на естественном отборе, фиксирующем те наследуемые особенности, которые способствуют размножению и выживанию. Иными словами, вам не нужно сразу получить готовую сложную систему. Полезные изменения постепенно накапливаются и фиксируются.

Представьте, что вы играете в усложненную версию игры «Поле чудес», где требуется отгадать не слово, а случайную последовательность длиной в 200 букв, составленную из 33 букв нашего алфавита. Всего возможных комбинаций 33200, это примерно 5 · 10303. Угадать такое «слово» целиком невозможно. Но теперь представьте, что все буквы, вставшие на свои места, фиксируются. Уже после первой попытки назвать слово, вероятнее всего, у вас будет шесть отгаданных букв (200/33 ~ 6). После второго раунда, видимо, таких букв уже будет двенадцать — и так далее.

Есть замечательная статья математиков Х. Уильфа и В. Эванса [1], где они выводят теорему, из которой следует, что для слова длиной L и алфавита размером K букв среднее число раундов угадываний этого слова (при наличии отбора) пропорционально K log L, а не KL. Более точная формула: log L / log (K / (K − 1)) плюс малое число, которым можно пренебречь.

Если применить эту формулу к нашему примеру, то всего за 172 раунда слово из 200 букв будет отгадано. В справедливости этих рассуждений легко убедиться на простом примере. Возьмите шесть обычных игральных кубиков. Подбросьте их. Оставьте все кубики, на которых выпала шестерка. Остальные перебросьте. Убедитесь, что маловероятная комбинация 666666 (вероятность выпадения которой с одного раза равна 1 к 46 656) выпадет за сравнительно небольшое число попыток. Едва ли эксперимент займет больше нескольких минут. Это и есть отбор: вы отбираете полезные мутации (шестерки), а вредные отбраковываете (пятерки и т.д.).

Теперь посмотрим, как это все соотносится с тем, что мы наблюдаем в живой природе. Кишечная палочка — не самый простой организм, но для наших рассуждений даже она подойдет. Размер генома этой бактерии не 200, а 5 132 068 нуклеотидов (L). Нуклеотиды бывают четырех типов: A, T, G и C (K = 4). Для того чтобы «угадать» геном кишечной палочки нам бы потребовалось в среднем лишь 54 раунда мутаций (один раунд перемешивает весь геном, сохраняя угаданные позиции).

Здесь есть несколько оговорок. Во-первых, мы предположили, что все «полезные» мутации фиксируются. В природе это не так. К счастью, для кишечной палочки существуют экспериментальные оценки темпов фиксации новых мутаций. В статье, опубликованной в журнале Nature, авторы следили за популяциями кишечных палочек на протяжении 60 тыс. поколений, читая бактериальные геномы каждые 500 поколений и отслеживая генетические изменения [2]. За это время в среднем около 70 мутаций были зафиксированы в популяции естественным отбором.

Учитывая, что кишечная палочка делится каждые 20 мин, мы получаем 30,5 мутации в год (в лабораторных условиях). В дикой среде темпы фиксации мутаций могут отличаться в зависимости от самых разных условий, но едва ли более чем на один-два порядка. Клеточная жизнь существует на Земле уже более 3 млрд лет. Но с указанными темпами фиксации (30,5 мутации в год) нужно лишь 168 264 года, чтобы набрать 5 132 068 зафиксированных мутаций (число, равное размеру генома кишечной палочки). Вероятно, что в природе бактерии размножаются медленней, чем в комфортной лаборатории, но вряд ли разница составляет более одного-двух порядков. С другой стороны, размеры популяций бактерий в природе гораздо выше. В любом случае мы видим, что времени более чем достаточно. Но есть еще одно важное допущение, которое пропущено во всех предыдущих рассуждениях и полностью игнорируется креационистами. Кто сказал, что в нашей игре в «Поле чудес» должно быть только одно идеальное слово, к которому нужно стремиться при угадывании? На практике существует огромное разнообразие жизни, в том числе бактерий. Значит, мы уже знаем, что «правильных» вариантов геномов очень много. Перед эволюцией никогда не стояла задача получить геном современной кишечной палочки. Если бы мы запустили развитие жизни по второму разу, вероятно, ничего похожего на кишечную палочку не появилось бы, а ее экологическую нишу (если бы таковая была) занял бы какой-то другой организм, с совсем другим наследственным материалом.

Представьте теперь, что вас устраивают не только шестерки. Например, если с первого раза выпало больше всего единиц, то далее мы будем собирать не шестерки, а единицы, еще быстрее достигая нужного результата. А потом снова удивляемся, откуда взялась «маловероятная» комбинация 111111. Путей, по которым могла пойти эволюция, несчетное количество. Как и число «потенциально хороших» геномов.

Кроме того, если взять геном современной кишечной палочки, то далеко не все нуклеотиды в нем нуждаются в такой оптимизации, чтобы там была конкретная буква. Самый простой пример — синонимичные кодоны. Вот есть ген, кодирующий белок, в котором есть такая последовательность аминокислот: лейцин, пролин, гистидин, пролин. Предположим, что белок очень важный и его функция требует, чтобы все эти аминокислоты были на своем месте.

В ДНК лейцин может быть закодирован разными кодонами — TTA, TTG, CTT, CTC, CTA, CTG; пролин — CCT, CCA, CCC, CCG; гистидин — CAT, CAC. Эти тройки нуклеотидов ДНК, кодирующие одну и ту же аминокислоту, называются синонимичными. Использование конкретного кодона чаще всего имеет минимальное значение, если вообще имеет. Выходит, что нам нужно зафиксировать не строгую комбинацию из 12 нуклеотидов для связки лейцин-пролин-гистидин-пролин, а одну из 192, что в 192 раза увеличивает вероятность случайного появления такой комбинации. Но, возможно, существуют и другие комбинации аминокислот, которые сработали бы в белке не хуже, просто мы об этом не знаем, ведь эволюция пошла по другому пути. На самом деле многие белки у разных организмов выполняют похожие функции, но имеют довольно существенные отличия в последовательностях аминокислот. Одно и то же решение может быть достигнуто разными способами.

Итак, представьте, что вы играете в «Поле чудес». Правильных слов не одно, как вы предполагали ранее, а огромное количество, причем с разными написаниями. Стоит вам отгадать букву в определенном положении, и она с высокой вероятностью фиксируется. Согласитесь, что это отличается от требования отгадать одно-единственное слово целиком. Но именно так ошибочно представляют себе эволюцию креационисты.

Волосатики («Природа» №8, 2019)

Волосатики: а — самец (справа) и самка Paragordius tricuspi datusб — повзрослевший Spinochordodes покидает своего хозяина, кузнечика Meconema thalassinum. Фото A. Schmidt-Rhaesa Зоологический музей Гамбургского университета (Германия)

Тезис о том, что мы недооцениваем количество степеней свободы в эволюции биологических молекул, можно развить и проиллюстрировать конкретным примером. Недавно у нас с коллегами вышла статья, которая посвящена странностям в белок-кодирующих генах, обнаруженным после расшифровки митохондриального генома (мтДНК) волосатиков [3].

Волосатики (Nematomorpha) — тип червеобразных паразитоидных беспозвоночных животных, у которых личинки развиваются внутри членистоногих (насекомых или ракообразных), а взрослые свободно плавают в воде. Чтобы завершить свой жизненный цикл***, выросший из личинки червь должен попасть в водоем. Для этого он меняет поведение хозяина: зараженные насекомые (например, кузнечики или сверчки) практически совершают самоубийство, прыгая в воду [4, 5]. Там волосатик выходит наружу и уплывает на поиски партнера для спаривания. Механизмы столь хитрой манипуляции еще недостаточно изучены: предполагается, что личинки, достигшие последней стадии развития, продуцируют эффекторные молекулы, которые влияют на центральную нервную систему хозяина [6, 7]. Однако оказалось, что это далеко не самое удивительное свойство Nematomorpha.

Митохондрии — внутриклеточные органеллы, которые играют важную роль в клеточном дыхании, — обладают собственной ДНК (размером около 15 тыс. пар нуклеотидов), которая обычно содержит 13 белок-кодирующих генов. Чтобы разобраться в их «странностях» у волосатиков, прибегнем к метафоре.

Нуклеотидную последовательность ДНК часто сравнивают с текстом, написанным с помощью алфавита, состоящего из четырех букв (A, T, G, C). В этом тексте встречаются отдельные осмысленные «высказывания» — гены, кодирующие синтез белков. Как, например, в поваренной книге — отдельные рецепты, позволяющие изготовить то или иное блюдо.

Теперь представьте, что вы взяли поваренную книгу и читаете рецепт. Он осмысленный — и, следуя ему, можно получить отличную яичницу. Но тут вы замечаете, что, если читать его по буквам задом наперед, вы снова получаете рецепт яичницы, причем тот же самый. Далее вы узнаете, что и многие другие рецепты из этой книги тоже так написаны. Это и странно, и удивительно. И именно это мы видим в «поваренной книге» митохондриального генома волосатиков.

Фраза «„Ура!“ — вопите, дети, повару!», если опустить пунктуацию, читается одинаково слева направо и справа налево. Такие фразы называют палиндромами. Важно оговориться, что палиндромы в ДНК, о которых идет речь, имеют немного другое определение. Например, ДНК-палиндромом будет считаться такая последовательность букв: ATTGCAAT. Дело в том, что в двойной спирали ДНК действует принцип комплементарности: напротив А стоит T, напротив G — С. Палиндромная ДНК может сама с собой образовать двойную спираль. В нашем примере (ATTGCAAT) первая буква А комплементарна последней T, вторая Т — предпоследней А и т.д. Вот еще один, совсем простой палиндром: GGGGCCCC. Но, как и в случае палиндромов в обычном языке, левая половина высказывания полностью определяет правую.

Палиндром волосатика Gordionus alpestris и аминокислотная последовательность кодируемого белка («Природа» №8, 2019)

Палиндром (нуклеотидная последовательность) волосатика Gordionus alpestris и аминокислотная последовательность кодируемого белка (а). Удивительно, что участки ДНК могут быть частью сразу двух палиндромов (красные и синие дуги) и что кодируемые белки не только сходны у разных видов волосатиков (Gordius sp., Gordionus wolterstorffii, Gordionus alpestris, Chordodes sp.), но и похожи на родственные белки других организмов — кишечной палочки (E. coli). плодовой мушки (D. melanogaster), человека (H. sapiens) и др. Здесь и далее схемы подготовлены О. Занегиной

Оказалось, что большинство митохондриальных генов волосатиков содержит палиндромы, причем порой значительного размера — до 284 букв, без единой ошибки, целиком находящиеся внутри гена. Получается, что на каждый нуклеотид в ДНК таких участков наложено сразу два ограничения: рецепт белка по-прежнему должен быть хорошим, но нуклеотиды в левой и правой его частях должны быть «сцеплены». Мы посмотрели, можно ли найти что-то похожее в уже известных митохондриальных геномах (всего на момент исследования их было прочитано 8952). Оказалось, что отдельные более короткие палиндромы в отдельных генах можно найти и у других видов, но волосатики исключительны в масштабах этого явления — по максимальной длине палиндромов, по их числу и количеству затронутых генов.

Разумеется, мы опасались, что все это может быть ошибкой. Наши приборы могли неправильно прочитать ДНК. Уж больно это удивительно. Тогда были проделаны дополнительные эксперименты. Например, выделяли из волосатика мтДНК, сильно разбавляли, нагревали, чтобы двойные спирали развалились на отдельные цепочки, а потом охлаждали. К этому раствору добавляли специальные ферменты, которые разрушают одноцепочечную ДНК, при этом двуцепочечная сохраняется. Палиндромные участки одноцепочечной ДНК образуют двойные спирали сами с собой, поэтому выживают. Остальная ДНК разрушается. В таких условиях происходило обогащение именно тех участков ДНК, которые были определены как палиндромы. Эти и еще масса других данных подтвердили нашу гипотезу, и появились все основания поверить в наши находки (подробности см. в статье [3]).

Всего мы изучили митохондрии четырех видов волосатиков (Gordius sp., Gordionus wolterstorffii, Gordionus alpestris, Chordodes sp.). Многие из палиндромных участков ДНК совпадали между видами. Это значит, что возникли они давно — у общего предка изученных видов. Интересно, что в самих последовательностях палиндромной ДНК были межвидовые отличия, но на каждое изменение в левой половине палиндрома мы находили изменение в его правой части, сохраняющее идеальное соответствие между ними.

Для чего это может быть нужно? Одна из гипотез заключалась в том, что, когда волосатик находится внутри хозяина, ему нужно меньше дышать, а палиндромы в генах дыхательных белков служат для выключения синтеза соответствующих им белков (например, через образование шпилек в соответствующих молекулах РНК). Но сравнение дыхательной активности митохондрий, взятых из волосатиков, которые были в воде или в теле хозяина, не выявили каких-то отличий (это не доказывает, что их нет, просто наши методы не позволили это обнаружить).

Нам кажется более правдоподобной версия, согласно которой эти палиндромы сами по себе не нужны ни для чего. Возможно, у волосатиков есть какой-то механизм починки мтДНК, который оказался способным удлинять небольшие неидеальные палиндромы и делать их идеальными. Представьте, что в какой-то момент две цепочки мтДНК волосатика расплетаются на две одиночные цепи (как это и наблюдают у некоторых других организмов). В каких-то местах у нас есть маленькие палиндромы, возможно, возникшие случайно. Они способствуют тому, что часть одноцепочечной ДНК сама с собой образует двойную спираль. Затем механизм починки ДНК исправляет несовпадения, удлиняя палиндром. Подобные механизмы репарации известны и даже описаны в митохондриях некоторых видов, хотя к появлению палиндромов это само по себе не приводит. Разумеется, все это время продолжает действовать естественный отбор — если такое исправление портит ген, то митохондрия оказывается менее жизнеспособной и в итоге не обнаруживается у последующих поколений. Но все безвредные замены в пользу удлинения палиндромов фиксируются. Неидеальные палиндромы становятся идеальными.

Возможный механизм исправления ошибок (репарации неправильно спаренных нуклеотидов) в мтДНК у волосатиков («Природа» №8, 2019)

Возможный механизм исправления ошибок (репарации неправильно спаренных нуклеотидов) в мтДНК у волосатиков, который позволяет удлинять небольшие неидеальные палиндромы и делать их идеальными

Но как обстоят дела на самом деле, мы не знаем. В любом случае это удивительная ситуация, когда эволюция вынуждена искать компромиссы: с одной стороны, ген должен кодировать функциональный белок, с другой — есть это странное требование, чтобы нуклеотиды образовывали палиндром. Известно, что один и тот же по функции белок можно получить разными способами, используя разные последовательности ДНК, и в итоге отбираются такие последовательности нуклеотидов, которые подходят сразу по двум параметрам. Итак, мы недооценивали количество степеней свободы в эволюции белков. Вот такая интересная наука.

Над проектом по изучению митохнодриальных геномов волосатиков работал большой коллектив: Кирилл Михайлов, Борис Ефейкин, Александр Панчин, Дмитрий Кнорре, Мария Логачева, Алексей Пенин, Мария Мунтян, Михаил Никитин, Ольга Попова, Ольга Занегина, Михаил Высоких, Сергей Спиридонов, Владимир Алешин и Юрий Панчин.

Работа выполнена при поддержке Российского научного фонда. Проекты 14-50-00150 (секвенирование и экспериментальные процедуры) и 19-74-20147 (биоинформатический анализ).

Литература
1. Wilf H. S., Ewens W. J. There’s plenty of time for evolution // PNAS. 2010; 107(52): 22454–22456. DOI: 10.1073/pnas.1016207107.
2. Good B. H., McDonald M. J., Barrick J. E. et al. The Dynamics of Molecular Evolution Over 60,000 Generations // Nature. 2017; 551(7678): 45–50. DOI: 10.1038/nature24287.
3. Mikhailov K. V., Efeykin B. D., Panchin A. Y. et al. Coding palindromes in mitochondrial genes of Nematomorpha // Nucleic Acids Research. 2019; gkz517. DOI: 10.1093/nar/gkz517.
4. Thomas F., Schmidt-Rhaesa A., Martin G. et al. Do hairworms (Nematomorpha) manipulate the water seeking behaviour of their terrestrial hosts? // J. Evol. Biol. 2002; 15(3): 356–361. DOI: 10.1046/j.1420-9101.2002.00410.x.
5. Thomas F., Ulitsky P., Augier R. et al. Biochemical and histological changes in the brain of the cricket Nemobius sylvestris infected by a manipulative parasite Paragordius tricuspudatus (Nematomorpha) // Int. J. Parasitol. 2003; 33(4): 435–443. DOI: 10.1016/S0020-7519(03)00014-6.
6. Biron D. G., Ponton F., Joly C. et al. Water-seeking behavior in insects harboring hairworms: should the host collaborate? // Behav. Ecol. 2005; 16(3): 656–660. DOI: 10.1093/beheco/ari039.
7. Biron D. G., Marche L., Ponton F. et al. Behavioural manipulation in a grasshopper harbouring hairworm: a proteomics approach // Proc. Biol. Sci. 2005; 272 (1577): 2117–21126. DOI: 10.1098/rspb.2005.3213.


* An Elaboration of AAAS Scientists’ Views. 2015.

** Дарвинисты среди нас, или Кто создал человека и был ли Всемирный потоп? Данные опроса ВЦИОМ. 27 ноября 2009 г.

*** В дополнительных материалах к статье [4] авторы приводят ссылку на видео жизненного цикла волосатиков (предупреждаю, зрелище не для слабонервных), которая почему-то не работает, но эта запись опубликована на канале DEEP LOOK.


0
Написать комментарий

    Элементы

    © 2005–2025 «Элементы»