Формальные статистические тесты подтверждают происхождение всех живых организмов от единого предка

Рисунок из записной книжки Дарвина, сделанный в 1837 году (через год после возвращения из кругосветного плавания на «Бигле»). На этом рисунке впервые в графической форме представлена идея происхождения различных видов живых существ от единого предка. Изображение с сайта talkingsquid.net
Рисунок из записной книжки Дарвина, сделанный в 1837 году (через год после возвращения из кругосветного плавания на «Бигле»). На этом рисунке впервые в графической форме представлена идея происхождения различных видов живых существ от единого предка. Изображение с сайта talkingsquid.net

Идея о единстве происхождения всего живого является общепринятой среди биологов, однако аргументы в ее пользу имеют в основном качественный, а не количественный характер. Формальные статистические тесты, основанные на «теории выбора моделей» (model selection theory) и не использующие априорного допущения о том, что сходство белковых молекул говорит об их родстве, показали, что гипотеза о едином происхождении всего живого гораздо более правдоподобна, чем альтернативные модели, предполагающие независимое происхождение разных групп организмов от разных предков.

Дарвин думал, что все живые организмы произошли либо от одной исходной формы, либо от нескольких (см. common descent). Дарвин оставил вопрос о количестве первопредков открытым, потому что в XIX веке наука еще не располагала средствами для решения этой проблемы. В наши дни большинство биологов уверено, что всё живое произошло от «последнего универсального общего предка» (last universal common ancestor, LUCA). Этот предок, впрочем, вряд ли был единичным организмом или «видом» в современном понимании этого слова, а, скорее, представлял собой полиморфное микробное сообщество, в котором осуществлялся активный горизонтальный обмен генами.

Конечно, LUCA не был первым живым существом на свете: его появлению предшествовала долгая эволюция (в ходе которой, в частности, сформировался современный генетический код и аппарат синтеза белка, см.: Vetsigian, Woese, Goldenfeld. 2006. Collective evolution and the genetic code). Одновременно с LUCA, скорее всего, жили и другие существа, но их потомки вымерли. Большинство экспертов считает, что у LUCA уже были ДНК и РНК, ферменты репликации и транскрипции, рибосомы и другие компоненты аппарата синтеза белка. Сильнейшим аргументом в пользу реальности LUCA является единство генетического кода и фундаментальное сходство молекулярных систем синтеза ДНК, РНК и белков у всех живых организмов (см.: Молекулярно-генетические доказательства эволюции). Но этот аргумент, при всей его убедительности, является не количественным, а качественным. Численно оценить его силу весьма непросто.

Если жизнь однажды зародилась на Земле или в космосе, то теоретически она могла зародиться и несколько раз. В принципе можно предположить, что современная жизнь происходит более чем от одного предка. Например, бактерии могли произойти от одного, а археи — от другого предка (такая точка зрения изредка высказывается, хотя сторонников у нее мало).

Строгие статистические процедуры для разрешения этой дилеммы до сих пор практически не использовались. Стандартные методики сравнения нуклеотидных последовательностей ДНК и аминокислотных последовательностей белков включают в себя вычисление ряда количественных показателей, отражающих вероятность того, что наблюдаемое сходство — результат случайности (см.: The Statistics of Sequence Similarity Scores). Низкие значения этих показателей свидетельствуют о статистической значимости (неслучайности) сходства, но в принципе они не являются строгим доказательством родства (единства происхождения) сравниваемых молекул. Высокое сходство двух последовательностей теоретически может объясняться не только их общим происхождением, но и конвергентной эволюцией под действием сходных факторов отбора.

Еще более серьезные претензии можно предъявить к большинству компьютерных программ, предназначенных для построения эволюционных деревьев. Эти программы, как правило, ориентированы на то, чтобы на основе любого набора сравниваемых последовательностей построить «наилучшее», то есть имеющее максимальную статистическую поддержку, эволюционное дерево. Эти программы просто не рассматривают возможности существования нескольких не связанных между собой деревьев, растущих из нескольких независимых корней. При помощи этих методов можно количественно оценивать и сравнивать «правдоподобие» различных деревьев, но нельзя понять, является ли модель с одним деревом более или менее правдоподобной, чем модели с двумя или тремя независимыми деревьями. Иными словами, идея единого общего предка «вмонтирована» в эти программы изначально (что отражает глубокую убежденность биологов в существовании такого предка у любой пары живых организмов).

Дуглас Теобальд (Douglas L. Theobald) из Университета Брандейса (США) попытался преодолеть эти ограничения и разработать независимые статистические тесты для проверки гипотезы LUCA, в которые не была бы встроена идея о том, что сходство последовательностей есть мерило их родства, и тем более не была бы изначально заложена идея единства происхождения. Теобальд не пытался выяснить, насколько весомым с точки зрения статистики является единство генетического кода всех организмов. Его задача была более узкой: он хотел количественно оценить, насколько надежными (или ненадежными) являются свидетельства в пользу LUCA, заключенные в аминокислотных последовательностях ключевых белков, которые есть у всех живых существ.

Подход Теобальда основан на тестах, разработанных в рамках теории выбора моделей (model selection theory). Для сравнения конкурирующих эволюционных моделей использовались три теста: 1) log likelihood ratio, LLR (см. Likelihood-ratiotest; 2) Akaike information criterion (AIC); 3) log Bayes factor. Эти тесты количественно оценивают «правдоподобие» (likelihood) сравниваемых моделей (в данном случае — эволюционных реконструкций, состоящих из одного или многих деревьев) на основе двух основных критериев: 1) точности соответствия модели реальным фактам, 2) парсимоничности (экономности) модели. Иными словами, эта методика позволяет выбрать из множества моделей такую, которая наиболее точно описывает (объясняет) наблюдаемые факты, используя для этого минимальное число допущений («свободных параметров»).

Теобальд анализировал аминокислотные последовательности 23 белков, которые есть у всех живых организмов (в основном это белки, участвующие в синтезе белка аминоацил-тРНК-синтетазы, рибосомные белки, факторы элонгации и др.). Белковые последовательности были взяты у 12 организмов: четырех бактерий, четырех архей и четырех эукариот (дрожжи, дрозофила, червь C. elegans, человек).

Сравниваемые эволюционные модели строились на основе ряда общепринятых допущений. Предполагалось, что аминокислотные последовательности могут постепенно меняться в ходе эволюции путем замены одних аминокислот другими. Использовались разработанные ранее матрицы 20 × 20, отражающие эмпирическую вероятность или частоту замены каждой аминокислоты на любую другую. Предполагалось также, что аминокислотные замены, происходящие в разных эволюционных линиях и в разных участках белка, не скоррелированы друг с другом.

Гипотеза единого общего предка (LUCA) сравнивалась с гипотезами о нескольких общих предках, причем вопрос об однократном или множественном зарождении жизни остался за кадром. Дело в том, что гипотеза LUCA вполне совместима с множественным зарождением жизни. В этом случае либо все остальные древние формы жизни, кроме LUCA, не оставили доживших до наших дней потомков, либо представители нескольких независимо возникших популяций в ходе эволюции приобрели способность обмениваться генами друг с другом и фактически слились в один вид. Модели, рассматриваемые Теобальдом, совместимы с обоими этими сценариями.

Альтернативные эволюционные модели, сравнению которых посвящена обсуждаемая статья в Nature. a — всё живое происходит от двух или более разных предков, b — от единого предка. Пунктирными линиями обозначены события горизонтального генетического обмена. Рис. из популярного синопсиса к обсуждаемой статье Steel & Penny
Альтернативные эволюционные модели, сравнению которых посвящена обсуждаемая статья в Nature. a — всё живое происходит от двух или более разных предков, b — от единого предка. Пунктирными линиями обозначены события горизонтального генетического обмена. Рис. из популярного синопсиса к обсуждаемой статье Steel & Penny

Автор рассмотрел два класса моделей: в первом из них горизонтальный генетический обмен не учитывался, и организмы должны были эволюционировать в соответствии с древовидными схемами. Модели второго класса допускали горизонтальный обмен (в том числе симбиогенетическое слияние двух организмов в один), поэтому схемы получались не древовидные, а сетчатые, с перемычками между ветвями. В пределах каждого класса сравнивались между собой наиболее правдоподобные модели, построенные на основе различных допущений о количестве исходных предков. Модель единого происхождения (ABE, где A — археи, B — бактерии, E — эукариоты) сравнивалась с разнообразными моделями множественного происхождения: AE + B (у архей и эукариот был один общий предок, но бактерии произошли от другого предка), AB + E, BE + A, A + B + E и т. д. Рассматривалась даже возможность независимого происхождения многоклеточных животных или человека.

Все три использованных теста во всех случаях уверенно поддержали гипотезу LUCA в противовес альтернативным гипотезам множественного происхождения. Например, для моделей класса 1 «правдоподобие» гипотезы ABE оказалось выше, чем у ее ближайшего конкурента (модели AE + B) в 102860 раз. Это число даже нельзя назвать «астрономическим», в астрономии столь больших чисел нет. Примерно такую же надежную поддержку получили гипотезы класса 2 (с горизонтальным переносом) при сравнении их с гипотезами класса 1. Самой правдоподобной моделью, с огромным отрывом от всех остальных, оказалась модель LUCA 2-го класса: с единым общим предком и сетчатой структурой, обусловленной горизонтальным генетическим обменом между эволюционирующими линиями. Эта модель, в частности, адекватно отражает симбиогенетическое происхождение эукариот: некоторые из 23 рассмотренных белков эукариоты явно унаследовали от бактерий, а другие — от архей.

Таким образом, аминокислотные последовательности ключевых белков, имеющихся в каждой живой клетке, дают мощную статистическую поддержку гипотезе LUCA. При этом главным свидетельством в пользу единства происхождения является не величина сходства как таковая (реальное сходство гомологичных белков у человека, дрожжей и бактерий на самом деле не так уж велико), а характер (или структура) этого сходства, то есть распределение одинаковых или близких по свойствам аминокислот по белковой молекуле у разных организмов. Структура наблюдаемого сходства такова, что она обеспечивает «выводимость» одних белков из других, и поэтому гипотеза единого происхождения объясняет всю картину гораздо лучше, чем другие модели. В дополнительных материалах (PDF, 352 Кб) к обсуждаемой статье Дуглас Теобальд приводит вымышленные примеры белковых молекул, которые обладают очень высоким сходством, но для которых единое происхождение оказывается менее вероятным, чем множественное. Например, так получается, если белок A сходен с белком B по одним аминокислотным позициям, а с белком C — по другим. Что касается реальных белков, то гипотеза LUCA объясняет наблюдаемое сходство наиболее «экономным» образом.

Если включить в рассмотрение белки, которые есть не у всех, а только у некоторых организмов (например, только у эукариот), результаты остаются такими же, потому что новые типы белков так или иначе должны были возникать в разных эволюционных линиях — независимо от того, имели ли эти линии единое или разное происхождение.

Данная работа, конечно, не является окончательным решением поставленной проблемы — скорее, ее нужно рассматривать как первый шаг. Полностью исключить все возможные альтернативные интерпретации полученных результатов довольно трудно. Для этого понадобится более детальное знание закономерностей эволюции белков и еще более сложные статистические методы.

Источники:
1) Douglas L. Theobald. A formal test of the theory of universal common ancestry // Nature. 2010. V. 465. P. 219–222.
2) Mike Steel, David Penny. Common ancestry put to the test // Nature. 2010. V. 465. P. 168–169.

Александр Марков


11
Показать комментарии (11)
Свернуть комментарии (11)

  • biarmia  | 19.05.2010 | 21:51 Ответить
    Как отмечает доктор наук, профессор В. Зубаков, два миллиарда лет назад в биосфере произошла катастрофа, из-за которой жизнь на Земле совершенно изменилась. Причиной стали лидеры эволюции того времени - цианобактерии. Это одна из самых древних, достоверно известных науке форм жизни на Земле. Ей больше 2,8 миллиарда лет. Цианобактерии дышали углекислым газом и азотом (кислорода тогда не было) и в качестве продукта выделяли кислород - яд для всех архибактерий, покрывавших сплошным ковром поверхность Земли. В результате соседи по планете быстро вымерли. Однако с уменьшением интенсивности вулканических процессов и увеличением кислорода в атмосфере цианобактерии тоже вымерли. Опустевшая экологическая ниша в течение многих миллионов лет была заполнена мутантами. Постепенно возникла принципиально новая форма жизни - клетка с ядром, так была запущена гонка развития новой жизни на Земле.
    В этой гонке развития на планете Земля преимущество получили белковые комочки - коарцеваты: они активнее отзывались на изменение окружающей среды и совершенствовались быстрее, причем, чем дальше, тем с большим ускорением, превращаясь в клетки, а затем в простейшие существа. Важную роль в развитии белковой жизни играет вода, которой на нашей планете достаточно. Для белковой формы в воде время текло быстрее. ': 400 миллионов лет понадобилось эволюции, чтобы усовершенствовать первый микроорганизм, - говорит американский ученый Т. Сеч. - Эволюция простейших форм жизни шла, видимо, очень быстро:'. В 1982 году Т. Сечу удалось выяснить, что рибонуклеиновые кислоты (РНК) в биохимических процессах играют двоякую роль. Иногда части этой молекулы могут использоваться и как энзимы-катализаторы. Значит и синтез должен начинаться с РНК или по крайней мере, с той его каталитической части, которая сейчас называется 'рибозим'. Мнение Сеча подтвердил С. Алтман, отыскавший один из рибозимов в кишечных бактериях. С. Миллер, пропустив через смесь аммиака, водяного пара и водорода электрические заряды, получил первые аминокислоты и другие органические соединения, являющиеся исходным материалом для создания белков. Из них возникли пурины и их химические родственники - пиримидины. Затем появились 4 основных элемента, из которых и поныне состоит РНК. Ну а как только появились первые РНК-цепочки, они тут же начали себя тиражировать, используя помощь катализаторов-рибозимов.
    Ответить
    • Rattus > biarmia | 20.05.2010 | 14:31 Ответить
      Мдя. Некоторые "эволюционисты" производят впечатление едва ли лучшее, чем средние креационисты, постоянно накручивая черный хлеб на Мурманский полуостров, возжигая тем самым в библиотеке большой лист кинохроники от 120 кирпичей.
      Ответить
      • Andrey_Vedenin > Rattus | 20.05.2010 | 20:16 Ответить
        О да... несмотря на отдельные зерна истины в этом эзотерическом сообщении, в целом все выглядит наредкость... мда.
        Что обидно, очень многие эволюционисты, выступающие по телику, радио и пр., именно такие. А.В. Марков, К.Ю. Еськов, М.С. Гельфанд и другие выглядят скорее как исключение. Неудивительно, что креационисты убеждены, что побеждают...
        Ответить
        • feb7 > Andrey_Vedenin | 22.05.2010 | 02:06 Ответить
          > Неудивительно, что креационисты убеждены, что побеждают...
          Да. Самовнушение великая сила. Индийские йоги, например, за счет силы самовнушения умеют замедлять метаболические процессы. А эти деятели добились еще больших достижений. Они сумели настолько замедлить себе мыслительные процессы, что внушили себе, что побеждают.
          Ответить
  • dasem  | 20.05.2010 | 11:56 Ответить
    О "количественных оценках правдоподобия" здорово написано еще в классической книге Д.Пойя "Математика и правдоподобные рассуждения". А написано там, что это абсурд.Там же приведен пример рассуждений Лапласа, подсчитывавшего вероятность восхода Солнца исходя из того, что оно уже всходило много раз с момента сотворения мира.
    Смешно вводить читателя в заблуждение, о том, что во времена Лапласа и Пойя количественные оценки были неважные, а теперь наука развилась и все стало возможно. Просто упал уровень подготовки у редакторов, рецензентов и т.д., или/и возрос уровень слепого доверия к компьютерным рассчетам.
    "Доказывать" рассчетами, то во что верит большинство биологов это наукопоклонничество, а не наука. Ведь этой гипотезе не предлагается внятная альтернатива.
    Впрочем, биологи прикормлены уже примерами "подсчета вероятности самозарождения жизни" и такого рода тексты не отличают, к сожалению, от работы Е.Вигнера "О вероятности существования самовоспроизводящихся систем"
    Ответить
    • Rattus > dasem | 20.05.2010 | 14:34 Ответить
      >Ведь этой гипотезе не предлагается внятная альтернатива

      А это: "Модель единого происхождения (ABE, где A - археи, B - бактерии, E - эукариоты) сравнивалась с разнообразными моделями множественного происхождения: AE + B (у архей и эукариот был один общий предок, но бактерии произошли от другого предка), AB + E, BE + A, A + B + E и т. д. Рассматривалась даже возможность независимого происхождения многоклеточных животных или человека." что?

      Или "чукча не читатель"?
      Ответить
      • dasem > Rattus | 21.05.2010 | 12:24 Ответить
        Есть прекрасное слово: "галиматья", введенное в литературный язык, если верить историкам, еще Монтенем. Так вот эта модель и есть галиматья. При этом совершенно умиляет нацеленность на результат, который не будет никем отвергаться в научном сообществе.
        Формально можно в модель ввести и предположение, что разные виды млекопитающих произошли от принципиально разных предков, а потом исследовать это предположение на белках молока.
        Ответить
        • feb7 > dasem | 22.05.2010 | 02:24 Ответить
          Да ну? Вот тут-то Вы галиматью и написали. Начиная с навешивания ярлыка "галиматья" - без доказательств и анализа, просто галиматья и все тут.
          А что касается Вашего примера о происхождении разных видов млекопитающих от разных предков - плиз, выдвигайте такую гипотезу, ради научного интереса, и исследуйте ее. Если получится - Вы великий гений. Если Ваша гипотеза рассыпется и Вы сами в этом убедитесь - ничего страшного, в науке отрицательный результат - тоже результат.
          Только умоляю - без ярлыков! А то Вы мне смешно делаете.
          Ответить
          • dasem > feb7 | 22.05.2010 | 11:48 Ответить
            Прошу, найдите хотя бы 10 человек, которые бы считали, что гипотеза о происхождении от общего предка могла бы рассыпаться в результате подобного "моделирования". Представьте, что модель дала такой результат, это вызовет скорее вопросы к модели и результату, чем к опровергаемой гипотезе.
            Сама постановка задачи не подразумевает возможность опровержения гипотезы, а значит и никак не увеличивает ее правдоподобия. (Необходимую ссылку на Пойя я уже привел). Можно еще и Поппера упомянуть с его (видимо, на Ваш згляд устаревшими) представлениями о логике научного познания.
            По поводу происхождения от разных предков была статья утверждавшая, что генетический код является продуктом конвергенции двух примитивных кодов. Очевидно, это утверждение нельзя ни опровергнуть, ни доказать через сравнение белковых последовательностей. Конечно, конвергенция кодов это плохо обоснованная работа, но есть пример лучше: существование митохондрий и хлоропластов. У эокариот два разных предка, ну и как это повлияло на результаты модели?
            Ответить
            • feb7 > dasem | 22.05.2010 | 13:55 Ответить
              Давайте все-таки придерживаться научной методологии. Нельзя решать, правдоподобна гипотеза или нет, на основании единственного факта, или путем опроса населения. Гипотеза должна удовлетворять всем имеющимся фактам, кроме того, она должна предсказывать новые.

              Ваша гипотеза о происхождении разных видов млекопитающихся от разных предков, может и устоит против единственного факта, но как быть с другими фактами? Вы их не хуже меня знаете, а может, и лучше.

              Все эти факты пока подтверждают, что ТЭ соответствует положению дел в природе. Пожалуйста, представляйте факт, который нельзя истолковать в рамках ТЭ - и ТЭ окажется на полке истории науки рядом с теплородом и "боязнью пустоты", а Вы - великим гением и родоначальником новой биологической науки.

              Пока такого факта нет - увы, все вопли креационистов о том, что ТЭ неправильна, потому что им не нравится - так воплями и останутся.
              Ответить
              • dasem > feb7 | 24.05.2010 | 10:12 Ответить
                Происхождение от общего предка--конвенциональная гипотеза. И это не ругательство. Способов всерьез опровергнуть ее не предложено, но это и не значит, что ее можно укрепить имитацией рассчетов. Еще раз повторю: если бы у автора статьи в результате рассчетов выходило опровержение гипотезы происхождения от общего предка, то вопросы были бы к модели, а не к гипотезе.
                По сути, предложенный рассчет не отличается от "Доказательства через опровержение" предлагаемого в "Молоте ведьм", когда доказательством считается опровержение заведомо слабых, искусственных конкурирующих гипотез.
                Тема креацианизма и опровержения ТЭ тут просто не при чем.
                А вот про предсказание новых фактов, это очень уместное замечание: какие новые факты объяснены или предсказаны конкретно этой моделью?
                Ответить
Написать комментарий


Элементы

© 2005-2017 «Элементы»