Размер геномов в ходе эволюции жизни на Земле увеличивался ускоренными темпами

У кукурузы генов в два раза больше, чем у человека, а у червяка — примерно столько же. Объяснить этот феномен ученые пока не могут. Рисунок с сайта bio.fizteh.ru
Число генов у кукурузы в два раза превышает число генов у человека, а у червяка примерно такое же, как у человека. Объяснить этот феномен ученые пока не могут. Рисунок с сайта bio.fizteh.ru

Российские ученые на основе продуманной методики доказали, что рост размеров генома связан с увеличением сложности организмов в ходе эволюции. Этот, казалось бы, очевидный вывод до сих пор не поддавался статистическому доказательству. Однако, как показали американские специалисты, этот рост не удается объяснить с помощью существующих популяционных моделей дрейфа генов и накопления случайных мутаций.

Диапазон изменчивости размеров генома огромен: он составляет почти 7 порядков — от внутриклеточных бактерий с геномами в 150–200 тысяч пар нуклеотидов до некоторых амеб с их 700 млрд пар нуклеотидов. Казалось бы, увеличение сложности генома должно быть связано со сложностью морфологической организации. Бактерии просты — им и простого генома хватает, а чтобы управлять развитием сложного животного, требуется более сложная генетическая «программа».

Но, как ни удивительно, подтвердить это предположение не удавалось (см. C-value enigma). Берем ли мы безвыборочный массив видов или выбираем отдельные филогенетические линии, не удается статистически подтвердить связь между размером геномов и уровнем организации. Например, сходные в морфофизиологическом смысле виды злаков имеют 20-кратный разброс в размерах генома. В то же время у человека геном примерно в 40 раз меньше, чем у двоякодышащей рыбы Protopterus aethiopicus (см.: Comparison of different genome sizes).

Это противоречие можно разрешить двумя способами. Первый — доказать, что причины отсутствия, казалось бы, очевидной корреляции носят искусственный характер, то есть связаны с методическими просчетами. Второй путь — доказать, что указанной связи действительно нет, и предложить другую содержательную причину изменений размера генома в ходе эволюции. В текущей научной литературе появилось два сообщения, помогающих разобраться в этой проблеме.

Одно из них предлагает новый методический подход к оценке связи размера генома и сложности организации (или уровня эволюционного развития). Этот подход был разработан группой российских специалистов под руководством А. В. Маркова из Палеонтологического института (Москва) и опубликован в «Палеонтологическом журнале». Другое, опубликованное в PLoS Genetics, позволяет понять, насколько далеко продвинулись ученые, выбравшие второй путь.

Марков с коллегами показали наличие связи между уровнем организации и минимальным размером генома представителей этого уровня — но не для всех живых организмов в целом, а только для одной эволюционной линии, ведущей от прокариот к млекопитающим. В этой эволюционной линии тенденция к росту сложности организма (отнюдь не являющаяся всеобщим эволюционным законом) проявилась наиболее ярко. Специфика этого исследования в том, что в качестве меры размера генома в той или иной группе организмов использован минимальный геном, а не диапазон, не средние величины и не случайные виды. При этом внутриклеточные паразиты не рассматривались, так как они вовсю пользуются генами хозяина, экономя собственные ресурсы. Именно минимальный геном в большой группе организмов может помочь приблизительно оценить объем необходимой (неизбыточной) генетической информации, обеспечивающей существование представителей таксона. Более точную оценку получить трудно, поскольку нет абсолютно надежных способов отличить действительно ненужные участки ДНК от функционально значимых (например, от некодирующих последовательностей, выполняющих регуляторные функции).

Кроме минимального генома для каждого эволюционного уровня учитывалось также примерное время появления данной группы организмов (см. таблицу).

Уровень организации Минимальный геном (млн пар нуклеотидов) Примерное время появления (млн лет назад) Вид — обладатель самого маленького генома (кроме внутриклеточных паразитов)
1. Всё живое 1,3 4000 Морская свободноживущая бактерия Pelagibacter ubique, штамм HTCC1062
2. Эукариоты 9,2 2000 Сумчатый гриб Ashbya gossypii — обладатель самого маленького генома среди свободноживущих эукариот
3. Животные (Metazoa) 19,6 1250 Нематода Pratylenchus coffeae
4. Хордовые 68,6 575 Аппендикулярия Oikopleura dioica, представитель подтипа Tunicata (оболочники) типа хордовых
5. Позвоночные 342 540 Костная рыба Tetraodon fluviatilis
6. Тетраподы 931 375 Лягушка Limnodynastes ornatus
7. Амниоты 951 315 Фазан Phasianus colchicus
8. Млекопитающие 1695 220 Летучая мышь Miniopterus schreibersi
9. Приматы 2215 65 Обезьяна-прыгун Callicebus torquatus

Ученые подобрали функции (размер генома в зависимости от времени появления), наилучшим образом аппроксимирующие эти данные. Получилось, что эту зависимость лучше всего описывает гиперэкспоненциальная функция, то есть степенная экспонента; немного хуже — экспонента (см. рис. 1).

Рис. 1. Зависимость минимального размера генома от времени появления группы организмов. По оси абсцисс отложено время появления, а по оси ординат — минимальный размер генома. Рисунок из обсуждаемой статьи в «Палеонтологическом журнале»
Рис. 1. Зависимость минимального размера генома от времени появления группы организмов. По оси абсцисс отложено время появления, а по оси ординат — минимальный размер генома. Рисунок из обсуждаемой статьи в «Палеонтологическом журнале»

Гиперэкспоненциальный рост свидетельствует о том, что увеличение генома — это самоускоряющийся процесс. Чем больше геном, тем выше темпы роста. Какие процессы лежат в основе этого автокатализа? По предположению ученых, одним из источников увеличения генома может быть формирование новых генов и регуляторных участков путем дупликации и перекомбинирования имеющихся функциональных участков. Большое число генов допускает и больший набор возможных перекомбинаций их участков, и эта функция, очевидно, не прямая, а степенная. Сложность сама собой порождает рост сложности.

Полученные данные заставляют обратить внимание на следующий факт. Самый резкий скачок в увеличении минимального размера генома зафиксирован в позднем докембрии и раннем палеозое (600–540 млн лет назад), а максимальные темпы роста биоразнообразия, то есть сложность более высоких иерархических уровней жизни, были достигнуты много позже — в конце мезозоя и в кайнозое (начиная примерно со 100 млн лет назад). Не исключено, что рост генома в какой-то мере способствовал росту биоразнообразия, предоставив дополнительные степени свободы для генетических комбинаций (хотя необходимо помнить, что взрывной рост разнообразия в мезозое и кайнозое происходил в основном за счет сравнительно просто устроенных животных, таких как моллюски и насекомые, и в меньшей степени за счет костистых рыб, птиц и млекопитающих). Это расхождение должно заинтересовать будущих исследователей.

Таким образом, если осмысленно подходить к выбору ряда усложняющихся форм и оценкам размера геномов, то удается не только подтвердить связь между сложностью организации и геномом, но и увидеть черты самоускоряющегося процесса. Это, безусловно, макроэволюционный масштаб преобразований. При этом в пределах каждого таксона рост генома может и не выявляться, и даже его вовсе может и не быть. Так, в эволюции птиц и прокариот преобладающей тенденцией, по-видимому, было уменьшение, а не увеличение размера генома.

Во второй статье американские ученые из Университета Райса (Хьюстон) и Калифорнийского университета в Риверсайде попытались отследить микроэволюционные процессы, регулирующие рост генома. В данном случае анализировалась не «необходимая» часть генома, которую можно приблизительно оценить по минимальному размеру генома в пределах большой группы, а весь геном целиком, включая его «факультативную» часть, размер которой может очень сильно варьировать, например, из-за размножения «эгоистических» мобильных элементов и иных повторяющихся последовательностей. Предполагается, что размер генома должен быть связан обратной зависимостью с численностью популяции. В больших популяциях за счет вероятностных процессов слабовредные мутации должны эффективно отсеиваться отбором. Считается, что большинство дупликаций повторяющихся участков ДНК представляют собой как раз слабовредные мутации. Поэтому в больших популяциях отбор должен удерживать геном от разбухания, а в маленьких, напротив, слабовредные дупликации и новые копии мобильных элементов будут накапливаться, увеличивая размер генома.

Проверять эту модель следует с большой осторожностью, так как исследователя поджидают неожиданные статистические трудности. В зависимости от характера ветвления филогенетического древа выборки получаются разные результаты. Если смешать филогенетически далекие и близкие ветви, то получается «средняя температура по больнице»: смешанная выборка демонстрирует якобы прямую зависимость, а каждая отдельная ветвь может характеризоваться обратной зависимостью. Поэтому модели популяционных процессов (микроэволюционных) можно проверять только с учетом влияния филогенетической близости видов животных или растений.

Рис. 2. Набор видов и филогенетическое древо для них с оценками размера генома, использованные американскими учеными. Изображение из обсуждаемой статьи в PLoS Genetics
Рис. 2. Набор видов и филогенетическое древо для них с оценками размера генома, использованные американскими учеными. Изображение из обсуждаемой статьи в PLoS Genetics

На рис. 2 хорошо заметно увеличение размеров генома в ходе эволюции. Является ли размер популяции ведущим фактором этого увеличения? Нет, не является, заключили исследователи. Им не удалось выявить значимую корреляцию между размером популяции и самыми разными характеристиками геномов: числом генов, размером и числом интронов, скоростью дупликации генов, относительным и абсолютным числом транспозонов.

Таким образом, анализируя два исследования, проведенные на противоположных концах света, приходим к заключению, что мы пока не можем (к сожалению!) понять сути геномных процессов, управляющих разрастанием или сжатиемя геномов во времени. Мы только можем зафиксировать явление — рост размеров «необходимой» части генома в некоторых эволюционных линиях, увязанный каким-то непонятным образом с возрастанием сложности морфофизиологической организации, — и констатировать его ускоренный характер. И на каких-то дорожках этого запутанного исследования мы уже можем поставить знак «тупик», чтобы не тратить время и деньги на бесполезные маршруты.

Источники:
1) Kenneth D. Whitney, Theodore Garland, Jr. Did Genetic Drift Drive Increases in Genome Complexity? // PLoS Genetics. 2010. 6(8): e1001080. Doi:10.1371/journal.pgen.1001080.
2) A. В. Марков, В. А. Анисимов, А. В. Коротаев. Взаимосвязь размера генома и сложности организма в эволюционном ряду от прокариот к млекопитающим // Палеонтологический журнал. №4, 2010. Стр. 3–14. Полный текст — PDF, 207 Кб.

Елена Наймарк


45
Показать комментарии (45)
Свернуть комментарии (45)

  • UNV  | 20.10.2010 | 23:48 Ответить
    Гиперэкспонента - это e^e^x?

    Интересно, как объясняется такая двойная экспонента. Одна экспонента могла бы означать, что чем больше геном, тем больше в нём генов дуплицируется со временем. А вот вторая? Возможно, вторая обуславливается ускорением самой эволюции?

    Была как-то на элементах статья, где утверждалось, что продолжительность жизни крупных таксонов увеличивалась со временем - т.е. каждая новая группа организмов была всё более гибкой в области приспособления к условиям обитания, т.е. эволюционировала быстрее и занимала больше экологических ниш, соответственно с меньшей вероятностью вымирала.
    Ответить
    • Combinator > UNV | 21.10.2010 | 09:42 Ответить
      > Гиперэкспонента - это e^e^x?

      Да.

      Вторая экспонента, возможно, получается потому, что в слабоизбыточном геноме подсистема управления экспрессией генов растёт при росте количества генов не линейно, а более быстрыми темпами (ведь количество возможных межгенетических связей пропорционально N^2). А в сильноизбыточных геномах зависимость просто макскиируется тем, что превалирует рост генома, связанный с размножением эгоистических генетических элементов.
      Ответить
  • MayDay  | 21.10.2010 | 12:23 Ответить
    А по-моему там две экспоненты. Одна до 500 млн, другая после. Причем в 500 разрыв, что было отмечено в статье - "резкий скачок в увеличении минимального размера генома зафиксирован в позднем докембрии и раннем палеозое (600–540 млн лет назад)".
    Как говорится, "экспонента - самая естественная зависимость".
    У первой экспоненты период T = 1600 млн лет, у второй T = 250 млн лет.
    F=Fo*exp(t/T)
    Ответить
    • Александр Марков > MayDay | 21.10.2010 | 13:02 Ответить
      Да, похоже. Аналогичная история, кстати, и с ростом народонаселения мира: если издали глядеть, вроде единая гипербола, а если присмотреться к деталям - похоже на последовательность из нескольких гипербол.
      Ответить
      • TUser > Александр Марков | 22.10.2010 | 07:04 Ответить
        Тоже, имхо, там две экспоненты.

        Но, собственно, угадать зависимость из корреляционных графиков - это толково можно сделать только если линии ложатся прямо вот совсем на линию. Как, например, в современной диаграмме Хаббла скорость-расстояние. А когда точки разбросаны, как тут или на диаграмме, которой пользовался сам Хаббл, то можно угадать, а можно и нет. Вы же выбираете по сути из всего разнообразия функций, ограниченного только человеческой фантазией. Вот если бы из каких-то иных (не связанных с этими графиками) соображений у нас было две, допустим, теории, которые предсказывают разные зависимости, то тогда - можно сказать, какая лучше описывает наблюдения.
        Ответить
        • MayDay > TUser | 22.10.2010 | 11:03 Ответить
          Есть такая партия! Тьфу, теория. Это теория кембрийского взрыва. Правда, здесь скорее четкий вопрос, чем ответ.
          А что касается "точки точно легли", то амниоты сделали выброс на функции и точная плавная аппроксимация невозможна. Кроме того, не представлена ошибка данных (доверительный интервал), что является распространенной ошибкой ученых не физиков.
          Ответить
          • TUser > MayDay | 22.10.2010 | 12:23 Ответить
            Ну, я не палеонтолог, но имхо ...

            Кембрийский или какой еще взрыв - событие все-таки одномоментное. А тут речь о периоде - на протяжении такого-о (длительного) времени эволция шла так, что скорость появления принципиально важных особенностей, ароморфозов (=скорость роста минимального генома) подчинялась такой-то закономерности. то есть речь не про излом на кривой (предположим, что он на приведенном графике есть), а про особенности длительного периода.

            Тем более, что тут ведь речь не о каких угодно теориях, а именно о количественных. Качественно тут - монотонно возрастающая функция и все. А вот экспонента она или еще что - это уже вопрос количественный. Я имел ввиду, что если есть две теории, одна, допустим, предсказывает экспоненту, а другая, скажем, e^e^x, то можно вычислить, с какой теорией лучше согласуется наблюдение. Но для этого теории должны давать четкое количественное предсказание, иначе никак. А вот ответить на вопрос - какая это функция, exp, log или какой-нибудь арксинус - только по данным измерений, не имея априорных предположений по этому поводу, - вот этого сделать в общем случае нельзя. Скажем, по данному графику я бы не стал ставить свои деньги на то, что там две экспоненты или еще что-то.
            Ответить
            • MayDay > TUser | 22.10.2010 | 15:16 Ответить
              Кембрийский взрыв это событие одномоментное? Даже в геологическом масштабе кембрий - это период в пятьдесят миллионов лет.
              После самого сильного оледенения, приведшего к вымиранию огромного числа докембрийских организмов произошло интенсивное видообразование. Во времена Дарвина даже считалось, что до Кембрия жизни вообще не было, что было серьезным испытанием для теории эволюции.
              Ответить
              • TUser > MayDay | 22.10.2010 | 16:12 Ответить
                По сравнению с 500 млн - да.
                Ответить
        • Александр Марков > TUser | 22.10.2010 | 11:50 Ответить
          рост народонаселения все-таки гораздо лучше описывается гиперболой: http://macroevolution.narod.ru/korotayev.htm
          Как раз и есть две теории: одна предсказывает, что скорость роста пропорциональна численности населения (размеру генома), вторая - что квадрату численности. См: http://evolbiol.ru/markov_korotayev.htm
          Ответить
          • TUser > Александр Марков | 22.10.2010 | 12:49 Ответить
            Дык, ведь ни одна из этих двух теорий не дает e^e^x .
            Ответить
            • Александр Марков > TUser | 22.10.2010 | 13:54 Ответить
              А это ведь динамика, промежуточная между экпоненциальной и гиперболической. Там у нас в полном тексте это обсуждается. Видимо, часть факторов способствуют экспоненциальному росту, часть - гиперболическому, а на выходе получается нечто промежуточное.
              Ответить
              • TUser > Александр Марков | 22.10.2010 | 16:13 Ответить
                e^e^x - промежуточная??? Да вы что?
                Ответить
                • Марков Александр > TUser | 23.10.2010 | 09:27 Ответить
                  Вы могли бы прочитать полный текст статьи (ссылка есть в конце заметки), прежде чем возмущаться. Там все объясняется. Да, промежуточная. Эксп.: dx/dt ~ kx; гиперэксп: kxln(x); гипербол.: kx^2. За сим откланиваюсь: нет больше времени дискутировать.
                  Ответить
            • MayDay > TUser | 22.10.2010 | 15:12 Ответить
              Мне представляется, что "гиперэкспоненциальная" это всего лишь сверхэкспоненциальная. Автор говорит о том, что рост идет быстрее, чем по экспоненте. В математике нет такой функции, насколько я знаю.
              А exp(exp(t)) растет быстрее, чем на рисунке. И вообще, это неестественная функция.
              Экспонента - это естественная функция для системы с положительной обратной связью. Рост функции пропорционален величине функции.
              Для систем с отрицательной обратной связью характерна константа (с наложенной синусоидой).
              Ответить
              • TUser > MayDay | 22.10.2010 | 16:05 Ответить
                Ну функция Аккермана всяко быстрее. Гамма опять-же.
                Ответить
                • TUser > TUser | 22.10.2010 | 16:10 Ответить
                  Собственно,возьмите любую функцию, возведитеее в квадрат, - будет расти быстрее.
                  Ответить
                  • TUser > TUser | 22.10.2010 | 16:10 Ответить
                    Любую, стремящуюся к плюс бесконечности.
                    Ответить
                    • SayHello > TUser | 23.10.2010 | 00:52 Ответить
                      Если экспоненту возвести в квадрат, получится другая, но тоже экспонента :)
                      Ответить
          • MayDay > Александр Марков | 22.10.2010 | 15:09 Ответить
            Господь с Вами! N=n/(2027-t)
            А что будет после 2027 года? После катастрофы с бесконечностями население будет отрицательным.
            Извините за непарламентское выражение, но с прискорбием вынужден Вам заявить, что это полная чушь.
            Ответить
            • Александр Марков > MayDay | 22.10.2010 | 16:04 Ответить
              Вы просто не знакомы с темой, извините. Про то, что гиперболический рост не может продолжаться дальше определенного момента, про механизмы неизбежного выхода из режима с обострением, про так называемый "демографический переход" есть огромная литература. Гиперболический рост по этой формуле закончился уже в 1960-е годы, началось замедление, и достаточно хорошо известно, почему. Но до этого момента он очень долго следовал по гиперболической траектории с большой точностью.
              Ответить
              • MayDay > Александр Марков | 22.10.2010 | 22:16 Ответить
                Не поленился - нашел данные. На Википедии "Закон гиперболического роста численности населения Земли" файл "Population curve.svg" Data
                В Excel построил данные и аппроксимацию N(млн)= 344000/(2027-t) из условия совпадения численности в начале эры. Построил отношение данных с аппроксимацией. Теоретически должна быть константа = 1. Увы этого не наблюдается. До нашей эры коэффициент от 0,1 до 0,5 и далее к 1,2.
                В нашей эре прыгает от 1 до 0,5.
                Ответить
                • Марков Александр > MayDay | 23.10.2010 | 09:37 Ответить
                  Кажется, ситуация такая: вы впервые в жизни услышали о законе гиперболического роста населения, сначала сказали, что я несу чушь, а потом нашли в википедии этот закон и решили его с ходу опровергнуть? На мой взгляд, это довольно странные реакции для комментатора научно-популярной новости. Если вы действительно можете опровергнуть эту закономерность, вам следует срочно (пока не опередили) написать об этом статью и подать в хороший международный журнал. Это будет достаточно громкая сенсация в макросоциологии.
                  У меня, к сож., больше нет времени дискутировать в этом формате.
                  Ответить
                  • MayDay > Марков Александр | 23.10.2010 | 10:13 Ответить
                    Нормальная реакция для науки - критическое восприятие информации. Иное называется религия. График, представленный в линейном масштабе для функции, изменяющейся на три порядка рефлекторно просит проверки или перестроения.
                    По поводу точности гиперболы скажем так. Точность представления от 0,1 до 1,2 в демографии считается достаточной. Ничего страшного. Например, в химической кинетике знание констант реакций с точностью до порядка в ряде случаев оказывается достаточной.

                    Для интервала 0-1950 года наилучшим приближением будет N=3.5E11*(1-2.17E-4*t)/(2027-t). Это дает ошибку в 7% по сравнению с чисто гиперболическими 18%. Уточнение в 2,5 раза!
                    Впрочем, для интервала 1900-2008 год лучшее соответствие дает экспоненциальный рост с основанием 2 с периодом 50 лет по подзабытому Мальтусу. Ошибка по Мальтусу всего 3.2% по сравнению с 23% по гиперболе. (Несмотря на затык в 5 млрд для данных с 1974 по 1990 год.)
                    Ответить
    • Combinator > MayDay | 22.10.2010 | 12:42 Ответить
      Да, теория с двумя экспонентами мне тоже нравится. По крайней мере, визуально, очень на то похоже. В принципе, её можно проверить и статистически. Экспонента это двухпараметрическая функция, и если график разделить на две части (4 и 5 точек соответственно), то можно прикинуть коэффициенты корреляции для обоих частей. Если, положим, оба они окажутся на порядок лучше, чем для любой трёхпараметрической модели, то это будет веским доводам за вариант с двумя экспонентами.
      Ответить
      • MayDay > Combinator | 22.10.2010 | 15:20 Ответить
        "если график разделить на две части (4 и 5 точек соответственно), то можно прикинуть коэффициенты корреляции для обоих частей"
        Я так и сделал. Обратите внимание, указаны периоды экспоненты. Среднеквадратичное отклонение значительно меньше, чем у кривой в статье.

        Почему бы было не попросить профессионального математика или физика обработать данные профессионально?
        Это ни в коей мере не упрек, а предложение на будущее.
        Ответить
        • Combinator > MayDay | 22.10.2010 | 15:40 Ответить
          Ну, периоды экспонент, в принципе, видны и "на глазок".
          Я сам по образованию физик. Для общепринятого в физике представления данных нужны, прежде всего, погрешности измерений, а их в данном случае определить довольно затруднительно даже не столько из-за неточности датировок, сколько из-за больших неоднозначностей в интерпретации отпечатков, особенно, в докембрийскую эпоху...
          Ответить
          • hongma > Combinator | 22.10.2010 | 22:39 Ответить
            Во-первых, здесь вообще не нужны никакие погрешности :) Точнее, они формально могут повысить точность аппроксимации, если для каждой точки учесть ее статистический вес. Но на практике это не всегда нужно. Просто "хорошие" точки, с высокой точностью, будут учитываться наравне с "плохими". Если точек достаточно много и их качество не слишком сильно различается - работа себя не оправдывает.
            Во-вторых, показанные точки вполне можно аппроксимировать просто двумя экспонентами :)))) На данном графике это будет выглядеть как кусочно-линейная аппроксимация.
            Ответить
            • Combinator > hongma | 23.10.2010 | 13:58 Ответить
              > Если точек достаточно много и их качество не слишком сильно
              > различается - работа себя не оправдывает.

              Как раз таки в данном случае точность определения координат точек в левой и правой частях графика различается на порядок.

              > Во-вторых, показанные точки вполне можно аппроксимировать просто
              > двумя экспонентами :)))) На данном графике это будет выглядеть как
              > кусочно-линейная аппроксимация.

              Да, можно. Это уже обсуждалось выше.
              Ответить
              • MayDay > Combinator | 23.10.2010 | 15:25 Ответить
                Еще одно уточнение. Лучшая аппроксимация получается при использовании полинома четвертой степени для зависимости t от Lg(МРГ) [аргумент и функция поменялись местами], а не кусочно-экспоненциальная. Дело не в казуистической погоне за процентами отклонения.
                Если бы скачок происходил от внешних причин (падение метеорита с изменением механизма увеличения МРГ и т.п.), то функция не "чувствовала" скачок заранее. Между тем, на функции есть загиб кверху относительно прямой (четвертая точка). То же относится и к верхней части. Такое ощущение, что имеет место S-образная зависимость с гистерезисом в районе 550 млн лет. То есть скачок произошел под влиянием внутренних причин саморазвития системы.
                Конечно, малое число точек делает это предположение шатким.
                Ответить
  • vitus  | 28.10.2010 | 09:21 Ответить
    Очередное изучение влияния мочи на солнечные лучи...
    А давайте может быть еще потратим денег на то, чтобы доказать, что компьютеры и алгоритмы обработки информации с увеличением сложности тоже обязательно должны увеличиваться в размерах? ... Я не удивлюсь, если А.Марков предложить вычислительную мощность в килограммах измерять... Килограммы удобнее чем флопсы, верно?
    Ответить
    • Combinator > vitus | 28.10.2010 | 10:17 Ответить
      Алгоритмы (и программы) обработки информации как раз увеличиваются в размерах при переходе к решению более сложных задач. Что касается компьютеров, то их размеры не увеличиваются (и даже уменьшаются) лишь потому, что этот эффект перебивается постоянно совершенствующейся (миниатюризирующейся) аппаратной базой. Алгоритмы жизни "пишутся" на одной и той же аппаратной базе - ДНК, которая не меняется уже как минимум 3.5 миллиарда лет.
      Ответить
      • vitus > Combinator | 28.10.2010 | 17:08 Ответить
        Что касается компьютеров, то их размеры не увеличиваются (и даже уменьшаются) лишь потому, что этот эффект перебивается постоянно совершенствующейся (миниатюризирующейся) аппаратной базой
        \\\
        Это верно.

        Алгоритмы (и программы) обработки информации как раз увеличиваются в размерах при переходе к решению более сложных задач.
        \\\
        А это неверно. Я даже не могу сходу сказать какой объем экономится оптимизацией кода... Представьте какой объем занимали бы программы на Вашем диске, если бы Билли не пользовался бы библиотеками? Или, например, представьте себе часовой фильм, который занимает не 700 мб, а 64 кб... Ну, или возьмите работу современных кодеков, которые уменьшают объем видео в разы без потери качества...
        Глядя на две программы, содержащих одинаковое количество символов, никогда невозможно сказать какая из них сложнее. Также, наверно, никогда нельзя однозначно указать предел оптимизации какой-либо конкретной программы...
        Поэтому, говорить о корелляции между сложностью программ и их объемом можно только соблюдая множество дополнительных условий.
        Ответить
        • Combinator > vitus | 28.10.2010 | 17:30 Ответить
          Я Вам скажу как програмист, как не оптимизируй код, программа, скажем, распознающая рукописный текст, никогда не будет меньше программы вычисления длины гипотенузы прямоугольного треугольника по известным катетам. А библиотеки Билли при прочих равных усложняют одинаковым образом обе программы, так что, они, в данном случае, абсолютно не при чём.

          P.S.
          Что касается методики объективного измерения сложности живых организмов, то даже оставив в стороне формальные критерии типа количества в организме клеток различной морфологии, исходя просто из чисто интуитивных соображений вряд ли Вы будуте спорить, что млекопитающие сложнее бактерий.
          Ответить
          • vitus > Combinator | 28.10.2010 | 18:16 Ответить
            Я Вам скажу как програмист, как не оптимизируй код, программа, скажем, распознающая рукописный текст, никогда не будет меньше программы вычисления длины гипотенузы прямоугольного треугольника по известным катетам.
            \\\
            Если Марков сравнивает представителей одного таксона, тогда и Вы пишите о сравнении OCR разных производителей, например, а не то, что Вы пишете...

            А библиотеки Билли при прочих равных усложняют одинаковым образом обе программы, так что, они, в данном случае, абсолютно не при чём.
            \\\
            Вы утверждаете, что например, если сравнить объем 10000 программ пользующихся одной библиотекой с программами, решающими те же задачи, но не использующие библиотек, то суммарный объем этих программ будет приблизительно одинаков?

            P.S. Что касается методики объективного измерения сложности живых организмов, то даже оставив в стороне формальные критерии типа количества в организме клеток различной морфологии, исходя просто из чисто интуитивных соображений вряд ли Вы будуте спорить, что млекопитающие сложнее бактерий.
            \\\
            чуть позже отвечу...
            Ответить
            • Combinator > vitus | 28.10.2010 | 18:26 Ответить
              \\\ Если Марков сравнивает представителей одного таксона, тогда и Вы пишите о сравнении OCR разных производителей, например, а не то, что Вы пишете...

              В статье как раз сравниваются разные таксоны, а отнюдь не виды.

              \\\ Вы утверждаете, что например, если сравнить объем 10000 программ пользующихся одной библиотекой с программами, решающими те же задачи, но не использующие библиотек, то суммарный объем этих программ будет приблизительно одинаков?

              Нет, я этого не утверждаю.
              Ответить
              • vitus > Combinator | 28.10.2010 | 18:52 Ответить
                В статье как раз сравниваются разные таксоны, а отнюдь не виды.
                \\\
                Разве я писал "вид"? Я имел ввиду сравнение представителей в пределах одного царства... хотя, да, пример с разными производителями OCR не самый удачный. Согласен.

                Ладно. Прошу таймаут до вечера. Если Вас удовлетворит, пока могу тезисно:
                1. Вырожденность кода.
                2. Сравнение фузионных и изолирующих естественных языков.
                3.Эволюция методов разложения числа на множители.

                Вывод: книги на килограммы скупают только на растопку, но редко для чтения.
                Ответить
                • Combinator > vitus | 28.10.2010 | 19:40 Ответить
                  \\\Если Вас удовлетворит, пока могу тезисно: 1. Вырожденность кода. 2. Сравнение фузионных и изолирующих естественных языков. 3.Эволюция методов разложения числа на множители.

                  Не понимаю, какое отношение вырожденность генкода (кстати, у эукариот большая часть ДНК вообще не кодирует никаких белков), не говоря уже про остальные пункты, имеет к обсуждаемлй теме.

                  \\Вывод: книги на килограммы скупают только на растопку, но редко для чтения.

                  А что конкретно Вы в данном контексте понимаете под "скупкой книг на килограммы"? Если пользоваться Вашей аналогией, то в статье утверждается примерно следующее - что бы, условно говоря, получить начальное образование, нужно прочесть не менее 10 книг, а, скажем, для законченного среднего не менее 100 (естественно, цифры сугубо условны). При этом, конечно, даже прочтение 1000 комиксов отнюдь не гарантирует достижения даже уровня начального образования. С чем конкретно Вы здесь не согласны?
                  Ответить
                  • vitus > Combinator | 29.10.2010 | 00:59 Ответить
                    Почему Вы обошли вниманием факторизацию? На мой взгляд, именно здесь мы могли бы достичь взаимопонимания.Почему метод перебора потребовал усовершенствования? Зачем вообще понадобилось создание теории сложности вычислений?

                    При этом, конечно, даже прочтение 1000 комиксов отнюдь не гарантирует достижения даже уровня начального образования.

                    Вот и я об этом! В статье ведь ни полсловечка о том считаем ли мы прочтенные комиксы или какие-то другие книги. Нам все равно ведь, мы оцениваем их килограммами (в Вашем примере количеством экземпляров сооцвецно).

                    Не понимаю, какое отношение вырожденность генкода...

                    Я писал "код", а не "генкод"!^_^

                    В конце-концов, простейший пример: когда вкладывая один цикл в другой мы получаем экономию объема равную количеству итераций при неизменной сложности. При i=10, алгоритм с тремя вложенными циклами, выполняющий в три раза больше операций, бутет содержать в 111 раз меньше символов, чем алгоритм без вложений.
                    Ответить
                    • Combinator > vitus | 29.10.2010 | 01:35 Ответить
                      // Почему Вы обошли вниманием факторизацию? На мой взгляд, именно здесь мы могли бы достичь взаимопонимания.Почему метод перебора потребовал усовершенствования? Зачем вообще понадобилось создание теории сложности вычислений?

                      Честно говоря, меня никогда особо не интересовала теория алгоритмов (суха теория, мой друг...). Судя по моему опыту, переборные задачи прекрасно решаются методом Монте-Карло. Конечно, в большинстве случаев он не даёт абсолютно оптимального решения, но этого, чаще всего, и не требуется. В 99% случаев достаточно найти просто ДОСТАТОЧНО оптимальное решение.

                      //В статье ведь ни полсловечка о том считаем ли мы прочтенные комиксы или какие-то другие книги. Нам все равно ведь, мы оцениваем их килограммами (в Вашем примере количеством экземпляров сооцвецно).

                      Во-первых, не килограммами, а количеством символов.
                      Во-вторых, чётко отличить комиксы от курса высшей алгебры на уровне генома современная наука попросу не может. Условно говоря, мы видим лишь обложки книг. Тем не менее, это не мешает нам сделать вывод, что, например, прочитав миллион символов человек МОЖЕТ стать академиком, а прочитав тысячу символов он им стать никак не может. Об этом, собственно, и статья.

                      //Я писал "код", а не "генкод"!

                      Тогда, согласитесь, это вообще абстрактная фраза вне контекста (сферический конь в вакууме). Если Вы имели в виду избыточность большинства реальных систем кодирования, то к теме статьи это не относится. Там имеется в виду отнюдь не шенноновская и не колмогоровская "сложность".

                      // В конце-концов, простейший пример: когда вкладывая один цикл в другой мы получаем экономию объема равную количеству итераций при неизменной сложности. При i=10, алгоритм с тремя вложенными циклами, выполняющий в три раза больше операций, бутет содержать в 111 раз меньше символов, чем алгоритм без вложений.

                      Да, конечно, но при чём тут обсуждаемая статья?
                      Ответить
                      • vitus > Combinator | 30.10.2010 | 19:19 Ответить
                        Честно говоря, меня никогда особо не интересовала теория алгоритмов \\\
                        Вы подменяете задачу. И вместо того, чтобы объяснить почему эволюционировал метод перебора, объясняете почему Вам это не интересно. Хотя ничего сложного в этом нет. Эволюция происходила из-за того, что вычислительные ресурсы людей ограничены. И они не идут ни в какое сравнение с ресурсами, имеющимися у каждой отдельно взятой клетки, не говоря уже о виде в целом...

                        (суха теория, мой друг...)\\\
                        Честно говоря, никак не могу определиться по поводу Гете. Как думаете он очень, очень тонкий, тончайший тролль или таки настолько же болван, насколько у него получается им казаться?

                        Тем не менее, это не мешает нам сделать вывод, что, например, прочитав миллион символов человек МОЖЕТ стать академиком, а прочитав тысячу символов он им стать никак не может. Об этом, собственно, и статья.
                        \\\
                        Неверно. Поэтому я и просил Вас сравнить фузионные и изолирующие языки. Если Вы будете считать триплеты символами генетического кода, то на мой взгляд, бы будете совершать ошибку.
                        Корелляция между сложностью организма и объемом кода отсутствует. Сравнительно простой организм может иметь огромный код, а сложный может иметь код намного меньший. То, что в линии эукариоты - человек такая зависимость наблюдается - случайность. И эту случайность нельзя распространять на жизнь в целом...она на нее и не распространяется )))

                        Тогда, согласитесь, это вообще абстрактная фраза вне контекста\\\
                        Почему же?... Хотя, ладно, проехали, пускай возрастает не объем, а сложность ответов.

                        Да, конечно, но при чём тут обсуждаемая статья?\\\
                        При том, что пока мы не научимся заглядывать под обложку, нет смысла измерять объем кода.
                        Интуитивно приемлимое правило, говорящее о том, что объем кода обязательно возрастает вместе со сложностью, может работать только до определенных пределов сложности.
                        Ответить
                        • Combinator > vitus | 31.10.2010 | 12:33 Ответить
                          \\То, что в линии эукариоты - человек такая зависимость наблюдается - случайность.

                          В принципе, по теории вероятностей шанс, что наблюдаемая закономерность не случайна, составляет величину примерно в 99.5%. Если Вам такая вероятность кажется недостаточной - имеете полное право так думать.
                          По остальным вопросам (теория алгоритмов, эволюция языков, философская интерпретация Фауста Гёте и т.п.), я не специалист, так что, в дискуссии вступать не рискну.
                          Ответить
                          • vitus > Combinator | 31.10.2010 | 18:39 Ответить
                            То, что в линии эукариоты - человек такая зависимость наблюдается - случайность. В принципе, по теории вероятностей шанс, что наблюдаемая закономерность не случайна, составляет величину примерно в 99.5%.
                            \\\
                            Было бы замечательно если бы Вы поделились пруфом для этой цифири. Собсно, весь наш спор из-за того, что пруфа такого нет...Или из-за того, что мы вкладываем разный смысл в слово "сложность". Аркебуза сложнее арбалета или нет?

                            По остальным вопросам (теория алгоритмов, эволюция языков, философская интерпретация Фауста Гёте и т.п.), я не специалист, так что, в дискуссии вступать не рискну.
                            \\\
                            А чем Вы рискуете? Потерей самоуважения или уважения окружающих? Ну, лично я, каждый раз, когда мне доказывают, что я глуп и чего-то не понимаю, благодарю оппонента за то что он совершил работу, результатом которой может быть мое совершенствование. Мое мнение может быть ошибочным из-за неумения думать, недостаточных или ошибочных оснований. Но не имея мнения или не высказывая его, мы сами себя лишаем шанса исправить ошибки.
                            Кроме того, не стоит забывать, что каждый из нас впервую очередь человек, а то, что кто-то в чем-то специалист - это дело десятое...
                            Ответить
                            • Combinator > vitus | 31.10.2010 | 19:51 Ответить
                              \\Было бы замечательно если бы Вы поделились пруфом для этой цифири. Собсно, весь наш спор из-за того, что пруфа такого нет...

                              Каждая следующав точка графика может быть либо выше, либо ниже предыдущей. Априорная вероятность того, что она случайно окажется выше равна 0.5. Соответственно, вероятность того, что это произойдёт подряд 8 раз равна (0.5)^8= 0.0039. А вероятность того, что эта последовательность неслучайна, равна 1 - 0.0039= 0.9961. Если на пальцах, то как-то так...

                              \\А чем Вы рискуете? Потерей самоуважения или уважения окружающих?

                              Потерей времени.
                              Ответить
  • Alex_V  | 07.11.2010 | 13:29 Ответить
    Не верю. Этот размер генома содержит много мусорной ДНК. Потом, растения все одно много круче человека.
    Ответить
Написать комментарий


Элементы

© 2005-2017 «Элементы»