Почти все человеческие гены кодируют более одного белка

Альтернативный сплайсинг глазами художника. Фермент РНК-полимераза (зеленые комки) ползет в нашу сторону по молекуле ДНК (скрученный тяж) и «считывает» ее, синтезируя молекулу РНК (разноцветная лента). В молекуле РНК интроны показаны серым, экзоны — яркими цветами. Сплайсосома (желтые комки) вырезает из молекулы РНК интроны и сшивает экзоны друг с другом. Первая (ближняя к нам) сплайсосома включила зеленый экзон в состав зрелой мРНК, а вторая (дальняя) собралась его вырезать вместе с двумя прилегающими интронами (в этом и состоит альтернативность сплайсинга в данном случае). Вырезанные фрагменты РНК уплывают вдаль, облепленные разнообразными полупрозрачными РНК-связывающими белками. Рис. © Graham T. Johnson. с сайта www.hhmi.org
Альтернативный сплайсинг глазами художника. Фермент РНК-полимераза (зеленые комки) ползет в нашу сторону по молекуле ДНК (скрученный тяж) и «считывает» ее, синтезируя молекулу РНК (разноцветная лента). В молекуле РНК интроны показаны серым, экзоны — яркими цветами. Сплайсосома (желтые комки) вырезает из молекулы РНК интроны и сшивает экзоны друг с другом. Первая (ближняя к нам) сплайсосома включила зеленый экзон в состав зрелой мРНК, а вторая (дальняя) собралась его вырезать вместе с двумя прилегающими интронами (в этом и состоит альтернативность сплайсинга в данном случае). Вырезанные фрагменты РНК уплывают вдаль, облепленные разнообразными полупрозрачными РНК-связывающими белками. Рис. © Graham T. Johnson. с сайта www.hhmi.org

Альтернативный сплайсинг — механизм редактирования молекул РНК, благодаря которому на основе одного и того же гена организм может синтезировать несколько вариантов (изоформ) белковой молекулы. Анализ 400 млн фрагментов РНК из разных тканей и органов показал, что 94% человеческих генов подвергаются альтернативному сплайсингу, причем в разных тканях производятся разные наборы изоформ. Благодаря альтернативному сплайсингу разнообразие белков в организме млекопитающих значительно выше, чем у низших животных, хотя количество генов у тех и других примерно одинаково.

Две группы ученых из США и Канады независимо друг от друга провели широкомасштабные исследования альтернативного сплайсинга (alternative splicing) у человека и получили сходные результаты. Эти две работы опубликованы 2 ноября в журналах Nature и Nature Genetics. (О том, что такое альтернативный сплайсинг, подробно рассказано в заметке «Сравнение геномов человека и мыши помогло обнаружить новый способ регуляции работы генов», «Элементы», 21.04.2007.)

Обе команды использовали новейшую, чрезвычайно эффективную методику массового анализа молекул РНК, выделенных из клеток (см.: mRNA-Seq). Главный вывод обеих исследовательских групп состоит в том, что альтернативный сплайсинг играет значительно более важную роль в организме млекопитающих, чем предполагалось ранее.

Американская команда, опубликовавшая свои результаты в Nature, получила несколько более детальные данные, чем их канадские коллеги. Исследователи отсеквенировали (определили нуклеотидную последовательность) 400 млн 32-нуклеотидных фрагментов матричных РНК (мРНК) из 10 тканей человеческого организма. Образцы тканей были взяты у анонимных, неродственных между собой мужчины и женщины. Для того чтобы понять, насколько рисунок альтернативного сплайсинга различается у разных индивидуумов, были дополнительно использованы образцы тканей шести неродственных мужчин.

Каждую прочтенную 32-нуклеотидную последовательность попытались «привязать» к человеческому геному, то есть определить то место в геноме, с которого была считана соответствующая молекула РНК. Поскольку в геноме много повторяющихся последовательностей, однозначные привязки удалось получить не для всех, а лишь для 60% прочтенных фрагментов. Еще 4% удалось привязать к местам сшивки экзонов, то есть к тем участкам, в которых во время сплайсинга происходит разрезание РНК, удаление «лишних» участков — интронов — и соединение оставшихся кодирующих участков — экзонов.

Из тех фрагментов, которые удалось привязать к геному, только 1% привязался к интронам или межгенным некодирующим участкам генома. Остальные 99% оказались частями экзонов. Это значит, что подавляющее большинство изученных фрагментов происходят от зрелых (то есть уже прошедших сплайсинг) матричных РНК, из которых интроны были уже вырезаны (методика mRNA-Seq как раз на это и рассчитана).

Этот рисунок показывает (на примере гена SLC25A3, кодирующего белок, который транспортирует фосфат-ионы через мембрану митохондрий), каким образом исследователи определяли, подвергается ли ген альтернативному сплайсингу и одинаково ли идет процесс в разных тканях. Четыре верхних графика показывают количество прочтенных 32-нуклеотидных фрагментов РНК, соответствующих тому или иному участку гена, для четырех тканей (сверху вниз: семенники, печень, скелетные мышцы, сердце). Высота столбиков соответствует количеству прочтенных фрагментов. Те места, где концентрируются высокие столбики, соответствуют экзонам, длинные промежутки между ними — интронам. Участки РНК, вырезаемые при сплайсинге, обозначены пологими дугами. Границы вырезаемых участков определялись по тем 32-нуклеотидным фрагментам РНК, внутри которых обнаружилась точка соединения двух экзонов. Под графиками показаны схемы двух альтернативных вариантов зрелой мРНК. Видно, что в данном случае имеется три безальтернативных экзона (черные прямоугольники), которые обязательно попадают в каждую зрелую мРНК. Кроме того, есть два альтернативных экзона (3A и 3B). В зрелую мРНК может попасть только один из них. При этом в семенниках и печени всегда используется экзон 3B, а в мышцах и сердце почти всегда в зрелую мРНК попадает экзон 3А. Рис. из обсуждаемой статьи в Nature
Этот рисунок показывает (на примере гена SLC25A3, кодирующего белок, который транспортирует фосфат-ионы через мембрану митохондрий), каким образом исследователи определяли, подвергается ли ген альтернативному сплайсингу и одинаково ли идет процесс в разных тканях. Четыре верхних графика показывают количество прочтенных 32-нуклеотидных фрагментов РНК, соответствующих тому или иному участку гена, для четырех тканей (сверху вниз: семенники, печень, скелетные мышцы, сердце). Высота столбиков соответствует количеству прочтенных фрагментов. Те места, где концентрируются высокие столбики, соответствуют экзонам, длинные промежутки между ними — интронам. Участки РНК, вырезаемые при сплайсинге, обозначены пологими дугами. Границы вырезаемых участков определялись по тем 32-нуклеотидным фрагментам РНК, внутри которых обнаружилась точка соединения двух экзонов. Под графиками показаны схемы двух альтернативных вариантов зрелой мРНК. Видно, что в данном случае имеется три безальтернативных экзона (черные прямоугольники), которые обязательно попадают в каждую зрелую мРНК. Кроме того, есть два альтернативных экзона (3A и 3B). В зрелую мРНК может попасть только один из них. При этом в семенниках и печени всегда используется экзон 3B, а в мышцах и сердце почти всегда в зрелую мРНК попадает экзон 3А. Рис. из обсуждаемой статьи в Nature

Самыми важными для выявления альтернативного сплайсинга были, естественно, те 32-нуклеотидные фрагменты РНК, внутри которых оказалась точка сшивки экзонов. Именно по этим фрагментам можно понять, какие участки РНК были вырезаны во время сплайсинга.

Оказалось, что альтернативному сплайсингу подвергается примерно 94% человеческих генов — гораздо больше, чем предполагалось ранее (прежние оценки были в районе 75%). Иногда причиной альтернативного сплайсинга могут быть случайные сбои в работе механизмов, осуществляющих сплайсинг (ключевую роль в нём играют сложные РНК-белковые комплексы — сплайсосомы). В этом случае «альтернативный» вариант зрелой мРНК должен встречаться очень редко по сравнению с «нормальным» вариантом. Однако такое характерно лишь для малой части генов, подвергающихся альтернативному сплайсингу. Даже если отбросить все случаи, когда частота альтернативной изоформы не превышает 15% во всех изученных пробах, всё равно остается 86% генов (от общего числа генов в геноме), у которых альтернативный сплайсинг наверняка не случаен.

Таким образом, почти все человеческие гены кодируют не по одному, а по несколько разных белков. Этот факт сам по себе очень важен, поскольку он позволяет ответить на вопрос, который не давал покоя генетикам с тех самых пор, как был прочтен геном человека. В нашем геноме оказалось всего около 20 000 генов — примерно столько же, сколько у круглого червя Caenorhabditis elegans, который устроен гораздо проще, чем человек. Эксперты этого не ожидали: все были уверены, что в более сложном организме разнообразие белков должно быть выше, чем в простом. Теперь понятно, что так оно и есть, просто разнообразие белков у млекопитающих повысилось не за счет роста числа генов, а за счет развития альтернативного сплайсинга и роста числа изоформ. У C. elegans, по имеющимся оценкам, лишь около 15% генов подвергаются альтернативному сплайсингу.

Очень важно выяснить, насколько различаются белки-изоформы по своим функциям. В принципе можно допустить, что в большинстве случаев альтернативный сплайсинг не оказывает существенного влияния на свойства получающегося белка, и разные изоформы сосуществуют в организме просто потому, что организму безразлично, какая из изоформ будет синтезироваться в тех или иных тканях.

Напрямую определить функции и свойства каждой изоформы — задача на сегодняшний день неподъемная, так что приходится идти окольными путями. Одним из таких путей является анализ тканеспецифичности сплайсинга. Иными словами, нужно выяснить, как распределяются изоформы по органам и тканям — хаотично или упорядоченно. Если свойства альтернативных изоформ примерно одинаковы, то они, скорее всего, будут распределяться по тканям более или менее хаотично. Если же они различны, то организм не может пустить дело на самотек: обязательно должны были развиться системы регуляции альтернативного сплайсинга, которые направляли бы сплайсинг в ту или иную сторону в зависимости от ситуации, то есть от потребностей данного органа или ткани. В этом случае ткани должны резко различаться между собой по набору изоформ белков, подвергающихся альтернативному сплайсингу.

Результаты, полученные американскими исследователями, убедительно свидетельствуют в пользу второй версии. Оказалось, что у большинства генов альтернативный сплайсинг тканеспецифичен: в одних тканях чаще синтезируются одни изоформы, в других — другие. Интересно, что среди генов, сплайсинг которых отличается наиболее строгой тканеспецифичностью (в одних тканях всегда или почти всегда синтезируется только одна изоформа, в других — другая) повышена доля генов — регуляторов индивидуального развития, обмена веществ, межклеточных взаимодействий и передачи сигналов. Это именно те функции, от которых зависят структурные и функциональные различия между тканями. Это говорит о том, что альтернативный сплайсинг, по-видимому, в большинстве случаев имеет функциональное значение и идет под жестким контролем.

Была обнаружена также и индивидуальная вариабельность «рисунка» альтернативного сплайсинга: у разных людей в одних и тех же тканях может быть разное соотношение изоформ. Однако различия между индивидуумами в среднем примерно в 2-3 раза меньше, чем различия между тканями. В ряде случаев, по-видимому, альтернативный сплайсинг может зависеть и от аллельных вариантов. Многие гены в популяции существуют в виде нескольких вариантов (аллелей), и для разных аллелей может быть характерно разное распределение вероятностей производства тех или иных изоформ. Именно этим, скорее всего, и объясняется значительная часть обнаруженных индивидуальных различий (ведь у каждого человека имеется свой уникальный набор аллелей, за исключением однояйцовых близнецов).

Как осуществляется регуляция сплайсинга в разных тканях? По-видимому, ключевую роль в этом играют специализированные регуляторные белки и особые регуляторные последовательности нуклеотидов, расположенные в интронах, прилегающих к альтернативным экзонам. Ранее уже был выявлен ряд белков — регуляторов сплайсинга, а для некоторых из них была показана тканеспецифичная экспрессия. Например, белки — регуляторы сплайсинга FOX-1 и FOX-2 активно синтезируются в клетках мозга, сердца и скелетных мышц. Эти белки распознают участки матричных РНК с последовательностью нуклеотидов UGCAUG и прикрепляются к ним, что, в свою очередь, как-то влияет на работу сплайсосомы. Было также показано, что частота встречаемости этой нуклеотидной последовательности (UGCAUG) резко повышена в интронах, следующих непосредственно за альтернативными экзонами, которые преимущественно включаются в зрелую мРНК как раз в клетках мозга, сердца и мышц. Кроме того, последовательность UGCAUG часто встречается в интронах, предшествующих альтернативным экзонам, которые не используются в перечисленных тканях. Это значит, что если последовательность UGCAUG расположена перед экзоном, белки FOX «приказывают» сплайсосоме вырезать этот экзон, а если она расположена после экзона, белки FOX не позволяют его вырезать.

Эти факты были установлены три года назад. Опираясь на них, авторы предприняли целенаправленный поиск других регуляторных шестинуклеотидных последовательностей в интронах, прилегающих к альтернативным экзонам. Они нашли еще 362 такие последовательности, среди которых есть как известные ранее регуляторы (сайты связывания белков — регуляторов сплайсинга), так и новые. Например, перед альтернативными экзонами, используемыми в коре мозжечка, часто располагаются последовательности UCUCUC и CUCUCU, напоминающие известные ранее сайты связывания белков — регуляторов сплайсинга PTBP1 и PTBP2. По-видимому, реальное разнообразие белков — регуляторов сплайсинга и соответствующих регуляторных нуклеотидных последовательностей значительно выше того, что известно на сегодняшний день.

Для полноты картины остается добавить, что практически все человеческие гены, которые не подвергаются альтернативному сплайсингу (как мы помним, таковых оказалось 6%) — это гены, которые вообще никакому сплайсингу не подвергаются, потому что в них нет интронов. Это заставляет задуматься: а бывает ли вообще у млекопитающих безальтернативный сплайсинг? Несколько в ином свете предстает и роль интронов: их регуляторные функции были известны и раньше, но теперь стало совсем уж очевидно, что интроны тоже, как и экзоны, кодируют инструкции по синтезу белка. Хотя, конечно, до тех пор, пока аналогичные исследования не будут проведены на других видах живых организмов, далеко идущие эволюционные выводы делать рано.

Источники:
1) Eric T. Wang, Rickard Sandberg, Shujun Luo, Irina Khrebtukova, Lu Zhang, Christine Mayr, Stephen F. Kingsmore, Gary P. Schroth, Christopher B. Burge. Alternative isoform regulation in human tissue transcriptomes // Nature. Advance online publication 2 November 2008.
2) Qun Pan, Ofer Shai, Leo J. Lee, Brendan J. Frey, Benjamin J. Blencowe. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing // Nature Genetics. Advance online publication 2 November 2008.

См. также об альтернативном сплайсинге:
1) Сравнение геномов человека и мыши помогло обнаружить новый способ регуляции работы генов, «Элементы», 21.04.2007.
2) Новый механизм генной регуляции без участия белков, «Элементы», 25.05.2007.
3) Прослежена эволюционная история одного из человеческих генов, «Элементы», 17.06.2008.
4) Раскрыта тайна иммунной системы насекомых, «Элементы», 27.06.2006.
5) Развитие нервной системы и иммунитета у насекомых контролируется одним и тем же белком, «Элементы», 19.09.2007.

Александр Марков


18
Показать комментарии (18)
Свернуть комментарии (18)

  • n0isy  | 08.11.2008 | 12:41 Ответить
    Видимо есть ограничение на максимальный информационную емкость днк, поэтому при "создании" человека, пришлось воспользоваться очень хорошим архиватором. А процесс чтения ДНК, включает в себя еще и "разархивирование". Впрочем, это даже выгоднее, потому что в процесс архивации/распаковки можно "зашить" контрольную сумму и возможность исправления ошибок(что, похоже, тоже применяется в организме).
    Может быть стоит подключить к процессу изучения математиков и программистов как раз в этих областях знаний?
    Ответить
    • PavelS > n0isy | 09.11.2008 | 00:56 Ответить
      Как математику-программисту мне ваша аналогия с архивированием не очень нравится, т.к. она намекает что раньше был момент, когда это было всё в развёрнутом виде и на каждый белок было по гену, а потом прошла архивация - тогда как геном сразу строился таким.

      Скорее, так природе проще добавлять новые белки: вместо копирования генов, встраивать в существующий ген заметно более короткие интроны. Возможно время от времени может проводится обратная транскрипция, и наиболее используемые РНК начинают кодироваться отдельными генами без интронов. Что скажут специалисты насчет такой версии размножения генов?
      Ответить
      • Александр Марков > PavelS | 09.11.2008 | 11:16 Ответить
        "Возможно время от времени может проводится обратная транскрипция, и наиболее используемые РНК начинают кодироваться отдельными генами без интронов."

        Это бывает. См.: http://elementy.ru/news/430755
        Ответить
      • q2raza > PavelS | 10.11.2008 | 12:22 Ответить
        "заметно более короткие интроны"
        Судя по диаграмме из статьи, не такие уж и короткие. Рискну предположить, что в ходе эволюции интроны только растут, а заодно и "обзаводятся" различными регуляторными последовательностями
        Ответить
        • q2raza > q2raza | 10.11.2008 | 12:36 Ответить
          Ну а ограничение сверху на размеры некодирующих последовательностей, это , например, затраты времени и энергии на репликацию. Для сптравки, из примерно суток между делениями клетки примерно 5-6 часов тратится только на репликацию генома (фаза синтеза)

          http://www.sparknotes.com/biology/cellreproduction/cellcycle/section2.rhtml
          Ответить
      • Mikhail > PavelS | 11.11.2008 | 14:38 Ответить
        По-моему, с точки зрения программиста, описанная в статье картина весьма напоминает программирование по принципу "блюда спагетти".

        Т.е. вначале (у самых-самых первых "предклеток", от которых совершенно ничего не осталось и о которых мы, к сожалению, никогда ничего не узнаем) был набор генов, который не нуждался в сплайсинге. Но довольно быстро, вследствие попадания в новые условия, возникла необходимость в новых белках для приспособления к новым условиям существования. Создавать для синтеза этих белков новые гены -- слишком сложная и кропотливая работа (хотя и она велась тоже). Ведь при таком подходе наверняка приходится "отлаживать" массу вещей -- начиная от функций новых генов в "старой" системе и кончая согласованием регуляции всех процессов с учетом всего генетического аппарата.

        Поэтому самый "быстрый и грязный" способ -- это разработать, как минимум, два универсальных механизма: а) блокировки генов (чтобы не лезли со своими программами там, где не надо) и б) "дописывания" генов, т.е. добавление кусков исполняемого кода в уже работающую программу. Для пункта (б) понадобилось создание аналога оператора GOTO (интроны) и механизма исполнения программ с переходами по метке (сплайсинг).

        В этом случае появление участков программ без GOTO (кодирование без сплайсинга) позволяет предположить либо исключительную древность данного участка кода (например, то, что он будет встречаться практически в неизменном виде у совершенно разных организмов), либо крайне высокую важность данной программы, т.е. то, что она должна выполняться без каких-либо вариаций, могущих привести к ее искажению. В любом случае получается, что "кодирование без интронов" -- это указание на что-то очень специфическое. Интересно, насколько справедливо это предположение?
        Ответить
    • hokuto > n0isy | 10.11.2008 | 09:40 Ответить
      Скорее всего, это всего лишь еще одно подтверждение того. что генетики вторглись в область, в которой пока мало что понимают (правда, иногда они честно в этом признаются) и в которой с их довольно примитивными методами кроме "химер" пока ничего нахимичить не получается)))
      Ответить
      • n0isy > hokuto | 10.11.2008 | 13:08 Ответить
        Но это вовсе не значит, что не нужно изучать эту область. Пускай через тысячу лет, или десять тысяч - но ясность там тоже появится...если до этого времени мы друг друга не угробим.
        Ответить
        • PavelS > n0isy | 10.11.2008 | 16:24 Ответить
          ИМХО прогресс идёт таки побыстрее, чем 1000-летними темпами. Генноинженерные технологии уже много лет коммерчески успешно внедрены. Полного понимания всего и вся нет и не будет, но это и не надо.
          Ответить
          • hokuto > PavelS | 10.11.2008 | 16:37 Ответить
            Типичная точка зрения радикального сциентиста. Если не задумываться над словами (прогресс, технологии, внедрены...) то всё ОК. За фразу о том, что "понимания не надо" отдельный респект)))
            Ответить
            • Александр Марков > hokuto | 10.11.2008 | 17:56 Ответить
              Ну а это типичная точка зрения радикального идеалиста, приверженца одной из многочисленных "вечных истин". Полное понимание всего и вся возможно только в каком-нибудь религиозном или псевдонаучном учении, а в науке - нет. Однако у науки есть одно важное преимущество: она работает.
              Ответить
              • hokuto > Александр Марков | 11.11.2008 | 12:21 Ответить
                не согласен. хотя бы потому, что в данном конкретном случае не работает. Генная инженерия не только НЕ работает, но и пока что НЕ ведет к прогрессу, и даже экономически НЕ выгодна. Вот такая суровая реальность скрывается за политизированными лозунгами и различными лоббистскими группами компаний (типа Монсансто), которые очень надеятся, что в обозримом будущем у них будет генетический инструмент управления людьми, crops, растениями и вообще всем и вся. Пока товарищи сатанисты в пролёте)
                Ответить
                • Александр Марков > hokuto | 11.11.2008 | 13:50 Ответить
                  Да? А китайцы довольны: http://elementy.ru/news/430841
                  Диабетики, получающие уже много лет только генно-инженерный инсулин, тоже не жалуются.
                  Ну а конспирологическая мифология, к сожалению, всегда в моде :-(
                  Ответить
                  • hokuto > Александр Марков | 11.11.2008 | 14:47 Ответить
                    Александр, пока мы говорим на уровне политических лозунгов...
                    А если копнуть, то всё не столь очевидно. Про bt crops монсанто: http://www.agbioforum.org/v7n12/v7n12a16-huesing.htm
                    Площадь, засеянная ГМО-культурами ничтожно мала. Пока нет способов привлечения к юридической ответственности фермеров, и нельзя использовать "выключатели" так называемого unintended
                    mixing of GM and non-GM crops. Фермерам раздают "сырье" по госпрограммам (за счет налогоплательщиков. а не "свободной конкурренции"). Вырождаемость таких плантаций в разы выше, чем у растений, полученных простой селекцией... и т.д.
                    Насчет диабетиков. Количество диабетиков неуклонно растет и будет расти на 1000 человек. И стабильность treatment'а по закону паркинсона позволяет говорить, что умирают они от того, от чего их лечУт)))
                    Ответить
              • morphogenesis > Александр Марков | 12.12.2008 | 15:14 Ответить
                Аргумент о работоспособности затерт.
                Ответить
              • morphogenesis > Александр Марков | 12.12.2008 | 15:16 Ответить
                Вот Вы рефлекторно в рамках черно-белого мышления отреагировали на постинг "идеалиста" вместо того что бы задуматся о возможных аспектах, которые могли бы обогатить Ваше миропонимание.
                Ответить
    • Aku-Aku > n0isy | 11.11.2008 | 16:27 Ответить
      Нет никакого явного ограничения на размер генома, а тем более на "информационную емкость ДНК" как вы выразились, нет.
      Просто случаи радикально большого увеличения размера генома, когда вместо половины генома каждого родителя берется полная копия, достаточно редкие и нежизнеспособные.
      То есть... природа не "архивирует" многословный код, а изначально следит за его лаконичностью, чтобы минимальным количеством фраз было выраженно максимальное количество смысла. Так как лаконичность в данном случае -- гарантия против ошибок, хоть и не 100%-ая.
      Ответить
  • Mikhail  | 11.11.2008 | 14:50 Ответить
    Александр, а можно ли предположить, исходя из контроля 'специфики' сплайсинга в разных тканях, что и у тучных клеток (которые тоже присутствуют в этих тканях, будут разные 'генетические программы'? Ведь тучные клетки - это часть системы соединительной ткани, а соединительная ткань присутствует во всех органах. Следовательно, если тканеспецифичный синтез белков характерен для ткани самого органа, то то же может оказаться справедливым и для соединительной ткани данного органа, и, следовательно, - для тучных клеток, находящихся в этой ткани?

    С другой стороны, можно ли на этом основании предполагать, что тучные клетки проходят что-то вроде 'школы молодого бойца' в каком-то органе, а затем уже, покинув место своего 'обучения', работают по заданной 'программе' в других частях тела?

    Вам ничего не встречалось на эту тему?
    Ответить
Написать комментарий

Другие новости


Элементы

© 2005-2017 «Элементы»