Транскрипция гена — это переписывание последовательности его нуклеотидов с ДНК на РНК. Транскрипция должна начинаться строго в начале гена и заканчиваться строго в конце — иначе вместо необходимой последовательности РНК мы получим какие-то отрывки, которые мало того что не будут выполнять нужную функцию (например, давать начало «правильному» белку), но могут и вовсе приносить клетке вред. Как же клетке удается избежать такого страшного сценария и обеспечить начало и окончание транскрипции в правильных местах?
Подумайте, как должны обозначаться начало и конец гена и как транскрипционный аппарат должен понимать эти обозначения.
Сперва разберёмся с точкой начала гена. Вначале я расскажу общие принципы, а потом — конкретные моменты, характерные для эукариот и прокариот.
Транскрипцию осуществляет особый фермент — РНК-полимераза. РНК-полимераза сама по себе, в одиночку, не имеет сродства к ДНК. Она не присоединяется к ней, не расплетает, не начинает синтезировать РНК, а просто индифферентно плавает где-то неподалёку и совершенно на нее не реагирует.
Для того чтобы сесть на ДНК и начать работать, РНК-полимеразе необходим вспомогательный белковый фактор — специальный белок, который имеет сродство и к РНК-полимеразе, и к ДНК. Причем фактор этот обладает хитрым свойством: он имеет сродство не просто к ДНК, а только к особому участку этой ДНК — промотору, расположенному строго в начале гена. И получается простая, изящная и эффективная система: белковый фактор присоединяется к промотору (читай — к началу гена), РНК-полимераза — к транскрипционным фактору, и транскрипция гена начинается именно там, где нужно.
Но это — не единственная польза от системы «промотор — белковый фактор». Если сделать несколько промоторов и каждому из них поставить в соответствие свой фактор (фактор А умеет соединяться только с промотором а, а фактор B — только с промотором b, и так далее), то можно добиться не больше не меньше как избирательной транскрипции. Если в клетке будет присутствовать только фактор А, то транскрибироваться смогут исключительно гены, находящиеся под промотором а, а остальные будут «молчать»; если будет присутствовать фактор B — в клетке появятся только РНК, чьи гены находятся под промотором b, и так далее. В результате мы получаем гибкую систему, позволяющую клетке включать или выключать транскрипцию нужных генов — а значит, подстраиваться под условия внешней среды.
Теперь посмотрим, как эта концепция вспомогательных белковых факторов реализуется в про- и эукариотических клетках.
У бактерий белковые факторы называются сигма-факторами (см. Sigma factor). Сигма-фактор — это такой белковый фактор «для бедных». Ядра у бактерий нет, весь их геном — небольшая кольцевая молекула ДНК, плавающая прямо в цитоплазме, и позволить себе роскошь иметь много генов (в том числе генов сигма-факторов) они не могут. Поэтому количество сигм довольно скудное (например, у кишечной палочки их всего семь), а осуществляемая ими регулировка — грубая. Каждая сигма без затей включает отдельный блок генов, необходимых в той или иной ситуации. Есть сигма домашнего хозяйства (включающая постоянно работающие гены; у кишечной палочки она называется σ70), сигма теплового шока (включающая гены, необходимые при тепловом стрессе; у кишечной палочки σ32) и так далее. В результате бактериальная клетка, конечно, в состоянии перестроить свой метаболизм для тех или иных нужд, но ни о какой тонкости и вариативности перестройки речь не идет.
То ли дело эукариоты. У них есть клеточное ядро, в котором, защищенные от опасностей цитоплазматической жизни, плавают длинные молекулы ДНК, стабилизированные белками, — хромосомы. В таком большом геноме генов помещается великое множество, и большинство процессов (в том числе транскрипция) организовано куда сложнее, чем у прокариот. Вместо одной-единственной РНК-полимеразы бактерий у эукариот есть целых три фермента, осуществляющих транскрипцию. Синтезом мРНК занимается только один из них — РНК-полимераза II, а РНК-полимераза I и РНК-полимераза III синтезируют всевозможные некодирующие РНК — транспортные, рибосомные и так далее. Процесс транскрипции эукариот будет рассмотрен именно для РНК-полимеразы II, поскольку он лучше всего изучен. И прежде всего надо сказать, что в транскрипции эукариот участвует необычайное изобилие вспомогательных белковых факторов (они называются транскрипционными факторами, ТФ).
Есть шесть основных (базовых) транскрипционных факторов, без которых транскрипция чисто технически невозможна. Они притягивают к нужному месту РНК-полимеразу, изгибают необходимым образом ДНК, расплетают ее и т. д. Но эти семь белков — РНК-полимераза и шесть базовых транскрипционных факторов — обеспечивают только очень слабый уровень транскрипции. Помимо них есть великое множество так называемых дополнительных транскрипционных факторов (их иногда еще называют, в зависимости от выполняемой роли, транскрипционным активаторами или транскрипционным репрессорами), которые всерьез — на несколько порядков — усиливают или ослабляют транскрипцию, прежде всего за счет различных конформационных взаимодействий. Такие многочисленные дополнительные ТФ обеспечивают тонкую и точную регулировку транскрипции. Один ТФ может по-разному влиять на транскрипцию разных генов; один и тот же ген может по-разному регулироваться разными ТФ, различные белки могут быть ТФ друг для друга. Получаются красивые взаимосвязанные цепочки событий, определяемых ТФ, — циклы, каскады и т. д. Например, суточные циклы в упрощенном виде выглядят так. Транскрипция транскрипционного фактора А, включающего транскрипцию транскрипционного фактора В, выключается самим транскрипционным фактором В (эту фразу можно произносить как скороговорку; см. об этом задачу Пусть ворона сохнет, или Как устроены суточные циклы). И в результате слаженной работы ТФ получается система гибкой и эффективной настройки, которая позволяет клетке быстро, тонко и точно перестроить свой метаболизм.
Что касается архей, третьего домена живого (кроме эукариот и бактерий), то у них транскрипция напоминает таковую для эукариот, только в сильно упрощённом варианте: вместо шести базовых транскрипционных факторов — всего два, настройка уровня транскрипции куда более грубая, и так далее.
Ну вот, с началом гена мы более-менее разобрались, теперь посмотрим на его конец. Как клетке сделать так, чтобы транскрипция ДНК не продолжалась вечно, давая длиннющую и бесполезную цепочку РНК, а заканчивалась в строго нужном месте, приводя к появлению РНК строго нужной длины, несущей информацию о данном гене и только о нем?
Тут есть несколько решений на любой вкус; начну с самого изящного.
Нити РНК могут быть комплементарны друг другу. Со свойством комплементарных нитей РНК образовывать «шпильки», слипаться друг с другом связано немало функций, которые выполняют эти самые РНК (см. об этом задачу Форма и содержание). И вот одна из этих функций. В конце гена у многих бактерий находятся два комплементарных друг другу участка, богатые гуанином и цитозином. Стоит этим участкам транскрибироваться, как они крепко (поскольку гуанин с цитозином сцепляются друг с другом крепче, чем аденин с урацилом) застегиваются в шпильку. К этой шпильке присоединяется специальный белок по имени nusA, и присоединяется таким образом, что начинает мешать работе РНК-полимеразы, и транскрипция на время застопоривается. А сразу после шпильки в последовательности гена, наоборот, идет «слабая» урациловая последовательность, которая еле-еле сцепляется с комплементарной ей адениновой последовательностью ДНК (недавно транскрибированные комплементарны участки РНК и ДНК всегда сцеплены друг с другом; это необходимое условие для работы РНК-полимеразы). Из-за паузы в работе РНК-полимеразы у урациловой последовательности появляется время, чтобы отвалиться от ДНК, что она благополучно и делает. В результате РНК-полимераза в прямом смысле слова теряет нить: ей не за что уцепиться, она не может синтезировать РНК, не сцепленную с ДНК. И транскрипция прекращается.
Более сложная схема остановки транскрипции у бактерий связана со специальным белком по имени Rho-фактор. Этот белок распознает определённую последовательность свежесинтезированной РНК под названием rut (rho utilization site). Данная последовательность находится чуть раньше конца гена, той точки, в которой РНК-полимеразе хорошо бы остановиться и перестать синтезировать РНК.
Вцепившись в rut-последовательность, Rho-фактор начинает скользить по синтезируемой цепи РНК до тех пор, пока не доберётся до дуплексного участка, где только-только синтезированная РНК еще связана с ДНК. Rho-фактор расплетает этот дуплекс, РНК-полимераза «теряет нить», и транскрипция прекращается.
У эукариот же процесс терминации (остановки трансляции) известен куда хуже. Ясно, что в нем участвуют несколько белков, которые распознают терминирующую последовательность на ДНК и после этого останавливают транскрипцию, но вот как конкретно работают эти белки, во многом покрыто завесой тайны.
Система транскрипции, как вы уже могли заметить, отлично отлажена и позволяет клетке ювелирно тонко регулировать свой метаболизм в зависимости от обстоятельств.
Однако в мире существует предостаточно обманщиков и мелких бесклеточных преступников, которые способны подчинить себе весь этот совершенный транскрипционный аппарат и заставить его работать для своих нужд. Вы уже, наверное, поняли, что речь идет о вирусах.
Вирусы филигранно и беззастенчиво используют клеточные промоторы и белковые факторы для своих грязных целей. О некоторых историях из жизни вирусов и заражённых ими бактериальных клеток рассказал в своей лекции во время научной школы-конференции «Современная биология & Биотехнологии будущего», посвященной острым вопросам и актуальным проблемам фундаментальной и прикладной биологии, Константин Викторович Северинов.
Рассмотрим ситуацию на примере излюбленной модели микробиологов — кишечной палочки — и заражающего ее вируса — фага Т4.
Дело в том, что все гены вируса можно разделить на ранние, средние и поздние. Ранние включаются, когда вирус только-только заразил клетку и ему надо наладить производство самого себя. Средние продолжают дело этого воспроизводства уже на новом уровне. Поздние — добавляют последние штрихи (например, поздними транскрибируются белки оболочки вируса, потому что они нужны ему уже только в самом конце). В конце цикла заражения новенькие, так называемые беби-вирусы в полной боевой готовности покидают зараженную клетку и отправляются заражать новые и новые бактерии.
Такая чёткая смена фаз заражения — ранние, средние и поздние гены — требует чёткой, можно сказать оркестрированной, организации. Вирусу нужно что-то вроде системы промоторов и сигма-факторов, чтобы заставить клетку не просто транскрибировать свои гены, но транскрибировать их согласованно и в порядке строгой очерёдности. Но у вируса такой системы нет, и ему приходится с помощью нескольких хитрых «отмычек» использовать готовую систему хозяина.
Итак, вирус попал в клетку. Один из его белков тут же так модифицирует РНК-полимеразу клетки-хозяина, что сродство ее к самым сильным клеточные промоторам ослабевает. Из-за этого большое количество РНК-полимеразы в клетке оказывается свободно и готово работать на вирус. Начинается синтез ранних генов.
И вот ранние гены синтезированы. Пришло время выключить их транскрипцию и включить транскрипцию средних генов. Тут в дело вступает продукт одного из ранних генов — белок по имени AsiA, известный также как «антисигма».
Дело в том, что промоторы у прокариот, как правило, состоят из двух участков — –35 и –10 (цифры и знак «минус» означают, что эти участки находятся до начала гена за 35 и 10 нуклеотидов соответственно). И сигма-фактор тоже состоит из двух участков, каждый из который цепляется за соответствующий участок промотора. И вот коварный вирусный белок-антисигма блокирует один из участков сигмы, не давая ей сцепиться с –35-участком промотора. В результате транскрипция всех нормальных генов — «родных» генов бактериальной клетки и ранних генов вируса — застопоривается. А у средних генов вируса особенные промоторы — у них очень длинный –10-регион, который прекрасно распознаётся РНК-полимеразой, на которую напала антисигма. В результате в клетке не транскрибируются ни ранние вирусные, ни хозяйки гены, а только средние гены вируса.
И наконец, переход от средних генов к поздним. Переход этот имеет смысл делать только тогда, когда в клетке началась уже репликация вирусной РНК, потому что поздние гены нужны уже собственно для сборки вирусных частиц и выхода их во внешний мир. И вот тут нас тоже ждет необычайно изящная история. Один из продуктов средних генов — белок по имени gp33 — блокирует работу РНК-полимеразы. Блокировка эта снимается только тогда, когда он связывается со сложным белковым комплексом, который участвует в репликации вирусной ДНК. То есть репликация выступает своеобразным разрешительным сигналом для включения поздних генов. Красиво, правда?
Все вышеописанные события относятся к взаимоотношениям между кишечной палочкой и заражающих ее фагом Т4. Очевидно, что для других бактерий и других фагов история может выглядеть несколько иначе.
Видимо, для разных бактерий и вирусов существуют разные схемы. Однако очень красивым, длинным и запутанным путём группе Северинова удалось показать, что для термофильной бактерии Thermus aquaticus и заражающих ее фагов механизм переключения между ранними и средними генами чрезвычайно похож на тот, который был изучен для кишечной палочки и фагов Т4.
Источник: лекция К. В. Северинова «Structure-function analysis of bacterial transcription regulation» на Зимней школе «Современная биология и биотехнологии будущего».
Белок AsiA (антисигма) блокирует тот участок сигмы, который должен сцепиться с –35-областью промотора. В результате те гены, у которых промотор имеет этот –35-участок, не могут нормально транскрибироваться. Зато гены, у промоторов которых –35-участка нет, а есть удлинённый –10-участок, будут транскрибироваться только лучше. Таким хитрым образом вирус эксплуатирует транскрипционный аппарат клетки. Сигма-фактор показан белым цветом, а РНК-полимераза — оранжевым. Изображение из слайдов К. В. Северинова для лекции на Зимней школе