Михаил Орлов
«Природа» №12, 2019

Михаил Анатольевич Орлов («Природа» №12, 2019)

Об авторе

Михаил Анатольевич Орлов — аспирант и младший сотрудник лаборатории механизмов функционирования клеточного генома Института биофизики клетки РАН. Область научных интересов — генетика прокариот, биоинформатика, нейрофизиология и экологическое моделирование. Номинант конкурса «Био/мол/текст-2018».

Как в научной, так и в популярной литературе давно закрепилась метафора «ДНК — это текст», но лишь со временем выяснилось, сколь точной и глубокой получилась аналогия. Генетические тексты биомолекул состоят из элементарных единиц — «букв» (азотистых оснований) и их естественных объединений — «слов» (нуклеотидов). Объем информации, которая в них содержится, можно точно рассчитать с помощью математических формул, и порой выясняется, что в некоторых фрагментах ДНК, как и в некоторых книгах, ее совсем мало или вовсе нет. Перенос терминов из лингвистики в молекулярную биологию дополнительно утвердили аналогию ДНК и текста. Так, генетический текст, как и литературный, можно переписывать и переводить на другой язык (воспроизводство ДНК и синтез РНК, или матричный синтез). Происходит это с большей или меньшей точностью, поэтому текст нуждается в редактировании, причем как самостоятельном — этот процесс называют пруфридингом (англ. proofreading — ‘поиск и исправление ошибок’), так и с привлечением сторонних специалистов (например, геномное редактирование с помощью CRISPR-систем*). Подробнее остановимся еще на одном общем для генетических и языковых текстов явлении, а именно на повторах, которые далеко не всегда бывают избыточными.

Повторение — мать учения

В обыденной жизни при определенных ситуациях мы систематически слышим или читаем одни и те же фразы: например, объявление в самолете при взлете и посадке — «Пристегните ремни» или в метро при отправлении поезда — «Осторожно, двери закрываются...», вопрос в очереди — «Кто последний?» или замечание в банке — «Вот вы где карту открывали, туда и идите» и т.д. Подобные регулярные повторы могут быть эмоционально окрашены и содержать всего одно слово или даже междометие (доброжелательные — в качестве приветствия приятелю; грубые, но очень выразительные — в случае бытового травматизма). Наконец, человек может повторяться односложно для усиления уже сказанного — «...да-да-дадада», чтобы выразить сомнение — «ну-ну, ну-ну», или просто заполнить тягостное молчание — любые звуки по выбору.

Аналогичные повторы «по случаю» можно встретить и в текстах биологических. В мире растений и некоторых животных распространена, прежде всего, ситуация «А теперь давайте повторим все сначала еще раз», когда кратно увеличен (удвоен, утроен и т.д.) набор хромосом (это явление называется полиплоидия). К другим примерам повторов «по случаю» можно отнести стоп-кодоны — триплет (три нуклеотидных остатка), останавливающий в нужном месте синтез (трансляцию) белка; сигнал ядерной локализации — участок молекулы белка, необходимый для его целенаправленной доставки в ядро [1]**; концевые повторы ДНК, которые вирусы используют для встраивания собственного генома в геном хозяина, и т.д.

Начинать всегда проще с элементарного, а именно с односложных (тандемных) повторов — расположенных непосредственно друг за другом совпадающих последовательностей, которые могут быть прямыми (например, ACTG—ACTG) или обратными (ACTG—GTCA)***. Аминокислотная последовательность некоторых белков также содержит подобные участки: например, в них могут присутствовать повторяющиеся последовательности длиной около 40 аминокислотных остатков, называемые Arm-повторы (от англ. armadillo — ‘броненосец’). Однако в этом случае идеальные (т.е. не отклоняющиеся от последовательности-образца) повторы в белковых цепочках нестабильны [2]. О другом интересном примере повторяющихся элементов структуры в белках речь пойдет позже.

Какие бывают повторы

От тандемных повторов ДНК следует отличать повторяющиеся последовательности другого типа — диспергированные, т.е. распределенные по геному повторы. Такие последовательности не примыкают друг к другу непосредственно, а разделены некоторыми отличающимися участками ДНК.

В зависимости от размера тандемные повторы разделяют на три типа — сателлитные, мини- и микросателлитные. Сателлиты — самые большие как по размеру повторяющейся последовательности, так и по общей протяженности участки ДНК; на их долю приходится существенная часть генома в целом. Длина минисателлитов — 10–60 пар нуклеотидов (п.н.), а микросателлитов — 1–6 п.н.; и те и другие группированы по 5–50 штук.

Слово «сателлит» (англ. satellite — ‘спутник’) в названиях этих сходных групп последовательностей возникло в связи с тем, что при градиентном ультрацентрифугировании (методике, позволяющей разделять молекулы с разными физическими свойствами) сателлитная ДНК образует отдельную фракцию. Причина кроется в том, что такие последовательности отличаются от основной части генома по GC-составу, т.е. по доле гуанина (G) и цитозина (C). Впоследствии были обнаружены «скрытые» сателлиты — истинные по GC-составу сателлиты, которые невозможно отделить от основной массы ДНК. Таким образом, поэтический термин описывает техническую сторону получения первых образцов данных последовательностей и не имеет биологического смысла.

Все три разновидности тандемных повторов характерны для генома эукариот и находятся, главным образом, в концевых (теломерных) и средних (центромерных) частях хромосом. Сателлитная ДНК отличается от мини- и микросателитных повторов не только большим числом последовательностей, но и локализацией в гетерохроматине — плотно упакованной и слабо транскрибируемой части генома. Последовательности же двух других типов содержатся в эухроматине (активном хроматине) — деспирализованной области хромосом.

Доля повторов в эукариотических геномах впечатляет: на повторяющиеся последовательности разного типа приходится почти половина генома человека [3]. Общее их количество (в пересчете на уникальные последовательности) превышает 1 млн, и многие из их числа к тому же очень изменчивы. Превышение определенного числа тандемными повторов (экспансия) может вызвать такие тяжелые заболевания, как синдром хрупкой X-хромосомы, различного рода атаксии, многие формы амиотрофического латерального склероза и болезнь Хантингтона.

Терминологический хаос

Хотя тандемные повторы открыты уже более полувека назад, до сих пор происходит путаница в терминологии. Мини- и микросателлитные повторы могут совместно обозначаться как локусы с варьирующим числом тандемных повторов (variable number of tandem repeat locus, VNTR). Однако VNTR и минисателлитные повторы могут использоваться как синонимы, при этом микросателлиты называют и короткими тандемными повторами (short tandem repeats, STRs), и простыми повторяющимися последовательностями (simple sequence repeats, SSRs) [4]. Но и это еще не все...

Несмотря на то что все VNTR могут рассматриваться как минисателлиты, не все из них будут относиться к VNTR. С одной стороны, количество повторов в VNTR может варьировать у разных индивидов, с другой — некоторые, отличные от VNTR, минисателлиты несут повторы, представленные одним и тем же количеством копий у всех представителей вида, имеющих такой тандемный повтор в геноме.

Дополнительные трудности вызваны созвучностью всех этих названий с совершенно другим феноменом — сателлитными (спутниковыми) районами акроцентрических хромосом, у которых центромеры расположены близко к одному из концов, поэтому плечи у таких хромосом резко отличаются по размеру. Очевидно, что такое использование одного и того же термина для обозначения разных явлений — крайне неудачное совпадение [5]. Последний штрих в терминологический хаос вносят исследователи разных специальностей (криминалисты, генетики растений, микробиологи и т.д.), когда один и тот же тип последовательностей обозначают разными терминами [6].

Зачем повторяться?

Для чего же нужны повторы, скажем, те же VNTR, нашему (или какому-то другому эукариотическому) целесообразно устроенному организму? И как их можно использовать?

Изучать VNTR нетрудно. С помощью доступных молекулярных методов можно выявить число тандемных повторов в определенном гене любого из нас — причем их может оказаться и 3, и 15 без заметных отличий в функционировании соответствующего гена. Известна значительная изменчивость кратности повторов, т.е. количества копий повторяющейся единицы последовательности. Это связано с тем, что тандемные повторы своего рода «горячие точки» мутагенеза. Вероятность возникновения «ошибок» в таких текстах превосходит примерно в 100 тыс. раз вероятность стандартных «опечаток» (точечных мутаций «неповторимой» ДНК).

Причина этого связана с так называемыми ошибками репликации при редактировании (slipped strand mispairing). Поскольку тандемные повторы представляют собой расположенные одна за другой идентичные последовательности, две комплементарные цепочки дуплекса ДНК могут принять неправильное расположение друг относительно друга. При этом происходит как бы проскальзывание одной цепи относительно другой (от англ. to slip — ‘проскользнуть, сдвинуться’).

Ошибки репликации при редактировании, вызывающие изменение экспрессии гена («Природа» №12, 2019)

Ошибки репликации при редактировании, вызывающие изменение экспрессии гена. Неправильная гибридизация цепей ДНК в области тандемных повторов при репликации и ошибки системы репарации (нужной для исправления таких случаев) могут привести к вставке (экспансии) или удалению (делеции) одного или нескольких повторов [7]

В ходе репликации первый повтор одной цепи, скажем, GTAC, может оказаться спаренным с первым повтором CATG другой цепи, но может также быть связан и со вторым, третьим и т.д. Некоторые последовательности-повторы могут быть вытеснены в сторону и в результате этого оказаться «вне игры», в данном случае — транскрипции. В связи с этим нарушением комплементарности ферменты репликации могут допускать ошибки при синтезе копии ДНК — а именно «потерять» или добавить дополнительные копии повторов. В этом случае возникают специфические мутации — условные «слова» остаются правильными, а вот их число меняется. Поскольку затронутой оказывается значительная часть последовательности (не единичный нуклеотид), ДНК приобретает довольно существенные изменения. Именно поэтому они избирательно возникают только в тех участках генов, которые менее чувствительны к заменам и способны «стерпеть» такое грубое изменение последовательности.

Любопытно, что ошибкам репликации при редактировании могут противодействовать точечные мутации внутри последовательности отдельного повтора. Это справедливо даже в том случае, если произошла замена на синонимичный (т.е. кодирующий ту же аминокислоту) кодон. Эти однобуквенные замены приводят к возникновению изменения, заметного на однородном фоне точных повторов. Благодаря такой метке выполняющая репликацию клеточная машинерия окажется способна различить данное положение и избежать проскальзывания. В результате обе цепи дуплекса будут сориентированы друга относительно друга надлежащим образом. С течением времени и новых репликаций в таком стабильном тандемном повторе накапливаются небольшие изменения, в связи с чем он все больше отклоняется от исходного.

Таким образом, последовательность тандемных повторов может постепенно исчезать. Возможен и противоположный случай, когда удаление (делеция) повтора приводит к исчезновению имеющегося однобуквенного отличия-мутации, а последующая неправильная гибридизация — привести к синтезу точного повтора.

Это предоставляет возможность использовать уровень «безошибочности» тандемного повтора для того, чтобы установить, насколько интенсивному отбору он подвергался в прошлом. Если неточностей окажется немного, это свидетельствует о многочисленных вставках (называемых в этом случае экспансиями) и выпадениях (делециях). Если же в тандемном повторе накопилось множество ошибок, то отбор, по-видимому, не уделял особого внимания такой последовательности [7].

Твердые ткани мягкотелого хищника

Вслед за описанием какого-либо молекулярно-генетического феномена всегда возникает вопрос о его воспроизведении в искусственных условиях, а также о возможности применения. Итак, какую пользу можно ожидать от получения искусственных тандемных повторов?

Имея представление о матричном синтезе, нетрудно догадаться, что тандемные повторы в кодирующей ДНК могут соответствовать тандемным повторам в последовательности белка. Подобные интересные белки были обнаружены у кальмаров, которые вдохновляют многих исследователей своими «суперспособностями» — сложно устроенной нервной системой, способностью маскироваться за счет отражающих тканей и видеть в кромешной тьме на больших глубинах и т.д. В данном случае речь идет о твердых тканях этих ловких и при этом мягкотелых хищников, которые привлекли внимание материаловедов.

Клюв кальмаров, внешне напоминающий птичий и выглядящий зловеще, — биологический композит, содержащий богатый гистидином белок-матрицу и хитиновые волокна. Другое опасное оружие кальмара — острые зубцы роговых колец, которые расположены внутри присосок на щупальцах. Такие зубцы состоят из твердого биогенного материала, имеющего эластичные модули. В основе материала — белок с сегментированной структурой, который включает чередующиеся кристаллические и аморфные домены [8].

Арсенал обыкновенного кальмара Loligo vulgaris («Природа» №12, 2019)

Арсенал обыкновенного кальмара (Loligo vulgaris[8]. У этого головоногого моллюска все десять щупальцев (восемь коротких и два длинных) выстланы многочисленными присосками, оснащенными зубцами роговых колец. Тело кальмара поддерживается гладиусом — жесткой пластиной, состоящей из хитина. Зрение у кальмаров тоже отменное — сетчатка их глаз содержит фоторецептор родопсин, позволяющий с высокой чувствительностью реагировать на поляризованный свет и хорошо видеть на больших глубинах. Клюв, зубцы роговых колец и гладиус, обладающие превосходной механической прочностью, вдохновляют материаловедов, разрабатывающих современные материалы

Меняя структуру белка зубцов роговых колец, можно получить материал с заданной растяжимостью, жесткостью, прочностью, электропроводностью, прозрачностью и даже способностью залечивать дефекты. Области применения таких материалов могут быть самыми разными — от хирургических нитей до сенсоров.

Эти удивительные белки можно получать из животного сырья, но лучше, разумеется, использовать методы генетической инженерии. С точки зрения создания новых материалов это предоставляет ряд преимуществ при получении структурных фибриллярных белков. Прежде всего, состав и размеры аминокислотной последовательности такого белка можно строго контролировать. В этом случае возможно получение идентичных молекул и однородного материала. Далее структуру молекулы белка можно изменять, заменяя обычные функциональные группы (тиоловые, фенольные и аминогруппы) на более экзотические (например, галогенид, азид, олефин, оксим, гидразон, бороновый эфир). Наконец, в состав таких рекомбинантных белков могут быть введены полипептиды со специфическими свойствами (антибактериальными, адгезивными, со склонностью к переходам «спираль — клубок»), что открывает исключительно большие возможности по созданию новых материалов с ценными заданными свойствами, которые к тому же можно сочетать между собой. Отдельным важным плюсом для применения таких соединений в медицине становится их биосовместимость и биоразлагаемость.

Последовательность белка кальмара содержит два сильно различающихся модуля. Главная повторяющаяся единица-мономер состоит из чередующихся друг за другом областей — кристаллизующейся, которая содержит бета-листы, стабилизированные водородными связями, и аморфной. Кристаллическая часть каждого повтора богата остатками аланина и гистидина, а аморфная — тирозина и глицина. Последовательность, соединяющая два различных участка повтора, обычно содержит пролин. Такая система подразумевает ограниченное число типов аминокислот, поскольку далеко не все остатки могут в нее «вписаться». В связи с этим перебор возможных последовательностей также сравнительно невелик.

Наступление светлого будущего, в котором люди используют легкие, прочные и «самозалечивающиеся» материалы на основе белка кальмара задерживают некоторые технические трудности, возникающие при конструировании повторяющихся последовательностей.

Получение белков с тандемными повторами из природного источника (кальмара) («Природа» №12, 2019)

Получение белков с тандемными повторами из природного источника (кальмара) [8]

Проблемы на уровне конструирования ДНК заключаются в следующем. Прежде всего, разработка искусственных генов, которые кодируют интересующие нас белки, может оказаться неудачной или приводить к получению неспецифических продуктов. В настоящее время доступны три подхода к получению генов тандемных повторов.

В прошлом активно применяли стандартное клонирование, при котором мономеры поочередно, один за другим, соединяются в длинные цепочки-конкатемеры. Однако данный метод — трудоемкий и занимает много времени [9]. Новые методики основаны на «бесшовном» клонировании (seamless cloning) и рекурсивном направленном лигировании (recursive directional ligation, RDL) [10–12]. Однако и они включают ряд этапов, которые сложно проводить параллельно, и не предоставляют возможность контролировать процесс в случае молекул с различным молекулярным весом. Для преодоления этих затруднений разработали метод на основе амплификации ДНК по механизму катящегося кольца с удлинением перекрывающихся концов (overlap extension rolling circle amplification, OERCA). Он позволяет производить параллельный синтез генов, кодирующих повторяющиеся последовательности подобных эластину полимеров-белков [13]. Недавно предложили еще один метод, позволяющий конструировать протяженные последовательности повторов — защищенное расщепление при амплификации катящегося кольца(protected digestion of rolling circle amplification, PD-RCA) [14].

Дизайн белков с тандемными повторами («Природа» №12, 2019)

Дизайн белков с тандемными повторами [8]: а — три стратегии синтеза гена с тандемными повторами; б — схема метода PD-RCA, разработанного для создания белков с тандемными повторами, напоминающих белок зубцов роговых колец кальмара. На вставке внизу — результаты электрофореза в полиакриламидном геле (SDS-Page) биосинтетических белков зубцов роговых колец с 4, 7 и 11 повторами

Благодаря PD-RCA отдельный повтор, имеющий замкнутую форму, может непрерывно нарабатываться ферментом полимеразой в присутствии нуклеотида дезокси-ЦТФ (dCTP), а также его метилированной формы. При этом содержащие цитозин сайты рестрикции (на которые способны избирательно действовать соответствующие ферменты нуклеазы) окажутся расщепленными, а защищенные, т.е. содержащие 5-метилцитозин, останутся нетронутыми. В связи с этим становится возможным получение последовательностей, содержащих тандемные повторы с варьирующими размерами. Преимущество PD-RCA заключается в том, что данный метод позволяет в ходе одной реакции синтезировать такие олигомерные продукты различающейся длины. Это делает доступным создание большого набора (библиотеки) генов, кодирующих белки с различным количеством повторяющейся последовательности.

Недавно на основе этого подхода синтезировали содержащие тандемные повторы белки, основой для которых послужил упомянутый белок кальмара. Цель при этом была поставлена фундаментальная: выявить связь аминокислотной последовательности и структурных свойств, в том числе распознать участки последовательности, определяющие способность белка к самозалечиванию при повреждениях [8].

Остается надеяться, что некоторые технические трудности на пути создания материалов на основе таких бионических белков (включая недостаточную чистоту продукта, а также некоторую дороговизну) будут преодолены. Тогда, пользуясь ножом или сверхпрочной тканью, мы сможем мечтательно вспоминать, как выглядит стремительно плывущий в океанских глубинах кальмар — изобретатель этих материалов. Более того, целая область самобытных последовательностей ДНК, которые представляют собой повторяющиеся небольшие участки, возникающие и эволюционирующие по своим особым законам, принесет нам много интересных открытий и возможностей их приложения.

Литература
1. Meinema A. C., Laba J. K., Hapsari R. A. et al. Long unfolded linkers facilitate membrane protein import through the nuclear pore complex // Science. 2011; 333(6038): 90–93. DOI: 10.1126/science.1205741.
2. Jorda J., Xue B., Uversky V. N. et al. Protein tandem repeats — the more perfect, the less structured // FEBS Journal. 2010; 277(12): 2673–2682. DOI: 10.1111/j.1742-4658.2010.07684.x.
3. Richard G.-F., Kerrest A., Dujon B. Comparative genomics and molecular dynamics of DNA repeats in eukaryotes // Microbiol. Mol. Biol. Rev. 2008; 72(4): 686–727. DOI: 10.1128/MMBR.00011-08.
4. Turnpenny P., Ellard S. Emery’s Elements of Medical Genetics. Edinburgh; N.Y., 2005.
5. Фогель Ф., Мотульски А. Генетика человека: Проблемы и подходы. В 3-х т. Ред. Ю. П. Алтухов, В. М. Гиндилис. М., 1989; 1.
6. Belkum A. van, Scherer S., Alphen L. van, Verbrugh H. Short-sequence DNA repeats in prokaryotic genomes // Microbiol. Mol. Biol. Rev. 1998; 62(2): 275–293. DOI: 1092-2172/98/$04.0010.
7. Myers P. Tandem repeats and morphological variation // Nature Education. 2007; 1(1): 1.
8. Pena-Francesch A., Domeradzka N. E., Jung H. et al. Research Update: Programmable tandem repeat proteins inspired by squid ring teeth // APL Materials. 2018; 6(1): 010701. DOI: 10.1063/1.4985755.
9. Cappello J., Crissman J., Dorman M. et al. Genetic engineering of structural protein polymers // Biotechnol. Prog. 1990; 6(3): 198–202. DOI: 10.1021/bp00003a006.
10. McMillan R. A., Lee T. A. T., Conticello V. P. Rapid assembly of synthetic genes encoding protein polymers // Macromolecules. 1999; 32(11): 3643–3648. DOI: 10.1021/ma981660f.
11. Meyer D. E., Chilkoti A. Genetically encoded synthesis of protein-based polymers with precisely specified molecular weight and sequence by recursive directional ligation: examples from the elastin-like polypeptide system // Biomacromolecules. 2002; 3(2): 357–367. DOI: 10.1021/bm015630n.
12. Tokareva O., Michalczechen-Lacerda V. A., Rech E. L. et al. Recombinant DNA production of spider silk proteins // Microbial. Biotechnology. 2013; 6(6): 651–663. DOI: 10.1111/1751-7915.12081.
13. Amiram M., Quiroz F. G., Callahan D. J. et al. A highly parallel method for synthesizing DNA repeats enables the discovery of «smart’ protein polymers // Nature Mater. 2011; 10: 141–148. DOI: 10.1038/nmat2942.
14. Jung H., Pena-Francesch A., Saadat A. et al. Molecular tandem repeat strategy for elucidating mechanical properties of high-strength proteins // PNAS. 2016; 113(23): 6478–6483. DOI: 10.1073/pnas.1521645113.


* Подробнее см.: Гоглева А. А., Артамонова И. И. CRISPR-системы // Природа. 2019. № 6. С. 16–21; № 7. С. 3–9, а также статьи на сайте «Биомолекула» — Коротаев А., Волкова О. Просто о сложном: CRISPR/Cas. 24.11.2016; Кротов А. От слов к делу: технологию CRISPR-Cas впервые применили для лечения онкозаболеваний. 26.11.2016; Борзов Н. Битва века: CRISPR vs ВИЧ. 11.10.2016; Петренко А. Вылечить миодистрофию Дюшенна: конкуренция групп, единство методик. 16.02.2016. — Здесь и далее примеч. ред.

** Популярный пересказ этой статьи опубликован на сайте «Элементы»: Башмакова В. Для ядерного импорта мембранных белков нужна линкерная последовательность. 05.07.2011.

*** Подробнее см.: Панчин А. Ю. Волосатики и степени свободы в эволюции белков // Природа. 2019. № 8. С. 68–73.


0
Написать комментарий

    Избранное






    Элементы

    © 2005–2025 «Элементы»