Международный консорциум HapMap опубликовал самый полный на сегодня каталог вариаций человеческого генома. Новая свободно доступная база данных позволит ускорить поиск генов, связанных с различными наследственными заболеваниям, а также будет незаменимым источником информации для исследований в области этногеномики.
Генетический код любых двух людей, не имеющих родственных связей, совпадает на 99,9%. В этом выражается видовое единство человечества. Однако оставшейся одной десятой процента вполне достаточно, чтобы породить всё разнообразие людей на Земле. Стартовавший три года назад проект ставил своей целью изучить эти различия.
Всего было собрано 269 образцов ДНК у четырех групп населения. Первая группа (обозначаемая YRI) включала 90 жителей Нигерии, принадлежащих к племени Йоруба, вторая (CEU) — 90 жителей американского штата Юта. В обоих случаях образцы брали у 30 семейных групп: мать, отец, ребенок. Еще две группы были отобраны уже не столь систематически: 45 образцов (CHB) взяли у пекинских китайцев и 44 — у японцев в Токио (JPT). Эти две группы в исследовании часто объединяют в одну: CHB + JPT. Ни один из этих наборов, конечно, не является репрезентативной выборкой для соответствующего этноса. Поэтому авторы статьи в журнале Nature рекомендуют во избежание недоразумений обозначать подборки образцов аббревиатурами, а не национальностями.
Все эти образцы прошли секвенирование, то есть были определены последовательности нуклеотидов, составляющие молекулы ДНК. А затем началось самое интересное — сравнение и отождествление участков ДНК из разных образцов и выявление различий. В некоторых случаях различия могут быть довольно крупными — например, с места на место может переехать целый фрагмент генетического кода (такие фрагменты называют траспозонами). Однако это случается относительно редко. Большинство же мутаций представляют собой подмену одного нуклеотида другим, пропуск или добавление лишнего нуклеотида. Это так называемые однонуклеотидные полиморфизмы (single nucleotide polymorphism, SNP). Именно на них и сосредоточились в первую очередь исследователи.
Хотя, на первый взгляд, задача кажется простой, в действительности надежно выявить однонуклеотидные полиморфизмы довольно трудно. Ведь по каждому из них нужно быть до конца уверенным, что это не ошибка при расшифровке ДНК. Поэтому после выявления каждый кандидат в SNP должен пройти соответствующую проверку (генотипирование). Но самое лучшее подтверждение — это выявление SNP в двух разных геномах (повторяемость).
На момент начала проекта в октябре 2002 года в различных свободно доступных базах данных имелась информация об 1,7 млн SNP в человеческом геноме. Однако про большинство из них не было известно, насколько надежны данные и сколь широко встречается данная мутация. На момент публикации статьи в Nature число кандидатов в SNP выросло до 9,2 млн, из которых 3,6 млн были обнаружены по крайней мере в двух разных образцах, а 2,4 млн подверглись независимой проверке.
Из других любопытных цифр можно упомянуть следующие:
В целом, опубликованные материалы надолго станут предметом изучения большого количества ученых. Только на конференции Американского общества генетики человека (American Society Human Genetics), прошедшей на днях в Солт-Лейк Сити, было представлено более 70 статей и докладов, основанных на данных проекта HapMap. Для подобных исследований уже стало доброй традицией, что все материалы, включая упомянутую статью в Nature, находятся в открытом доступе в интернете.
См. также:
A haplotype map of the human genome, Nature 437, 1299-1320.
International Consortium Completes Map Of Human Genetic Variation, пресс-релиз американского Национального института здравоохранения.