В тот вечер на банкете в честь ДНК в центре внимания был Фрэнсис Коллинз — не потому, что пел под гитару (хотя и неплохо), а потому, что руководил проектом «Геном человека». За три года до этого события, 26 июня 2000 г., в Белом доме торжественно объявили о том, что человеческий геном секвенирован{6}. Мероприятие проводил президент США Билл Клинтон, а премьер-министр Великобритании Тони Блэр участвовал в нем по спутниковой связи. Коллинз и финансируемый государством проект «Геном человека» разделили в тот день славу с частной компанией Celera. Благодаря грандиозным усилиям этой компании под руководством ее президента Крейга Вентера секвенирование человеческого генома превратилось в соревнование, по итогам которого коммерческий и некоммерческий проекты успешно сыграли вничью.
Кто-то скажет, что с празднованием немного поторопились, поскольку на тот момент в последовательности нуклеотидов было очень много пробелов (не менее 150 000) и нерасшифрованными в ней оставались еще как минимум 10 %. В самом деле, 14 апреля 2003 г. снова объявили о том, что проект теперь действительно завершен, но даже тогда пробелы по-прежнему были. К 2004 г. удалось добиться гораздо большего, но все еще оставался 341 пробел{7}, и по сей день работа не совсем закончена.
Тем не менее на момент объявления о секвенировании генома в 2000 г. был получен хороший предварительный результат{8} — и, строго говоря, именно об этом тогда и сообщили, то есть о завершении предварительной расшифровки. В большинстве случаев исследователи могли обратиться к этим данным, рассчитывая получить подробную информацию об интересующем их участке ДНК. Это было захватывающее время, и все же те из нас, кто занимался клинической медициной, по-прежнему не вполне понимали, для чего нам может пригодиться расшифровка генома.
В один прекрасный день на исходе 2001 г. нам на кафедру пришел пакет, который наглядно это подтвердил. В нем был диск с расшифровкой человеческого генома, присланный нам в подарок компанией Celera. Мы с воодушевлением вскрыли конверт, вставили диск в компьютер и принялись исследовать его содержимое. Однако тут же впали в ступор. Мы понятия не имели, как читать полученную информацию и как соотнести ее с данными наших пациентов. Как позже выяснилось, понадобилось еще больше десятка лет, чтобы работа с геномными данными стала обычной составляющей в практике клинической и лабораторно-диагностической генетики. Теперь я каждый рабочий день пользуюсь браузером геномов, разработанным в Калифорнийском университете Санта-Крус (UCSC Genome Browser){9}. В моей работе эта программа незаменима.
Так что же там, в геноме? Что именно я могу найти благодаря UCSC?[12]
Белое клейкое вещество, которое вы извлекли из клубники, состоит из четырех видов химических «кирпичиков» — нуклеотидов, важными составными частями которых являются азотистые основания: аденин, цитозин, гуанин и тимин[13]. Они обозначаются начальными буквами А, Ц, Г и Т (или A, C, G, T соответственно). В человеческом геноме примерно 3 млрд азотистых оснований. Обычно они объединены в пары, поскольку ДНК существует в форме двойной спирали. Эта двойная спираль состоит из двух отдельных нитей, комплементарных друг к другу. А (аденин) на одной нити соединяется водородными связями с Т (тимином) на другой нити, а Ц (цитозин) — с Г (гуанином), поэтому двойная спираль выглядит так:
* Gattaca («Гаттака») — название фильма-антиутопии 1997 г. о будущем генетических технологий, составленное исключительно из начальных букв азотистых оснований ДНК. — Прим. науч. ред.
Две нити направлены в противоположные стороны — у ДНК есть направление, связанное с порядком ее копирования (транскрипции) и трансляции при синтезе белков. Поэтому последовательность, комплементарная последовательности ГАТТАЦА, будет прочитана клеточным механизмом как ТГТААТЦ, а не ЦТААТГТ.
Три миллиарда оснований ДНК — это ужасно много. Для наглядности — вот фрагмент генетического кода человека:
Это один из моих любимых участков генома — кусочек гена TBX20, сыгравшего звездную роль в моей диссертации. Если печатать тем же шрифтом с тем же интервалом на бумаге формата A4 (с одной стороны), то для распечатки всего человеческого генома понадобится 781 250 листов. Допустим, каждый лист толщиной 0,1 мм; тогда вам понадобится стопка бумаги высотой более 78 м — ниже, чем статуя Свободы, но выше, чем Сиднейский оперный театр. Без ключа к расшифровке, конечно, все это будет лишь набором ничего не значащих букв. С ключом эта стопка бумаги откроет несметные научные сокровища.
13
А также сахара и связывающие их остатки фосфорной кислоты. Подробнее см. Словарь терминов. —