Существует 64 разных триплета, образуемых комбинациями оснований A, C, G и T в ДНК, но аминокислот в составе белков всего 20. Это означает, что одну и ту же аминокислоту кодирует несколько триплетов (три триплета не кодируют ничего, а обозначают окончание перевода мРНК в последовательность белковой цепи, как точка обозначает конец предложения). Для нас вами очень удобно (и имеет огромное эволюционное значение), что этот код, за несколькими небольшими исключениями, один и тот же для всех видов организмов (вот почему для получения человеческих белков, таких как инсулин, можно использовать бактерии).
Таким образом, зная специфическую последовательность ДНК, можно определить закодированную в ней последовательность белка. Однако не вся последовательность ДНК кодирует белки. Достаточно большая доля ДНК является «некодирующей». Первая проблема, с которой сталкиваются ученые при расшифровке длинной последовательности ДНК, состоит в определении начала и конца «кодирующей» области. К счастью, теперь эту задачу решают на компьютерах с помощью специальных алгоритмов, которые отлично ищут и находят «иголки» в «стогах» ДНК.
Кодирующая последовательность среднего гена состоит примерно из 1200 оснований. У некоторых видов организмов, в частности у бактерий или дрожжей, тысячи генов упакованы очень плотно и разделены сравнительно короткими промежутками некодирующей ДНК. У человека и многих других сложных существ гены составляют лишь небольшую долю всей ДНК и разделяются протяженными некодирующими участками. Какие-то из этих участков нужны для регуляции функций генов, а остальные называют мусорной ДНК. Эта мусорная ДНК накапливается в геноме в результате действия нескольких механизмов и часто содержит длинные повторяющиеся участки, не несущие информации. Эти участки не удаляются из ДНК естественным отбором, если только не оказывают вредного воздействия. Я не буду долго рассказывать об этой ДНК, но не упомянуть о ней нельзя, поскольку она составляет заметную часть нашего генома — как открытое море, разделяющее группы островов (гены).
Судьбы генов. Бессмертное ядро
При анализе целого генома сначала требуется определить локализацию каждого гена в последовательности ДНК. Это позволяет провести инвентаризацию генов данного организма, а именно определить общее число генов и составить список всех генов. Поскольку такая работа проводится уже на протяжении какого-то времени, теперь имеется возможность рассортировывать гены и белки по категориям в зависимости от их функций и сходства с уже известными генами и белками.
При сравнении геномов разных организмов выяснилась удивительная вещь: хотя количество генов и их виды значительно различаются у представителей разных царств и даже внутри одного и того же царства, усложнение организма не сопровождается пропорциональным увеличением количества генов. Как показано в табл. 3.1, у большинства бактерий в среднем около 3 тыс. генов, а самые маленькие геномы свободноживущих видов содержат около 1600 генов. Однако геномы некоторых видов бактерий различаются очень сильно — примерно на 3 тыс. генов. Животные имеют примерно от 13 тыс. до 25 тыс. генов, причем геномы некоторых видов отличаются по размеру на тысячи генов. Такое сложное существо, как плодовая мушка, имеет лишь примерно в два раза больше генов, чем одноклеточные пивные дрожжи, а у человека почти в два раза больше генов, чем у плодовой мушки. Зато у человека и у мыши количество генов почти одинаковое.
Таблица 3.1. Количество генов в геноме некоторых организмов
Однако количество генов — всего лишь общая цифра. Более подробную информацию о ходе эволюции мы получим, если сравним судьбы индивидуальных генов. Различие в количестве генов говорит о том, что какие-то гены, присутствующие в одном организме, отсутствуют в другом. Но, прежде чем приступить к специфическим сравнениям, подумаем о том, что можно обнаружить при сравнении генов организмов, относящихся к разным видам. Какого сходства или различия мы должны ожидать?
В середине XX в., до появления технологии секвенирования ДНК, многие биологи-эволюционисты задавали себе этот вопрос. Они кое-что знали о мутациях и считали, что через длительный период времени мутации должны привести к изменению практически всех оснований ДНК в геноме. Например, при частоте мутаций 1:100 млн пар оснований в каждом поколении через 100 млн поколений большинство позиций в каждом гене подвергнутся мутации хотя бы один раз. Учитывая очень малое время генерации микробов (несколько часов) и небольшое время генерации растений и мелких животных (не более года), не стоит ожидать особого сходства между генами любых двух видов, отделившихся от общего предка 100 млн лет назад. В 1963 году в книге «Зоологический вид и эволюция» (Animal Species and Evolution) известный биолог Эрнст Майр заметил: «Многое из того, что мы узнали о физиологии генов, доказывает, что поиск гомологичных генов [одинаковых генов в разных видах организмов] является довольно бесполезным занятием, за исключением самых близкородственных видов».