Каждые полсекунды аминокислота ложится к аминокислоте, всегда на свое место. Десятки и сотни, даже тысячи аминокислот выстраиваются в ряд на поверхности РНК. Затем аминокислоты соединяются друг с другом в длинную цепь, и готовая молекула белка соскакивает с нуклеиновой матрицы. Порядок построения аминокислот на РНК, а иначе говоря, формула будущего белка зависит от химической структуры той РНК, на поверхности которой они выстраиваются.
А эту структуру, эту матрицу как бы штампует по своему образу и подобию дезоксирибонуклеиновая кислота — ДНК. РНК, химический шифр которой руководит синтезом белка, — сама слепок, копия с ДНК. Молекула РНК «представляет собой как бы приводной ремень, передающий информацию от ядра к рибосомам», — говорит крупнейший наш генетик Николай Петрович Дубинин. А ДНК — это оригинал. Это первоисточник генетической информации. В ДНК и скрыта наша наследственность: алфавитом, в котором всего четыре буквы, и всеми словами, сложенными из них, трехбуквенными, закодированы в ней врожденные свойства живого организма.
Как закодированы?
Приблизительно так же, как человеческие мысли шифруются и передаются от человека к человеку в словах каждого языка. Все идеи человечества, все его бытовые навыки и все знания закодированы в какой-нибудь сотне тысяч слов. Каждое слово, или кодовая группа, состоит из букв. Их немного, несколько десятков. Буквы образуют алфавит. Таким образом, все богатства человеческой мысли, накопленные за тысячелетия, весь этот необъятный, казалось бы, арсенал знаний и идей может быть выражен, сохранен на полках библиотек и передан следующим поколениям в сочетаниях всего лишь нескольких десятков букв, или, как говорят кибернетики, символов.
Но та же самая сверхобширная информация может быть выражена еще меньшим числом букв — всего двумя символами. Примером служит азбука Морзе, в которой различная последовательность точек и тире способна передать все мысли человеческие.
У ДНК алфавит четырехбуквенный. Буквами служат особые химические соединения — азотистые основания: аденин (А), тимин (Т), гуанин (Г) и цитозин (Ц). Кодовыми группами, или словами, — их сочетания в молекулы ДНК. Как в азбуке Морзе определенное чередование тире и точек составляет фразу.
Из скольких же букв, скольких азотистых оснований составлены передающие наследственную информацию слова?
Проще всего в этом разобраться на примере синтеза белков. Ведь первое звено в длинной цепи построения организма по плану, заключенному в наследственности, это созидание специфических для него белков.
Все белки, а их великое множество сортов и разновидностей, строятся на РНК из двадцати аминокислот. Я уже говорил об этом. Так вот, каждая аминокислота занимает свое место на РНК напротив соответствующей ей кодовой группы, то есть соответствующего сочетания азотистых оснований.
Их всего четыре, а аминокислот двадцать. Значит, каждую аминокислоту не может кодировать одно-единственное основание — однобуквенное слово в генетическом лексиконе.
Может быть, двухбуквенное подойдет? Нет, и двухбуквенных мало: ведь аминокислот двадцать, а из четырех букв можно образовать только шестнадцать двухбуквенных слов.
А вот трехбуквенных будет достаточно, и даже с избытком. Ведь каждый из наших четырех символов А, Т, Г, Ц, которыми мы обозначили кодовые азотистые основания, может быть и первой, и второй, и третьей буквой в трехбуквенном слове. Нетрудно подсчитать, что таких слов шестьдесят четыре.
Шестьдесят четыре, а аминокислот-то всего двадцать! Значит, сорок четыре слова-триплета в генетическом языке ДНК лишние?
Впрочем, едва ли. Возможно, что некоторым наиболее часто повторяющимся в белке аминокислотам соответствует не одна, а несколько разных кодовых групп. Одна и та же аминокислота может сесть на поверхность РНК и там, где друг за другом следуют азотистые основания в такой, говоря к примеру, последовательности — АГЦ и в такой — АЦГ, но нигде больше: никакое другое слово генетического алфавита ее не привлечет.
Итак, мы установили, что в генетическом алфавите всего четыре буквы, а все слова, из них составленные, трехбуквенные. Не правда ли, не верится, что этих символов и слов достаточно, чтобы закодировать весь бесконечно разнообразный план строения организма — от синтеза специфических для его тела белков до цвета глаз и свойств характера?