Молекула белка строится из аминокислот, химических соединений сравнительно простой структуры:
причем все различие между отдельными аминокислотами заключается в строении так называемого бокового радикала R.
Химические формулы аминокислот мы приводить не будем, а вот названия на всякий случай перечислим:
глицин, аланин, валин, изолейцин, лейцин
серин, треонин, пролин, метионин, цистеин
аргинин, лизин, фенилаланин, тирозин, гистидин
триптофан, аспарагин, аспарагиновая кислота, глутамин, глутаминовая кислота
Разумеется, запоминать их совершенно необязательно, достаточно просто запомнить место в книге, где приведен этот перечень: в дальнейшем, наткнувшись в тексте на одно из таких названий, вы, возможно, захотите убедиться, что речь идет именно об аминокислоте. (Кстати, разрешение не запоминать наизусть названия всех двадцати аминокислот — голубая мечта каждого студента, готовящегося к экзаменам по биохимии. Увы, мечта совершенно неосуществимая.) Каждая пара аминокислот соединяется друг с другом с выделением молекулы воды, и, таким образом, может образоваться цепочка произвольной длины:
Ее остов имеет регулярную структуру, в которой повторяется один и тот же элемент — так называемая пептидная группа, а привески — боковые радикалы — могут чередоваться в любом порядке. Элементарный фрагмент такой цепочки называется аминокислотным остатком (он выделен штриховой рамкой).
Легко заметить, что при описанном способе построения белковой молекулы на одном ее конце будет свободная аминогруппа — NH2, на другом — карбоксигруппа — COOH. Это означает, что последовательность аминокислотных остатков в белке (так же, как и оснований в ДНК или РНК) направленная, то есть молекулы какой-либо пары аминокислот, например аланина и глицина, можно соединить друг с другом двумя различными способами, так, чтобы в одном из них остаток глицина участвовал в образовании пептидной связи своей аминогруппой, во втором — карбоксигруппой.
Попросим нескольких человек выстроиться в ряд по росту, взявшись за руки; два способа построения — убывание роста слева направо или справа налево — будут принципиально различными. Каждый участник такого построения будет держаться за руку более высокого соседа либо левой, либо правой рукой, и в зависимости от способа построения у самого высокого участника окажется свободной либо левая, либо правая рука. Для придания определенности можно потребовать, чтобы свободной у него оказалась, к примеру, именно правая рука, а у самого низкорослого участника — левая.
Совершенно аналогично аминокислотные последовательности белков принято записывать в направлении от остатка, несущего группу NH2 (называемого N ― концевым остатком), к остатку, несущему карбоксигруппу СООН (С ― концевому остатку).
Нуклеиновые кислоты и белки — полимеры принципиально разной структуры, и сам молекулярный механизм синтеза белковой молекулы на основе инструкции, содержащейся в молекуле РНК, не имеют ничего общего со сравнительно простыми схемами репликации и транскрипции. Он намного сложней, и тем больше чести для исследователей, благодаря которым ныне известны основные принципы его организации. Однако нас пока интересует не этот механизм, а вопрос чисто формального «перевода» РНК-овых последовательностей на язык молекул белка.
Разумеется, нет ничего принципиально невозможного в передаче последовательности символов двадцатибуквенного алфавита последовательностью символов четырехбуквенного алфавита. Вспомним хотя бы азбуку Морзе, с помощью которой набор точек и тире переводится в русский текст (а это вместе с цифрами и знаками препинания около 50 различных символов). Однако азбуку Морзе выдумали люди…
С того момента, как на основании многих тонких и остроумных экспериментов биологам стало ясно, что последовательность аминокислотных остатков в молекуле белка определяется нуклеотидной последовательностью РНК, вопрос о способе кодирования сделался самой злободневной проблемой и для экспериментаторов и для теоретиков. Мы снова воздержимся от исторических экскурсов, ограничившись перечислением фамилий основных героев эпопеи расшифровки генетического кода — американцев М. Ниренберга, С. Очоа и англичанина Ф. Крика. Обратимся лучше сразу к плодам их усилий.
С формальной точки зрения структура генетического кода сравнительно проста. Последовательность нуклеотидов в нити РНК при чтении мысленно подразделим на тройки оснований (именно мысленно, поскольку никаких структурных признаков такого подразделения нет). Тогда, как оказывается, каждой тройке может быть сопоставлен один из двадцати аминокислотных остатков. Общее число всех возможных троек (их называют еще триплетами) — 64 (то есть 4×4×4), так что большинство остатков может кодироваться несколькими способами. Кроме того, есть два особых триплета, которыми обозначаются начало и конец аминокислотного «текста» — белковой молекулы.