Рассмотрим, например, переход от AVST к разрешенной последовательности MLAI (рис. 2.1, вверху слева). Чтобы превратить AVST в MLAI, нужно заменить четыре аминокислоты. Соответственно, если считать аминокислотную замену единичным эволюционным событием, то кратчайший путь от AVST к MLAI будет состоять из четырех шагов. Разных путей такой длины потенциально существует 24, поскольку аминокислоты можно заменять в разном порядке. Однако из этих 24 кратчайших путей разрешенными оказались только два. Все остальные пути требуют пересечения «пропасти» на ландшафте приспособленности, то есть прохождения через нефункциональный промежуточный этап.
рис. 2.1. Кратчайшие разрешенные эволюционные пути от AVST к последовательностям MLAI и SIQC. Функциональные (разрешенные) последовательности обведены рамками. Контурными буквами обозначены аминокислоты, отсутствующие в начальной и конечной последовательностях. Два левых рисунка в качестве единичного эволюционного события предполагают замену аминокислоты в белке, на правом рисунке таким событием считается замена одного нуклеотида в ДНК. В последнем случае путь получается длиннее из-за структуры генетического кода: от каждой аминокислоты путем замены одного нуклеотида можно прийти не ко всем, а лишь к некоторым из остальных 19 аминокислот. По рисунку из Podgornaia, Laub, 2015.
Во многих случаях все кратчайшие пути оказываются запрещенными. Тогда маршрут из одной точки пространства последовательностей в другую (например, путь от AVST к SIQC, показанный на рис. 2.1 слева внизу) оказывается длиннее, чем кратчайший из потенциально возможных (кратчайший путь предполагает три промежуточных состояния, а на рисунке их четыре).
Ну а если учесть, что реальные единичные мутации обычно представляют собой замену одного нуклеотида в ДНК (а не триплета на любой другой триплет), то проходимость ландшафта окажется еще ниже. На рис. 2.1 справа показан кратчайший разрешенный путь от AVST к MLAI с учетом этого обстоятельства. Теперь он состоит не из четырех, а из целых десяти шагов. Это объясняется структурой генетического кода, которая позволяет путем единичных нуклеотидных замен переходить от данной аминокислоты только к некоторым, но не к любым другим аминокислотам. Например, фенилаланин кодируется триплетами UUU и UUC. Изменив в любом из этих триплетов только одну букву, можно заменить в белковой молекуле фенилаланин на лейцин, изолейцин, валин, серин, тирозин или цистеин. Для перехода к любой из оставшихся 13 аминокислот потребуется не одна, а две или три нуклеотидных замены. Таким образом, эпистаз и структура генетического кода совместными усилиями делают ландшафт приспособленности труднопро- ходимым.
В целом топография изученного плато ландшафта приспособленности оказалась довольно замысловатой. Это плато мало похоже на гладкое, легкопроходимое поле. Оно подразделяется на несколько областей, внутри каждой из которых эволюционирующий белок может передвигаться относительно свободно, однако переход в соседнюю область возможен лишь по немногочисленным тропкам. Некоторые разрешенные последовательности вообще оказываются недосягаемыми из обжитой реальными бактериями области пространства последовательностей. По-видимому, эволюция белок-белкового интерфейса действительно настолько затруднена эпистазом и структурой генетического кода, что эволюция просто не успела разведать многие потенциально доступные области пространства последовательностей.
Данное исследование кому-то может показаться слишком скучным и специальным. Но только не биологам, привыкшим считать «пространство последовательностей» и «ландшафт приспособленности» абстракциями, полезными для теоретических построений, но недосягаемыми для реального изучения. Больше всего впечатляет сам факт, что стало в принципе возможным прямое экспериментальное картирование отдельных областей пространства последовательностей. Хотя, конечно, речь пока идет лишь о четырех аминокислотных позициях, то есть о переборе 204 вариантов. Полное картирование пространства всех возможных белков навсегда останется неразрешимой задачей.