Чтобы избежать этих проблем, ученые из Калифорнийского университета в Беркли в 2009 году разработали программное обеспечение, с помощью которого «окна» скользят вдоль цепочки символов в поисках сходств и образцов. В качестве эксперимента ученые таким образом проанализировали геномы млекопитающих и тексты нескольких десятков книг, таких как «Питер Пэн», «Книга Мормона» и «Государство» Платона. Было обнаружено, что одно и то же программное обеспечение способно, с одной стороны, классифицировать ДНК различных видов млекопитающих, а с другой – классифицировать книги по жанрам с идеальной точностью. Обратившись к спорным текстам, ученые погрузились в изучение постоянно вызывающего споры вопроса о том, получил ли Шекспир достаточно хорошее образование для того, чтобы написать свои пьесы. И программа показала, что классик действительно написал драму «Два знатных родича» – пьесу, авторство которой постоянно подвергалось сомнению, – но не написал «Перикла», другую пьесу спорного авторства. Затем команда из Беркли изучила геномы вирусов и архебактерий, самых старых и в массе своей чужеродных для нас форм жизни. Этот анализ выявил новые связи между этими организмами и другими микробами, в результате были выдвинуты новые предложения по их классификации. Из-за огромного объема данных анализ геномов мог получиться весьма глубоким: в течение года 320 компьютеров занимались только тем, что сканировали микробы и архебактерии. Однако анализ этих геномов позволил ученым выйти за рамки обычного пошагового сравнения генов и понять полную естественную историю этих биологических видов.
Расшифровка полной геномной истории, однако, требует более сложных навыков, чем работа с другими текстами. Расшифровка ДНК требует чтения и слева направо, и справа налево – так называемый бустрофедон. В противном случае можно пропустить важные палиндромы и морднилапы: соответственно слова, которые одинаково читаются с обеих сторон или же приобретают другой смысл при прочтении с конца.
Один из самых древних известных палиндромов – высеченный на стене в Помпеях (и других городах) магический квадрат, слова в котором читаются сверху вниз, снизу вверх, справа налево и слева направо:
S-A-T-O-R
A-R-E-P-O
T-E-N-E-T
O-P-E-R-A
R-O-T-A-S[22]
Насчитывая примерно две тысячи лет от роду, данная надпись на порядок младше, чем по-настоящему древние палиндромы в ДНК, которая создала целых два вида палиндромов. Во-первых, это фразы традиционного («А роза упала на лапу Азора») типа: например, Г-А-Т-Т-А-Ц-А-Т-Т-А-Г. Однако поскольку АТ и ЦГ – это парные основания, ДНК образовывает и другие, менее явные палиндромы, которые спереди читаются по одной нити, а сзади – по другой. Сравните нить Ц-Т-А-Г-Ц-Т-А-Г, затем представьте основания, которые должны появиться на другой нити: Ц-А-Т-Ц-Г-А-Т-Ц. Это совершенные палиндромы.
Безобидный на вид, этот второй тип палиндрома может нагнать страху на любого микроба. Давным-давно многие микробы выделяли специальные белки (под названием «ферменты рестрикции»), которые могли резать ДНК подобно кусачкам. И по какой-то причине эти ферменты могут разрезать ДНК только в ее симметричных, палиндромных участках. Подобные надрезы служат и полезным целям: к примеру, выбрасывают из спирали основания, пораженные радиацией, или снимают напряжение в сильно запутанной ДНК. Однако непослушные микробы в основном использовали эти белки, чтобы воевать друг с другом и перерабатывать чужой генетический материал. В результате микробы методом проб и ошибок научились избегать даже неочевидных палиндромов.
Впрочем, высшие существа, к которым относимся мы сами, тоже не то чтобы толерантны к палиндромам. Снова рассмотрим Ц-Т-А-Г-Ц-Т-А-Г и Г-А-Т-Ц-Г-А-Т-Ц. Отметим, что начало каждого из палиндромных сегментов может образовывать пары оснований со своей второй половиной: первая буква с последней (Ц…Г), вторая с предпоследней (А…Т) и т. д. Но для того, чтобы сформировать эти внутренние связи, одна сторона нити ДНК должна абстрагироваться от другой и выгнуться вверх, образовав выступ. Такая структура (так называемая шпилька) благодаря симметричному строению может образовывать ДНК-палиндром любой длины. Как и следовало ожидать, «шпильки» могут разрушать ДНК так же, как и узлы: разрушая клеточные механизмы.
22
Этот палиндром переводится примерно так: «Крестьянин Арепо работает с плугом», где rotas (в буквальном смысле – «колеса») обозначает движения туда и назад, которые совершает плуг при вспашке. Этим «магическим квадратом» на протяжении столетий восхищались любители головоломок, однако ученые предполагали, что это не просто забава: во времена жестоких римских императоров она могла служить другим целям. Анаграмма этих 25 букв может выглядеть как дважды написанное перекрещенное paternoster – «Отче наш». Четыре оставшиеся буквы, две «а» и две «о», могут обозначать «Альфа и омега» (выражение, известное из книги Иоанна Богослова). Согласно этой версии, христиане могли рисовать этот безобидный палиндром на своих дверях и тем самым подавать друг другу сигналы, не опасаясь подозрения со стороны римлян. Волшебный квадрат также считался средством против черта, так как палиндромы могут сбить его с толку.