Эта анаконда по-английски записывается 1185 буквами[15], а по-русски – всего 1148 буквами.
Теперь, когда большинство из вас просто пробежали глазами приведенное название, возможно, восприняв только «ацетил» и «серин», давайте еще раз взглянем на это слово. Распределение букв в нем оказывается довольно интересным. Буква «е», самая распространенная в английском языке, встречается 65 раз, буква «у» – наименее распространенная – целых 183 раза. Всего на одну букву, «l», приходится 22 % слова (255 раз). Причем буквы «у» и «l» разбросаны не как попало, а зачастую встречаются рядом друг с другом – они образуют 166 пар, расположенных с интервалом около 7 букв. Все это неслучайно. Рассматриваемое нами длинное слово – это название белка, а белки построены на основе шестого, наиболее многофункционального элемента периодической системы – углерода.
В частности, атомы углерода образуют каркасы аминокислот, которые соединяются друг с другом как бусины, образуя белки. Белок вируса табачной мозаики состоит из 159 аминокислот. Поскольку биохимикам зачастую приходится подсчитывать множество аминокислот, они следуют простому лингвистическому принципу. Принято отсекать от названия аминокислоты суффикс «ин» – как в словах «серин» или «изолейцин» – и заменять на «ил», чтобы получался компонент «серил» или «изолейцил». Если расположить эти «илы» в правильном порядке, они точно описывают структуру белка. Мы с вами, не будучи лингвистами, легко понимаем значение составных слов. Так и биохимики в 1950-е годы и начале 1960-х годов давали молекулам официальные наименования вроде «ацетил…серин», чтобы можно было воссоздать формулу молекулы по ее названию. Это точная, хотя и сложная система. Тенденция к соединению корней и созданию составных слов исторически сложилась из-за того, что в развитии химии важнейшую роль сыграли немецкие ученые и немецкий язык, богатый сложными и длинными словами.
Но почему же аминокислоты связываются в первую очередь друг с другом? Дело в том, какое место углерод занимает в периодической системе. Для заполнения своего внешнего энергетического уровня атому углерода требуется восемь электронов – это универсальное правило называется «правилом октета». Напористость разных атомов и молекул в поиске пары у разных веществ отличается, и аминокислоты относятся к более-менее «цивилизованным» соединениям. На одном конце каждой молекулы аминокислоты находятся атомы кислорода, на другом – атомы азота, а в середине – ствол длиной в два атома углерода. Кроме того, в аминокислотах содержится водород, а от главного ствола могут отходить разные веточки, в результате чего могут образоваться 20 разных молекул, но нас это пока не интересует. И углероду, и азоту, и кислороду требуется по восемь электронов для заполнения внешнего энергетического уровня, но одним элементам легче набрать такие комплекты, чем другим. У кислорода, элемента № 8, всего восемь электронов. Два из них находятся на нижнем энергетическом уровне, который заполняется в первую очередь. На внешнем уровне остается шесть – итак, до полного комплекта атому кислорода не хватает двух электронов. Найти два электрона не так сложно, а агрессивный кислород может диктовать условия и обирать другие атомы. Но та же арифметика подсказывает, что бедный углерод, потратив два электрона на заполнение первой оболочки, остается всего при четырех электронах на втором уровне – и до октета ему недостает еще четырех. Сделать это не так просто, поэтому углерод не слишком привередлив при создании химических связей. Он готов соединяться практически с кем угодно.
Такая неприхотливость углерода – это огромное благо. В отличие от кислорода, углероду приходится образовывать связи с другими атомами во всех возможных направлениях. На самом деле, углерод может делиться своими электронами даже с четырьмя атомами одновременно. Таким образом, углерод способен образовывать длинные цепочки и даже объемные сети молекул. Поскольку углерод делится электронами, а не ворует их, углеродные связи получаются надежными и стабильными. Азоту также требуется создавать многочисленные связи для приобретения октета, но не в такой степени, как углероду. Белки, включая упомянутый выше белок табачной мозаики, используют эти простые правила. Атом углерода на конце одной аминокислоты делится электроном с атомом азота на конце другой аминокислоты. Образуются белки, в которых такие связи углерода и азота тянутся почти до бесконечности, как буквы в длинном-длинном слове.
15
Мнения о том, каково самое длинное слово, появившееся в Chemical Abstracts, разнятся. Многие специалисты считают, что это действительно название белка вируса табачной мозаики – химическая формула этого белка записывается как С785H1220N212O248S2, но другие отдают пальму первенства белку а фермента триптофансинтетазы. Этот белок напоминает вещество, которое, по ошибочному обывательскому мнению, вызывает сонливость, когда ешь индейку (это распространенное заблуждение). Триптофансинтетаза имеет формулу C1289H2051N343O375S8, а его название по-английски записывается 1913 буквами – это на 60 % длиннее, чем название белка вируса табачной мозаики. Во многих источниках – нескольких изданиях Книги рекордов Гиннеса, на сайте Urban Dictionary (www.urbandictionary.com), а также в «Словаре необычных, странных и нелепых слов миссис Бёрн» – самым длинным словом считается именно название триптофансинтетазы. Но я провел долгие часы, роясь в едва освещенных стеллажах Библиотеки Конгресса, и так и не нашел полного названия этой молекулы в Chemical Abstracts. Вероятно, ее просто ни разу не именовали полностью. Чтобы абсолютно в этом удостовериться, я отыскал академическую статью, в которой рассказано о расшифровке формулы триптофансинтетазы (в списках Chemical Abstracts ее не было), и даже там авторы решили сокращенно записать последовательность аминокислот. Итак, насколько я могу судить, полное название этого белка ни разу не появлялось в печати. Вероятно, именно поэтому составители Книги рекордов Гиннеса лишили его звания самого длинного слова.
Но мне удалось найти целых два случая, когда белок вируса табачной мозаики был назван полностью. Первый раз – на странице 967F коричневатого фолианта Chemical Abstracts Formula Index, Jan.-June 1964, а потом на странице 6717А в Chemical Abstracts 7th Coll. Formulas, С 23H 32-Z, 56–65, 1962–1966. Обе книги представляют собой реферативные справочники, в которых собираются данные обо всех научных химических статьях, опубликованных в указанный на обложке период. Таким образом, что бы ни писали в других источниках о самом длинном слове в мире (особенно в Интернете), полное название белка вируса табачной мозаики встречается лишь дважды – в 1964 и 1966 годах, но не в 1972-м, как иногда утверждают.
Более того: статья о триптофансинтетазе вышла в 1964 году, и в том издании Chemical Abstracts за 1962–1966 годы упоминается еще немало веществ, в молекулах которых содержится больше атомов С, H, N, О и S, чем в белке вируса табачной мозаики. Почему же их не записывали целиком? Дело в том, что большинство этих статей вышло после 1965 года, а именно в этом году компания Chemical Abstracts Service, расположенная в Огайо и собирающая все эти данные, пересмотрела свою систему номенклатуры новых соединений и отказалась от названий, которые просто невозможно охватить взглядом. Но почему же кто-то не поленился полностью записать название белка вируса табачной мозаики в справочнике от 1966 года? Его можно было сократить, но для него было сделано исключение. И последний нюанс: оригинал статьи о вирусе табачной мозаики от 1964 года был опубликован по-немецки. Но справочник Chemical Abstracts – это англоязычный документ, выдержанный в славных традициях компендиумов Сэмюэла Джонсона и Оксфордского словаря. Это название появилось в печати не ради рекорда, а с целью распространения знаний. Поэтому данное слово действительно может считаться самой длинной смысловой лексемой.
Уф.
Кстати, я выражаю признательность Эрику Шайвли из Crystal Poole Bradley и особенно Джиму Корнингу из Chemical Abstracts Service, которые очень помогли мне в сборе всей этой информации. Они были совершенно не обязаны отвечать на мои путаные вопросы вроде «Здравствуйте. Я тут ищу самое длинное английское слово, но не знаю, с чего начать», но тем не менее отвечали.
Так случилось, что вирус табачной мозаики оказался не только первым открытым вирусом, но и первым из подобных существ, чьи форма и структура были тщательно проанализированы. Некоторые выдающиеся работы в этой области принадлежат перу Розалинд Франклин – специалисту по кристаллографии, которая благородно, но простодушно поделилась результатами своих исследований с Уотсоном и Криком (подробнее об этом – в главе 8). А буква «а» из выражения «белок а триптофансинтетазы» относится к кругу вопросов, рассмотренных в работах Лайнуса Полинга и посвященных тому, как белки «узнают», какую форму им следует принять. Об этом – опять же в главе 8.