Выбрать главу

То есть ухо должно быть таким, чтобы только соответствовать этим задачам, и лучше ему быть ни к чему. Поэтому у уxa сохранились некоторые анатомические особенности, и вот как раз исследования Цвикера выявили их удивительную широту. Например, каждый человек различает два одновременных тона с интервалом в полутон или больше, а Цвикер обнаружил, что если чуть приблизить высоту тонов друг к другу, то ухо можно обмануть: оно услышит один тон. Особенно это проявляется, если нижний тон звучит громче. Также любой слушатель различает два щелчка с временным интервалом в полсекунды, но если укоротить это время на пару миллисекунд, то ухо снова обманывается и объединяет эти два щелчка в один. И здесь вновь эффект ещё более заметен, если один щелчок громче. В общем, вывод из этих иллюзий «психоакустической маскировки» таков: та реальность, которую слышит человек — по большей части фикция.

Со временем Зайтцер начал опережать своего наставника. Цвикер — анатом, его прозрения относятся к аналоговой эпохе. Зайтцер, напротив — компьютерный инженер, человек грядущей цифровой эры. У него родилась догадка о том, что, используя исследования и выводы Цвикера о несовершенстве слуха, можно делать высококачественные музыкальные записи, занимающие небольшой объём. Это прозрение открыло перед ним новые перспективы. Когда в 1982 году был представлен формат компакт-диска, инженеры превозносили его как самое главное достижение в звукозаписи. Зайтцер — практически единственный, кто счёл компакт-диск нелепым упражнением в излишестве. Рекламные тексты обещали «Идеальный звук навсегда»[6], но Зайтцер видел лишь залежи ненужной информации, большая часть которой не воспринимается человеческим ухом. Он понял, что большую часть данных, записанных на компакт-диске, можно попросту выбросить — собственно, человеческое ухо именно так и делает.

В том же году Зайтцер попытался запатентовать «Цифровой музыкальный аппарат». Идея была красивой: вместо того, чтобы печатать на заводе миллионы дисков, паковать их в пластмассовые коробочки и развозить в магазины, всю музыку загружают на сервер, к которому люди получают доступ через телефонную линию (в Германии как раз начали устанавливать новые цифровые телефонные линии), и где с помощью компьютерной клавиатуры можно выбрать любую музыку, которая становится доступной в любое время. Всё это — по подписке. Такой сервис избавляет от неудобств, связанных с физическими носителями: стереозвук доставляется прямо в телефонную трубку. Заявку на патент отклонили. Первые телефонные цифровые линии были крайне примитивны, и данные с компакт-диска никак не могли «пролезть» в их узкий канал. Чтобы воплотить идею Зайтцера, музыкальные файлы требовалось уменьшить в 12 раз[7], а в то время технологии сжатия такое даже близко не позволяли.

Несколько лет Зайтцер бился с патентным экспертом, доказывая, насколько важны открытия Цвикера, но без практических доказательств всё это оказалось совершенно безнадёжным. В конце концов, заявку свою Зайтцер отозвал, но от идеи не отказался. Цвикер уже определил недостатки восприятия уха, так что оставалось измерить их математическим способом. У Зайтцера это так и не получилось, как и у других исследователей. Но он наставил на этот путь и воодушевил своего юного протеже: студент, будущий инженер-электрик, Карлхайнц Бранденбург показался ему одним из самых умных людей, с кем он когда-либо общался.

Бранденбург заподозрил, что десять лет настольного тенниса со странным специалистом по слуху просто лишили Зайтцера рассудка. В цифровую эпоху информация хранится в битах: ноль и единица. Цель сжатия — использовать как можно меньше бит. Одна секунда стереозвука на компакт-диске требовала более 1,4 миллиона бит, но Зайтцер хотел уместить ее в 128 тысяч.

Бранденбург счёл эту цель абсурдной: это как собрать автомобиль за 200 долларов. Но, тем не менее, она показалась ему достойной его амбиций. Следующие три года он работал над этой задачей, пока, наконец, в начале 1986 года не набрёл на направление, которое никто не изучал. Назвав свою идею «анализ синтезом», он следующие несколько недель почти не спал — писал математические инструкции определения этих драгоценных бит. Начал он с нарезки аудио. С помощью «сэмплера» он нарезал входящий звук на тоненькие «щепочки» длительностью в одну секунду. Затем «банком фильтров» рассортировывал их по частотам (банк фильтров делал со звуком то же, что призма со светом). В результате появилась сетка времени и частоты, состоящая из микроскопических фрагментов звука, рассортированных в узкие высотные «ленты» — аудиовариант пикселей. Затем Бранденбург обучил компьютер упрощать эти «аудиопиксели», используя четыре трюка из психоакустического арсенала Цвикера.

вернуться

6

Фраза на демонстрационном компакт-диске фирмы Philips, 1982 года: «Чистый идеальный звук — навсегда». Этот диск содержал песни Элтона Джона. Dire Straits и голландской Swing College Band.

вернуться

7

Цифровая информация накапливается в «битах»: единицах двоичной системы счисления, 0 и 1. Битрейт компакт-диска - 1411,2 килобита в секунду (kbps). Другими словами, на одну секунду цифрового стереозвука требуется 1 411 200 бит. Первая цифровая телефонная линия в Германии передавала данные на 128 kbps, то есть 128 000 битов в секунду. Получается, что CD в 11 025 раз был «шире» этой линии. С консервативным инж подходом Зайтцер округлил число.