Выбрать главу

20. Интервью с Вадвани.

21. См., например: Peter Е. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra and Robert L. Mercer. The Mathematics of Stratistical Machine Translation: Parameter Estimation // Computational Linguistics 19. No. 2 (1993). Как отмечено ниже, братья Делла Пьетра последовали за Брауном и Мерсером из IBM в Renaissance Technologies.

22. Уже в далеком 1949 году дешифровщики задумывались над применением их методов для перевода. Им не хватало компьютерных мощностей. Статистический перевод зависел от обеспечения компьютера огромным количеством парных предложений, чтобы тот имел достаточно данных для выделения смысловых повторений. На хорошей технической базе статистический перевод стал возможен к 1990 году.

23. Р. Мерсер провел несколько летних сезонов, работая в Институте оборонного анализа с Ником Паттерсоном, британским математиком, позже примкнувшим к Саймонсу. То, что Саймонс был связан с Баумом, также помогло ему убедить Брауна и Мерсера присоединиться к команде. Питер Браун вспоминает: «Когда Джим Саймонс впервые нашел нас с Бобом, мы ничего о нем не знали. Но когда мы услышали, что он работал с Лени Баумом, то отнеслись к его предложению серьезно». (Интервью автора с Питером Брауном, 28 июля 2008.)

24. Описание реакции на работу Брауна и Мерсера дана в: Andy Way. A Critique of Statistical Machine Translation, In W. Daelemans and V. Hoste (eds.) //

Journal of Translation and Interpreting Studies: Special Issue on Evaluation of Translation Technology, Linguestica Antverpiensia. 2009. P. 17–41.

25. См., например: Pius Ten Hacken. Has There Been a Revolution in Machine Translation? // Machine Translation 16. No. 1 (March 2001). P. 1–19. Этот источник ошибочно приписывает слова об увольнении лингвистов Питеру Брауну.

26. Первичная версия программы IBM совсем не содержала лингвистических правил. Следующие версии уже включали какие-то из них, но им отводилась значительно меньшая роль, чем в традиционных переводческих программах.

27. Интервью с Вепсиком.

28. Джон Мэджи, ведущий технический специалист 1950-х годов, считал благоразумным читать только газеты двухнедельной давности, чтобы быть уверенным, что знание экономической ситуации не затуманит его суждений.

29. Р. Мерсер говорит: «Мы размышляем над каждым предложенным сигналом. Но если кто-то придет с теорией, не основанной на интуиции, мы будем изучать ее особенно тщательно». (Интервью автора с Робертом Мерсером, 28 июля 2008.) Такую готовность торговать по статистическим показателям разделяли и люди, которые ранее способствовали успеху Medallion. Например, Элвин Берлекамп вспоминает: «В Medallion мы в основном смотрели на статистику. Мы обнаружили, что на обращении к фундаментальным знаниям далеко не уедешь». (Интервью автора с Элвином Берлекампом, 24 июля 2008.) Интересно также, что соавторы Брауна и Мерсера, последовавшие за ними в Renaissance (Стивен и Винсент Делла Пьетра), выразительно представили свой опыт статистического машинного перевода схожим с поиском заказа в данных другого типа, включая финансовые. См.: Adam L. Berger, Stephen A. Della Pietra, and Vincent J. Della Pietra. A Maximum Entropy approach to Natural Language Processing // Computational Linguistics 22. No. 1 (March 1996). P. 39–71.

30. Чтобы справиться с потенциальным лингвистическим хаосом, происходящим из такой вседозволенности, неологизмы подвергались перепроверке. (Интервью с Мерсером.)

31. Имена русских сотрудников — Павел Вольфбейн и Александр Белопольский. Компания, в которую они дезертировали, — Millennium. Через своего адвоката русские настаивали на том, что их система не была основана на секретах Renaissance. См.: Thomas Maier. Long Island’s Richest Man from math to Money // Newsday. July 5. 2006. P. A04.

32. Интервью с Сильбером.

33. Роберт Фрей объясняет: «Эти исследователи были такими комнатными цветочками. Они сидели в своих офисах. Когда им нужны были данные, они их получали. Они и понятия не имели, сколько всего нужно сделать, чтобы информация стала доступной, чистой и готовой к работе. Стоит только нажать кнопку, и у вас десятки терабайт данных. Тот, кто уходил, так сказать, покидал теплицу и вступал в холодный, жестокий мир, скоро понимал, что, даже если он мог воспроизвести симуляции и все остальное, что отнюдь не было тривиальной задачей, у него все равно не было доступа к историческим данным. Если бы вы сказали мне: «Роберт, ты не подписывал соглашение об отказе от конкурирования, можешь воссоздать для нас Renaissance?» — это бы заняло четыре или пять лет, прежде чем вы бы добрались до точки, когда действительно смогли бы приступить к торгам». (Интервью с Фреем.) Тем не менее нужно отметить, что те дезертиры Medallion, что примкнули к конкурирующему хедж-фонду с развитой исследовательской и трейдинговой инфраструктурой, могли навредить Medallion гораздо раньше, чем через пять лет.