Выбрать главу

Мы помолчали.

– И я не хочу ставить «3» там, где должно быть «2». И отчисление. Которого больше не существует.

Я вспомнила студента по имени Егор, который учится на специальном машиностроении. Да, Саша, я понимаю, о чем ты.

– По итогам семестра многих уволят. Очень достойных преподавателей пожилого возраста. Старая гвардия больше не нужна. Выполнение плана по статьям важнее. Я решил съездить домой на две недели. Параллельно буду думать, что с работой. Когда вернусь, встретимся на кофе.

Саша подарил мне вазу из лампы накаливания, которую он сделал своими руками, и маленький букет роз, перевязанный жёлтой лентой. Я повесила вазу на карниз для штор, и моя мансарда стала уютнее.

9

Саша работал исследователем данных в новостном агентстве. Над проектом «Экран событий». Целью был анализ новостей за сутки и выделение главные темы. Пока редакторы делали это вручную. Предполагалось, что система облегчит их работу и представит информацию в простом, эстетически приятном виде.

Команда состояла из трёх человек. Java-разработчик Володя собирал новости с сайтов и складывал их в базу, разворачивал параллельные вычисления и обеспечивал связь с отделом системных администраторов. Саше нужно было причесать данные. Убрать все лишнее, и превратить кипу текстов в огромную матрицу нулей и единиц. В основном нулей. Матрица была большая и по-особенному хранилась в памяти. К счастью, Саше не нужно было об этом думать. Все написано до нас разработчиками Python. Дальше надо было скормить разреженную матрицу одному из алгоритмов машинного обучения. И все. Делов-то.

Web-разработчик Влад превращал выходной поток чисел в небесно-голубые пузырьки свежих историй. Мыльные пузырьки меняли положение, перемешивались друг с другом. Уступали место новым. К каждому пузырьку можно было прочесть описание. Получить список новостей по теме. Время начала и конца публикаций на просторах интернета. Ну и так далее. У менеджера проекта в голове был ещё десяток идей. Но это потом.

Казалось, что работы у Саши на месяц. Ведь все алгоритмы машинного обучения уже реализованы. Их использование заключалось в написании одной строчке кода. Тонкость была в том, что каждый алгоритм содержал параметры. Их нужно было настроить. И здесь начиналось искусство. Или знание высшей математики. Линейной алгебры. Геометрии случая. Лучше было поговорить об этом с Сашей.

Причёсывание данных тоже было небанальным. Сначала Саша использовал весь текст полностью. Тогда в мире творилась неразбериха. Возможно, на этом можно было бы остановиться. Но глядя матрицы, которые на тестах были не такими огромными, Саша понял, что нельзя принимать решение о важности новости, руководствуясь количеством частиц «не» и местоимений «все». Именно они встречались чаще всего. Почитав, что пишут умные люди на stackoverflow, Саша осознал: надо взять только самые важные части речи. Существительные, глаголы. Постойте. А прилагательные? Наречия? Все это ещё предстояло выяснить.

Новый виток понимания наступил, когда Саша читал блог американского путешественника и дата сайнтиста. Интересно, как в человеке могут сочетаться настолько противоположные вещи. Этот талантливый исследователь указывал на важность приведения слов к нормальной форме. Нормальная форма. Ненормальная форма. Как-то звучит обидно. Так дело дошло до стеммига. Выделения корня слова. Кстати процедуры в английском и русском языке сильно различаются. И вообще есть разные техники. То ли упростишь текст до неузнаваемости и потеряешь половину смысла. То ли выберешь лайтовый вариант, а вместе с ним получишь все старые искажения.

А дальше были тесты. Дни. Недели. Месяцы. Базовой библиотеки машинного обучения оказалось недостаточно, и Саша принял решение перейти к построению графа. После чего удалось получить результат, который команда и менеджер признала удовлетворительным. О чем писали больше всего? Конечно, о политике.

Эдуард был необычным руководителем. Он предоставлял свободу и брал на себя административные вопросы. Не было четкого времени и прихода в офис, обеда или совещаний. Сотрудники часто работали из дома. Или приходили к обеду и засиживались до позднего вечера.

Дизайнер интерфейсов Антон купил небольшие настольные светильники в икее. Тот, кто первым приходил в офис, включал все лампы и до конца дня они горели мягкими, сдержанными огоньками. Для каждого, кто бродил в темноте в поисках путей и решений. Члены команды во второй половине дня устраивали шведское фика около капсульной кофемашины. Иногда это случалось и утром. Ближе к вечеру все перемещались кодить на разноцветные пуфики и иногда заказывали пиццу.