Уже из ранних версий своей модели Мори понял, что традиционные данные игровой статистики – очки, подборы и передачи за игру – могут вводить в заблуждение. Были игроки, набиравшие много очков, но мешавшие другим игрокам; были и такие, что забивали мало, но являлись ценным активом команды. «На компьютерную модель не влияет человеческий субъективизм, она заставляет вас задавать правильные вопросы, – рассказывает Мори. – Почему некий игрок очень высоко оценивается скаутами, а в модели у него низкий рейтинг?»
Он не считал, что модель будет давать «правильные ответы» и тем более «лучшие ответы». И отнюдь не предполагал, что компьютерная программа подберет игроков в команду сама по себе. Модель, очевидно, нуждалась в настройке и наблюдении, хотя бы потому, что могут появиться сведения, в которые она не посвящена. Если игрок, например, сломал себе шею в ночь перед драфтом, было бы неплохо это знать. Но если бы вы спросили Дэрила Мори в 2006 году, что он выберет – свою модель или кучу баскетбольных скаутов, – он выбрал бы модель.
Считается, что все началось в 2006 году. Мори увидел, что до него никто еще не использовал модель для оценки баскетболистов и никто не удосужился собрать необходимую статистическую информацию. И тогда он отправил людей в офисы Национальной ассоциации студенческого спорта в Индианаполисе копировать кипы документов каждой игры каждого колледжа за последние двадцать лет. Все эти данные затем вручную ввели в систему.
Теперь у них было двадцать лет баскетбольной истории. Новая база данных позволяла сравнивать игроков с похожими на них игроками в прошлом и приходить к важным выводам.
Все, что делали тогда «Хьюстон рокетс», сейчас звучит просто и очевидно. Это тот же подход, что и у трейдеров с Уолл-стрит, руководителей американской президентской кампании и любого современного предприятия, которое пытается использовать данные о вашем поведении в Интернете, чтобы предсказать, что вы могли бы купить или посмотреть. Но для 2006 года в этом не было ничего простого. А многое из того, в чем нуждался Мори, еще и не было доступно.
«Рокетс» начали собирать свои собственные оригинальные данные, пытаясь измерить то, что раньше не измерялось. Вместо количества подборов у игрока, например, стали считать количество реальных возможностей для подбора и сравнивать его с фактическим. Они также отслеживали счет в игре, когда данный игрок был на площадке, в сравнении с тем, когда он оставался на скамейке запасных. Количество очков, подборов и перехватов за игру было не очень информативно, а вот за минуту – имело большое значение. Потому что 15 очков, если вы отыграли только половину игры, – это больше 15 очков за всю игру.
А из студенческих массивов информации можно было выудить и темп, в котором играли различные команды колледжей. Сопоставление игровой статистики игрока с темпом игры его команды давало ценную информацию. Очки и подборы за игру, в которой было сделано 150 бросков, – это одно, а когда 75 – совсем другое. Поправка на темп давала более ясную картину достижений игрока.
Мори собирал такие данные на баскетболистов, которые раньше вообще никого не интересовали; даже не обязательно связанные с баскетболом. Задавался вопросами о жизни игроков и ее параметрах. Хорошо ли для игрока иметь двух родителей? Преимущество ли быть левшой? Имеют ли склонность к баскетболу выпускники колледжей с сильным тренером? Помогает ли наличие в родословной игрока НБА? Имеет ли значение, если он сначала учился в двухгодичном колледже? А если его тренер играл в зонной защите? Хорошо ли для молодого спортсмена то, что в колледже он играл на разных позициях? Важно ли, какой вес он берет в жиме лежа?
«Почти все, что мы узнали, стало неожиданностью», – говорит Мори. Но не все. Число подборов за минуту оказалось полезным в прогнозировании будущих успехов больших парней, перехваты за минуту – для невысоких. Рост был не так важен, как та высота, до которой игрок мог дотянуться руками, – их длина играла более важную роль.
Первое испытание на драфте НБА модель Мори прошла в 2007 году (в 2006 году «Рокетс» свои права на отбор молодых спортсменов обменяли). Появился шанс сравнить трезвый, несентиментальный и доказательный подход с интуитивным опытом. В том году «Хьюстон рокетс» получила 26-й и 31-й номера очередей. По расчетам Мори, шансы добыть хорошего игрока НБА с таких позиций были, соответственно, 8 % и 5 %. Шанс найти будущую звезду – примерно один на сотню. И они взяли Аарона Брукса и Карла Лэндри. Это был невероятно богатый улов[6].
6
Не существует идеального способа измерить качество выбора игрока на драфте, но есть один относительный. Сравнение позиции игрока в его первые четыре года в команде НБА с позициями других игроков. По этой шкале Карл Лэндри и Аарон Брукс были 35-м и 55-м из шести сотен спортсменов, выбранных командами НБА за последнее десятилетие.