Выбрать главу

Быстрые и экономные деревья

Врачи скорой помощи должны определить, нуждается ли пациент в немедленном лечении или его можно вылечить позже; солдаты контрольно-пропускного пункта должны определить, является ли приближающийся автомобиль дружественным или в нем заложена бомба смертника; а менеджерам нужно решить, стоит ли повышать сотрудника в должности или нет. Быстрые и экономные деревья - это инструменты для принятия таких классификационных решений. В отличие от сложных деревьев решений, быстрое и экономное дерево проверяет только несколько подсказок или вопросов и пытается принять решение после каждого из них.

Быстрое и экономное дерево: Простое дерево решений с n подсказками и n + 1 выходом.

Он состоит из трех строительных блоков:

Правило поиска: Поиск по подсказкам в заранее определенном порядке.

Правило остановки: Остановите поиск, если подсказка ведет к выходу.

Правило принятия решений: Действуйте в соответствии с тем, что указывает выход.

В ходе эксперимента мы попросили менеджеров принять решение о сохранении или увольнении продавца на основе его еженедельных показателей продаж. 8 Среднее значение, тенденция и вариации показателей были видны на графике, обобщающем данные о продажах. Правило, которое взяли на вооружение многие менеджеры, - это "дерево быстрых и экономных", показанное на рисунке 3.4 . Сначала посмотрите, превышает ли средний показатель продаж данного сотрудника. Если да, то человека не увольняют и не задают других вопросов . Если показатели ниже среднего, то следующий вопрос - есть ли тенденция к росту показателей. Если нет, то человека увольняют; в противном случае задается последний вопрос об изменении объема продаж, после чего принимается решение. В отличие от полного дерева решений, в деревьях быстрого и экономного принятия решений важен порядок следования подсказок. Первая подсказка может сразу привести к принятию решения, а остальные подсказки не могут его отменить. Например, человека с показателями выше среднего оставляют на работе, даже если тенденция к снижению и еженедельные продажи сильно колеблются.

Рисунок 3.4

Быстрое и экономное дерево, используемое менеджерами для принятия решения о том, оставить или уволить продавца. Если средние показатели продаж выше среднего, продавца оставляют. В противном случае задается второй вопрос о динамике показателей, который может привести или не привести к принятию решения. Третий вопрос об изменении показателей задается в тех случаях, когда первые два вопроса не приводят к принятию решения.

Наилучший и дельта-вывод

Быстрые и экономные деревья - это эвристики для принятия решения по одной цели (например, уволить ли сотрудника), в то время как take-the-best и delta-inference - эвристики для выбора между двумя альтернативами. В остальном их логика и структурные блоки аналогичны логике быстрых и экономных деревьев. Разница между ними заключается в том, что take-the-best обычно обрабатывает бинарные сигналы (например, имеет ли кандидат на работу высшее образование), тогда как delta-inference может обрабатывать все типы сигналов, непрерывные, категориальные и бинарные (например, баллы IQ кандидатов и уровень их образования). Дельта в дельта-инференции означает пороговое значение, при превышении которого альтернативы считаются достаточно разными по признаку; в этот момент поиск прекращается и принимается решение.

Рассмотрим Национальную футбольную лигу (НФЛ), лигу профессионального американского футбола. В США это самая популярная спортивная лига с точки зрения получаемых доходов, а игры НФЛ смотрят миллионы людей каждую неделю в течение всего игрового сезона. Журналист Грегг Истербрук писал колонку о футболе под названием "Tuesday Morning Quarterback" для ESPN. В 2007 году два читателя независимо друг от друга написали ему, предложив простую модель прогнозирования: побеждает команда с лучшим рекордом; если рекорды равны, то побеждает домашняя команда. 9 По сути, эта модель является примером дельта-инференции, в которой первым критерием является рекорд команд по победам и поражениям, а вторым - домашняя команда или гостевая (см. рисунок 3.5 ). Дельта в критериях "рекорд выигрыша-проигрыша" установлена на 0 (т. е. любая разница приведет к предсказанию), а кит "домашняя команда" является бинарным.

Рисунок 3.5

Эвристика дельта-инференции применяется для прогнозирования победителей матчей НФЛ. При игре между двумя командами прогнозируется, что в предстоящем матче победит команда с лучшим рекордом. Если рекорды двух команд равны, то победа прогнозируется за хозяевами.