Выбрать главу

Я говорил уже в общих чертах об обучающихся машинах. Я отведу особую главу для более подробного рассмотрения этих машин, их возможностей и некоторых проблем их использования. Пока же хочется сделать несколько замечаний общего характера.

Как мы увидим в гл. I, понятие обучающихся машин столь же старо, как и сама кибернетика. В случае описанных мною приборов управления артиллерийским зенитным огнем линейные характеристики предсказывающего устройства, используемого в данное время, зависят от долговременного знакомства со статистиками ансамбля тех временных рядов, которые мы хотим предсказать. Эти характеристики можно найти математически. по изложенным там принципам, но вполне возможно придумать вычислительную машину, которая будет собирать эти статистики и вырабатывать кратковременные характеристики предсказывающего устройства на основании опыта, уже пережитого самим предсказывающим устройством и записываемого автоматически. Это может пойти гораздо дальше чисто линейного предсказывающего устройства. В ряде статей Каллианпура, Мазани, Акутовича и моих[86] развита [c.36] теория нелинейного предсказания, которую можно, по крайней мере в принципе, механизировать аналогичным образом, с использованием долговременных наблюдений как статистической основы для кратковременного предсказания.

Обе теории предсказания — линейного и нелинейного — предполагают определенные критерии качества предсказания. Простейший, хотя отнюдь и не единственный пригодный, — это критерий наименьшей среднеквадратической ошибки. Он применяется здесь в частном виде с функционалами броунова движения, использованными мною для синтеза нелинейных устройств, поскольку различные члены моего разложения имеют некоторые свойства ортогональности. Эти свойства гарантируют, что частичная сумма конечного числа членов дает наилучшую имитацию рассматриваемого устройства, какая только может быть получена с этими членами при указанном критерии. Метод Габора также основан на среднеквадратическом критерии ошибки, но в более общем виде, пригодном для временных рядов, полученных из опыта.

Понятие обучающихся машин можно распространить на гораздо более широкую область, нежели предсказывающие устройства, фильтры и тому подобные приборы. Особенно важно оно для изучения и конструирования машин, играющих в игры со встречными интересами, как, например, в шашки. Здесь интересную работу выполнили Сэмьюэл[87] и Ватанабе[88] в лабораториях фирмы «Интернешнел Бизнес Машине». Как и в случае фильтров и предсказывающих устройств, здесь подбираются какие-то функции временных рядов, на которые можно разложить функции гораздо более широкого класса. Выбранные функции могут включать численные оценки существенных величин, от которых зависит успех игры. Например, они включают число фигур с обеих сторон, господство над пространством, подвижность и т. д. В начале работы машины этим факторам даются пробные [c.37] веса, и машина выбирает допустимый ход, имеющий наибольший общий вес. Эти действия машина проводит по жесткой программе, без какого-либо оборудования.

Но время от времени машина переходит к другой задаче. Она пробует разложить функцию, равную 1 при выигрыше, 0 при проигрыше и, положим, 1/2 при ничьей, по различным функциям, выражающим факторы, которые машина способна учитывать. Тем самым она заново определяет вес этих факторов, чтобы вести затем более сложную игру. Некоторые свойства таких машин будут рассмотрены в гл. IX, здесь же я должен сказать, что применение подобных оценок позволяет машине обыграть своего программиста после 10—20 часов обучения и тренировки. Я также упомяну в этой главе о некоторых аналогичных машинах, предназначенных для доказательства геометрических теорем и для имитации — в ограниченной степени — логики индукции.

Вся эта работа составляет часть теории и практики двойного программирования[89], которые усиленно изучались в лаборатории электронных систем Массачусетсского технологического института. Там было установлено, что, если не применять какое-либо обучающееся устройство такого типа, программирование машины с жесткой схемой представляет собой очень трудную задачу и что существует настоятельная необходимость в устройствах для программирования этого программирования.

вернуться

86

Wiener N., Masani P. The Prediction Theory of Multivariate Stochastic Processes, Part I // Acta Mathematica. — 1957. — Vol. 98. — P. 111-150; Part II // Ibid. — 1958. — Vol. 99. — P. 93-137. Также Wiener N., Akutowicz E.J. The Definition and Ergodic Properties of the Stochastic Adjoint of a Unitary Transformation. // Rendiconti del Circolo Matematico di Palermo. — Ser. II. — 1957. — Vol. VI. — P. 205-217.

вернуться

87

Samuel A.L. Some Studies in Machine Learning, Using the Game of Checkers. // IBM Journal of Research and Development. — 1959. — Vol. 3. — P. 210-229.

вернуться

88

Watanabe S. Information Theoretical Analysis of Multivariate Correlation. // IBM Journal of Research and Development. — 1960. — Vol. 4. — P. 66-82.

вернуться

89

То есть речь идет об автоматизации программирования. — Прим. ред.