Поясним этот процесс на примере картинок, изображенных на рис. 2.1. Пусть поставлена задача распознавания «домиков». Введем два промежуточных понятийных уровня. На первом разместим совокупность понятий «отрезки», на втором — понятия «многоугольники». Понятие «домик» окажется на третьем уровне.
Под понятием «отрезки» мы понимаем совокупность понятий «отрезок с координатами концов x1, y1 и x2, y2», где числа x1, y1, x2, y2 могут принимать любые совместимые с устройством экрана и системой координат значения. Чтобы быть конкретнее, допустим, что экран содержит 1000 × 1000 светочувствительных точек. Тогда координатами могут служить десятиразрядные двоичные числа (210 = 1024 > 1000), а отрезок с заданными концами требует для своей характеристики четыре таких числа, т. е. 40 двоичных разрядов. Всего, следовательно, существует 240 таких понятий. Их-то и должны различать классификаторы первого уровня.
Не надо думать, что отрезок с заданными концами — конкретное понятие, т. е. множество, состоящее из одной картинки. Классифицируя предъявленную картинку как отрезок с заданными концами, мы отвлекаемся от незначительных искривлений линии, вариаций ее толщины и т. п. (см. рис. 2.1). Критерий того, какие отклонения от нормы нам следует считать незначительными, может устанавливаться по-разному. Сейчас это нас не интересует.
Каждый классификатор первого уровня должен иметь на выходе подсистему из 40 двоичных разрядов, на которых «записаны» координаты концов отрезка. Сколько нужно классификаторов? Это зависит от того, какие картинки ожидаются на входе системы. Допустим, что для описания любой картинки достаточно 400 отрезков. Значит, достаточно 400 классификаторов. Разделим этот экран на 400 квадратов (50 × 50 точек) и свяжем с каждым квадратом классификатор, который будет фиксировать ближайший к нему, в каком-то смысле (детали разделения труда между классификаторами несущественны), отрезок. Если отрезка нет, пусть классификатор принимает какое-то стандартное «бессмысленное» состояние, например: все четыре координаты равны 1023.
Если предъявить нашей системе картинку, на которой изображено сколько-то отрезков, то соответствующее число классификаторов первого уровня укажет координаты концов отрезков, а остальные примут состояние «нет отрезка». Это и есть описание ситуации в терминах понятий «отрезки». Сравним количество информации на нулевом и на первом уровнях. На нулевом уровне нашей системы 1000 × 1000 = 106 рецепторов получают информацию в миллион бит. На первом уровне 400 классификаторов, каждый из которых содержит 40 двоичных разрядов, т. е. 40 бит информации, всего 16 000 бит. При переходе на первый уровень количество информации уменьшилось в 62,5 раза. Система сохранила ту информацию, которую она сочла «полезной» и отбросила информацию «бесполезную» с ее точки зрения. Относительность этих понятий видна из того, что если предъявленная картинка не соответствует иерархии понятий системы распознавания, то реакция системы будет неправильной или просто бессмысленной. Если, например, на картинке более 400 отрезков, то не все отрезки будут зафиксированы, а если предъявить картинку с пятном, то реакция на нее будет такая же, как на пустую картинку.
Совокупность понятий «многоугольники», занимающую второй уровень иерархии, мы делим на две меньших совокупности: равнобедренные треугольники и параллелограммы. Из числа параллелограммов мы выделяем в особую совокупность прямоугольники. Считая, что для задания угла и длины надо столько же бит (10), как и для координаты, находим, что для задания определенного равнобедренного треугольника надо 50 бит информации, параллелограмма — 60 бит, прямоугольника — 50 бит. Соответственно этому должны быть сконструированы классификаторы второго уровня. Легко видеть, что вся нужная им информация имеется в наличии на первом уровне. Наличие многоугольника констатируется при наличии нескольких отрезков, находящихся между собой в определенных отношениях. При переходе на второй уровень происходит дальнейшее сжатие информации. Отводя из полного числа 400 отрезков по одной трети на каждый вид многоугольников, получаем систему, способную зафиксировать 44 треугольника, 33 прямоугольника и 33 параллелограмма (одновременно). Ее информационная емкость 5830 бит, т. е. почти втрое меньше, чем емкость первого уровня. Зато перед неправильным треугольником или четырехугольником система встанет в тупик!