Все числа, которые нужно ввести в машину, набиваются на перфокарту. Как правило, это стандартный прямоугольник из плотной бумаги, на котором напечатана цифровая сетка:
Так, по 80 цифр в ряд, на перфокарте напечатаны нули, единицы, двойки, тройки, четверки, пятерки, шестерки, семерки, восьмерки и девятки. Между рядами восьмерок и девяток есть добавочный ряд — нумерация колонок:
8888888888888888…
123456789 и т. д.
до 80 9999999999999999…
Пробивая ряды и колонки цифр, мы легко можем изобразить почти любое число. Или, иными словами, записать на машинном языке чисел и программу для электронной вычислительной машины, и задание для нее. Перфокарта направляется теперь в «читающее», а вернее, «осязающее» устройство машины.
Проходя через него, пробитые на карте отверстия «читаются», подобно тому как они «читались» в изобретении Жаккара: в пробивку проваливается щуп. Это оказывает на механизм электронной машины такое же действие, как включение контакта или нажатие клавиш. Если есть пробивка, ток идет. Нет пробивки — нет тока. Числа задания и числа программы переводятся на «язык электричества».
В настоящее время для того, чтобы убыстрить этот перевод, начинают использовать другой принцип. Дырки перфокарты «прощупываются» световым лучом. Попав в отверстие-цифру, луч падает на фотоэлемент и, возбуждая ток, выражает числа-отверстия в виде импульсов тока, идущих в «память» машины.
Машина автоматически выражает эти импульсы тока в своем обычном коде — двоичной системе нулей и единиц. Программа работы входит в «память». Специальный счетчик дает сигнал: «конец ввода». Последний раз человек вмешивается в работу «электронного мозга»: с пульта управления нажимает кнопку «начальный пуск». И машина автоматически работает по программе.
Результаты вычислений — а этими вычислениями, повторяем, могут оказаться и перевод с языка на язык, и игра в шахматы, и выбор наилучшего плана в экономике, и многое, многое другое — вновь переводятся с «электронного языка» на перфокарты. Оттуда они поступают на печатающее устройство. Двоичные числа переводятся в десятичные — работа машины окончена. Вот как выглядит итог работы, отпечатанные результаты счета:
+ 628318530 + 01
— 141421356
+ 01 + 000000000
+ 00 + 000000000 + 00
«МАГНИТНЫЕ ЧЕРНИЛА»
Нельзя ли как-то упростить все эти процедуры? Допустим, нам нужен перевод текста с помощью машины. Кодирование букв числами, набивка этих чисел на перфокарты, затем эти же процедуры в обратном порядке — все это, по существу, лишняя работа. Вот если бы было так: на «вход» машины мы кладем книгу на неизвестном языке, а через несколько минут «на выходе» получаем эту книгу, но уже переведенную на русский или какой-либо другой известный нам язык.
Если будет создан язык-посредник, то машинный перевод с любого и на любой язык мира возможен. Однако все процедуры с кодированием, перфокартами и т. п. остаются и занимают, конечно, немало времени.
Если бы машина умела сама читать! Тогда задача была бы гораздо проще… Возможно ли обучить машину чтению?
Еще в начале нынешнего века был дан ответ: «да, возможно». Изобретатель д’Альба еще в 1904 году построил «Оптофон» — машину для чтения печатного текста. В наши дни читающие устройства, достигшие, конечно, гораздо большего совершенства, чем «Оптофон», начинают выполнять роль «глаза» и для электронных вычислительных машин.
Каждая буква печатного текста занимает определенное пространство. Это пространство можно разбить на маленькие прямоугольники. Они могут быть либо черными (если на них есть типографская краска буквы), либо белыми. Фотоэлемент может теперь произвести кодирование буквы. Если квадрат черный, тока в фотоэлементе не будет. Если белый, ток по-прежнему сохранится.
«Черное — белое», «да — нет», «есть ток — нет тока»… «нуль — единица». В который раз мы встречаемся с универсальной арифметикой электронных вычислительных машин! Просматривая все квадратики, из которых состоит буква, фотоэлемент превращает изображение буквы в набор нулей и единиц. Буква теперь «понятна» машине — ведь она стала двоичным числом!
Вот как происходит считывание буквы по методу телевизионной развертки: фотоэлемент просматривает букву сверху вниз, превращая ее в последовательность электрических сигналов.
Каждая буква — двоичное число. Допустим, «а» — это число 10001010111, «б» -01110011000, и т. д. Если мы пользуемся одним и тем же типографским шрифтом, то наши числа-буквы будут однозначны.
Ну, а если взять другой шрифт? Если набрать буквы «а» не обычным шрифтом, а курсивом? Очертания буквы изменятся. Значит, изменится и число. Как же быть тогда? Очевидно, нужно вложить в «память» машины сведения о том, что не только число 10001010111, но и число 11001010111 («а» курсивное) также является буквой «а».
Типографских вариантов букв не так уж много. Печатные буквы стандартны, в них нет никаких «вариантов почерка». Но как быть с рукописными текстами? Ведь в них сотни и тысячи различных по начертанию букв «а», «б» и др. И тем не менее применять машины для чтения рукописных букв необходимо. И прежде всего, в банковском деле. В 1960 году в обращении находилось более 50 миллиардов банковских чеков. В годовом обороте каждый документ обрабатывается примерно 10 раз. Вот и посчитайте, сколько времени нужно затратить на обработку чеков!
В настоящее время машины овладели техникой чтения банковских документов. Ежегодно они обрабатывают миллионы чеков. Успехи машины объясняются тем, что читать ей нужно всего лишь 10 различных знаков-цифр. К тому же они пишутся на чеках разборчиво — как-никак денежный документ!
Помогают и специальные «магнитные чернила». Они сделаны из смеси красителя и тонко помолотого магнитного порошка. Запись такими «чернилами» может читаться машиной без помощи фотоэлемента.
Вначале документ проходит под намагничивающей головкой. Потом — под несколькими «читающими головками», расположенными подобно головкам обычного магнитофона. Знаками, написанными «магнитными чернилами», возбуждаются электрические импульсы. Величина импульсов зависит от формы знака. Сочетание коротких и сильных импульсов дает двоичное число, и автомат может читать чек.
Благодаря таким «магнитным чернилам» в одном из американских банков машина обработала за год 6 миллионов чеков. Процент ошибок был очень мал — 0,75. А при ручной обработке процент ошибок в четыре раза больше, не говоря уже о том, что машина читает чеки со скоростью 100 цифр в секунду, явно недоступной человеку.
ОБРАЗЫ И БУКВЫ
Но и «магнитные чернила» не помогут, если писать неразборчивым почерком. Как научить машину читать любой рукописный текст? Эта проблема является частью более общей задачи — машинного распознавания образов.
Все течет, все изменяется, говорил великий греческий философ Гераклит. В самом деле, действительность, окружающая нас, вечно меняется. Нельзя войти дважды в одну и ту же реку, нельзя увидеть дважды одну и ту же вещь: что-то в ней меняется каждую секунду. Повторяемости впечатлений не существует. И тем не менее мы считаем реку рекой, вещь вещью.
Почему?
Да потому, что наш мозг, и не только мозг, но и глаз, совершают постоянную работу по абстрагированию, обобщению потока впечатлений из внешнего мира.
Органы чувств человека получают такое количество информаций, что мозг не может обработать ее полностью. Он вынужден перерабатывать первичные восприятия в понятия и образы. Мы видим сотни самых различных собак: дворняжек, сеттеров, бульдогов, гаке; рыжих, пегих, белых, бурых, маленьких, коротконогих, гигантских, голенастых. И все же, несмотря на такое множество пород, мастей и размеров, мы всегда отличим собаку от кошки.
Благодаря образному зрению мы можем узнавать предметы, которых раньше никогда не видели, но которые относятся к уже известным нам образам. Распознавание образов позволяет человеку не только экономить свою память, но и использовать предыдущий опыт. Если бы человек не умел распознавать образы, он мог бы читать только почерки, которые видел раньше. Чтобы понимать незнакомые почерки, их нужно было бы специально изучать. И знание других почерков никак не помогало бы осваивать новый.