Устройство можно рассматривать как сложный аналог слухового аппарата, части мозга, нервной системы и нервно-мышечного аппарата человека, печатающего под диктовку. Бионическая схема человека, печатающего под диктовку, и схема фонетической пишущей машинки показаны на рис. 33. Чтобы понять принцип работы устройства, проследим, как перерабатывается звуковая информация по пути её следования.
Звуковая энергия улавливается наружным ухом человека, передаётся по слуховому проходу и воздействует на барабанную перепонку среднего уха. Механическое движение перепонки передаётся жидкости, которая заполняет улитку (внутреннее ухо), при помощи слуховых косточек, перемещающихся нелинейно. При этом происходит компрессия сигнала, т.е. более громкие звуки уменьшаются сильнее, чем тихие.
На рис. 33 показаны схематическое изображение «развёрнутой» улитки и частоты, воспринимаемые pa зличными её участками. Здесь происходит первичный анализ информации. Окончательно её анализирует мозг, куда сигналы поступают по слуховому нерву. На основе результатов этого анализа мозг вырабатывает команды, посылаемые мышцам руки, нажимающей на соответствующие клавиши пишущей машинки.
В машине, распознающей речь, голос оператора воспринимает микрофон и преобразует в электрические колебания.
После усиления и компрессии речевой сигнал поступает на анализатор частот – блок из восьми полосовых фильтров, охватывающих диапазон 250… 10000 Гц, и систему детекторов сравнения амплитуд. Последняя собрана так, что реле, соответствующее данному каналу, включается, лишь когда уровень в этом канале больше среднего в двух соседних.
Речь опознается по группе фонем, составляющих слог, а не по отдельным фонемам (так как распознать многие фонемы вне контекста очень трудно). В слоговой памяти хранятся комбинации сигналов, соответствующие различным произношениям одного и того же слога или слова. Распознавание слога представляет собой определённый вид процесса сравнения с имеющимися в слоговой памяти образцовыми матрицами звукосочетаний.
Если слог опознан, срабатывает то реле из памяти написания, которое связано с написанием данного слога. В памяти написания (орфографической памяти) имеются типовые комбинации сочетания букв, представляющих 40 фонем для заданных 100 слогов. Реле соединено с линиями очерёдности следования букв и с линиями кода букв в блоке управления печатанием, который, в свою очередь, управляет работой буквенных приводов – происходит печатание выбранных букв.
Таким образом, слово печатается в соответствии с заранее определённым написанием, которое по необходимости должно быть одинаковым для одинаково звучащих слов. Именно поэтому устройство и было названо «фонетической пишущей машинкой».
Действующие, проектируемые и перспективные приборы для опознавания речи можно разделить на несколько видов. Мы дали им совершенно условные названия.
«Сезам» – устройство, в котором реализовано сказочное заклинание «Сезам, откройся!». Реагирует только на одно, два или три слова, но произнесённые любыми голосами. Может, если угодно, в самом деле открывать дверь в вашем подъезде.
«Жучка» – устройство, хорошо понимающее краткий командный язык из двух – трёх десятков слов. Обычно оно настроено на голос одного оператора. Как мы уже отметили, такой прибор способен управлять автомобилем или самолётом. Одна американская фирма успешно применила его в отделе технического контроля для записи параметров только что изготовленных цветных кинескопов. Другая фирма заставила «Жучку» запоминать свободные места в большом складском помещении и отправлять туда прибывающие контейнеры. Прибор незаменим при сложных научных экспериментах, когда надо записывать результаты, а руки исследователя заняты на пульте управления.
«Эксперт» – анализатор для выделения голоса одного из нескольких говорящих. Может помочь при опознании преступника, стать настройщиком музыкальных инструментов или контролёром качества звучания радиоприёмников, телевизоров и магнитофонов.
«Собеседник» – его действия могут быть самыми разнообразными: совет по телефону, когда врач сомневается в установлении диагноза, устный ответ программисту о результатах вычислений на ЭВМ, ответ на запрос о состоянии текущего счета в банке и т.п. Другая модификация – «Электронный секретарь», соединённый с пишущей машинкой.
«Переводчик» – название устройства не требует комментариев. Это искусственное ухо, подключённое к ЭВМ с программой автоматического перевода с одного языка на другой.
«Интегральный робот» – автомат, двигающийся впереди человека в опасных ситуациях. Подчиняется голосовым командам и докладывает пославшим его людям о том, что воспринимает. Мог бы помочь во время ремонта атомного реактора или путешествия на малоизученную планету.
Человеческое ухо существует в одном варианте. Искусственных, как видим, намечается несколько. Тем лучше! В том – то и сила техники, что она не копирует слепо природу.
Моделирование систем слуха
Прежде чем приступить к конструированию устройства слуха роботов, смоделируем отдельные элементы этих систем.
На рис. 34 – 37 показаны схемы усилителей звуковой частоты.
Начинать конструирование моделей слуховых систем лучше всего с простейшего акустического реле (рис. 37). Микрофон ВМ1 служит датчиком. Он преобразует звуковой сигнал в электрические колебания, а усилитель звуковой частоты усиливает их. После выпрямления диодом VD1 импульсы постоянного тока вызывают срабатывание электромагнитного реле.
Принципиальная схема такого варианта акустического реле изображена на рис. 38. На транзисторах VT1 и VT2 собран усилитель звуковой частоты (34), а диоды VD1 и VD2 и конденсатор С4 образуют выпрямитель. Транзистор VT3, резистор R6 и электромагнитное реле К1 с диодом VD1, шунтирующим обмотку реле, составляют электронное реле, а лампа HL1 с резистором R7 – исполнительную цепь.
Автомат работает так. Пока в помещении, где установлен микрофон, сравнительно тихо, в коллекторной цепи транзистора VT3 течёт небольшой ток покоя (меньше тока отпускания якоря реле К1), устанавливаемый при налаживании автомата. В это время контакты К 1.1 реле К1 разомкнуты и, следовательно, исполнительная цепь выключена. При появлении звукового сигнала (громкий разговор, шум и т. п.) колебания звуковой частоты от микрофонов усиливают транзисторы VT1 и VT2 и с нагрузочного резистора R5 сигнал поступает на выпрямитель. Отрицательные полуволны выпрямленного напряжения заряжают конденсатор С4 и поступают на базу транзистора VT3. Если конденсатор зарядится до напряжения 0,25…0,3 В, то коллекторный ток транзистора увеличится настолько, что реле К1 сработает и включит исполнительную цепь. Когда разговор перед микрофоном прекратится, конденсатор С4 почти полностью разрядится, коллекторный ток транзистора VT3 уменьшится до исходного, реле К1 отключится, а его контакты К 1.1, разомкнувшись, обесточат исполнительную цепь.