Пройдет какое-то время, и машина сумеет читать печатный текст - книги, газетные сообщения.
А если машина различает буквы, значит, она может различать и образы.
Уже сегодня машина в состоянии производить зрительные подсчеты количества кровяных шариков во время анализов крови. А ведь раньше эту кропотливую работу мог делать только человек. Машина в состоянии не только подсчитывать количество деталей, но определять их характер, их разнообразие
Вероятно, зрячая машина станет тем механизмом, который сможет не только узнавать детали, поступающие на конвейер, но и закреплять их там, где это необходимо.
- Однако живой глаз не только различает форму предмета, его яркость, но и цвет его. Способна ли на такое машина?
- Во-первых, не все животные различают цвет. Взять, к примеру, осьминога - его мир бесцветен, сер и однообразен. Зрение осьминога ахроматично - оно различает лишь яркость освещения, но не цвет.
Человек видит трихроматно, то есть трехцветно. Из трех основных цветов и их смешения складывается весь яркий, многоцветный мир вокруг нас.
Но, оказывается, и машины начинают осваивать цветное зрение, используя чувствительные фотоэлементы. Кремниевый и селеновый фотоэлементы как раз и обладают неожиданной способностью "различать" цвета.
Используя это свойство, советские ученые М. Бонгард и А. Вызов создали установку, моделирующую цветовое зрение.
Этот удивительный прибор безошибочно распознает не только яркость, но и цвет.
Разве это не чудо: электронная машина видит радугу!
Однако обратимся к другим способностям машины. Сможет ли она логически понимать написанное? Да, сможет.
Уже сегодня в наших институтах есть машины, которые могут различать предложения: правильно оно построено или нет В Киевском вычислительном центре проделали интересный опыт. Взяли 50 существительных, 16 глаголов и наиболее часто употребляемые предлоги. Из этих слов составили фразы, конечно, довольно примитивные, но все же осмысленные: ""Соловей поет на дереве", "Рыба плавает в воде" и т. п.
Машина рассортировала имена существительные и глаголы в соответствии со смыслом. И когда ей предлагали совершенно бессмысленные фразы: "Рыба поет на дереве" или "Соловей плавает в воде", машина немедленно реагировала на эти ошибки.
Сегодня мы уверенно можем сказать, что пройдет несколько лет, и появятся машины, способные читать и понимать человеческую речь.
Но как заставить машину понимать живую речь?
Ведь написанные слова можно разделить на буквы алфавита.
А как автомату распознать слитную речь человека?
Здесь произнесение букв взаимно перекрещивается, их невозможно свести к алфавиту.
Исследователи языка пошли по иному пути - (c)ни установили, что можно создать звуковые символы, подобные алфавиту.
Фонемы - это небольшое число звуковых символов, которые могут быть записаны фонетически. Из 41 русской фонемы может быть составлено любое слово, любая фраза, так же как из трех десятков букв алфавита составляются слова, фразы, книги.
Фонемы отличаются одна от другой, значит, нужно приучить машину различать фонемы в слитном тексте, то есть находить ее буквенный или цифровой эквивалент, с тем чтобы зафиксировать фонему в памяти машины. Вот почему, когда машину учат слышать, то отдельные слова с помощью электронной техники разбивают на фонемы, тщательно анализируя каждую из них. При "" этом случайные признаки фонем всячески устраняются, с тем чтобы максимально увеличить различие между ними.
Впервые такое исследование провел русский профессор Л. Л. Мясников еще в начале 40-х годов. После войны этой проблемой занимались другие советские ученые.
Мало того, что ученые анализировали состав речи, они создавали устройства, с помощью которых можно заставить машину говорить, то есть можно создать искусственную речь.
Ученые заметили, что существует много различий между гласными и согласными.
6 спектре гласных звуков создаются и концентрируются как бы сгустки энергий, названные формантами. Источником гласных являются наши голосовые связки. Проходя через систему резонаторов лрлости рта, черепа, в результате соответствующего положения языка и челюсти звук усиливается или подавляется. Совсем иначе образуются согласные. Они образуются больше дыханием, а не участием голосовых связок.
Различна длительность гласных и согласных. Самой длительной является гласная "а", на которую затрачивается 260 миллисекунд, самой короткой согласная "п", для произнесения которой нужно всего 20 миллисекунд.
Анализ, проведанный ленинградскими учеными, показал и другое. В начале и в конце слова длительность гласных значительно больше, чем в середине; во фразах меньше, чем в отдельных словах. Именно по этим многочисленным признакам машина в состоянии различать звуки - ока как бы слышит их.
Исходя из всего этого, можно заставить машину не только слышать, но даже и говорить.
Как подобрать звуки, чтобы можно было из них создать голос машины?
Опыт за опытом ставили ученые и после многочисленных исследований сделали неожиданное открытие: сигналы, вырабатываемые генератором пилообразных импульсов, чрезвычайно похожи на колебания голосовых связок.
Голос можно получить искусственно - вот к какому выводу пришли исследователи.
Нужно лишь отработать сгустки звуковой энэргии в форманты. Для каждой гласной. В конце концов ученым удалось получить звуки, очень похожие на гласные русского языка.
Звуки, полученные от генератора, прослушивались специальной группой операторов в составе 10-15 человек. Они искали звуки, сходные с формантами, необходимыми для будущей речи машины.
А как получить согласные? Это оказалось значительно проще. Их создали с помощью шумового генератора.
Отбор звуков - длительный и сложный процесс. По ряду признаков звуки делятся на две группы, затем снова на две группы и опять на две части. Эти операции проводятся до тех пор, пока не удастся окончательно распознать все фонемы. В этом сложном процессе участвует не только акустика, но и электроника - искусственно осуществляется речевой сигнал.
Машина распознает звуки речи с помощью цифр электронно-вычислительных элементов. Иначе строится распознание живой речи человека, живого человеческого голоса.
Для опыта было отобрано 50 дикторов - 25 мужчин и 25 женщин. Их речи записывались на магнитофон. Но, как известно, с магнитофона речь проникает в машину в виде непрерывного электрического сигнала, а цифровые данные электронная машина принимает только прерывистыми сигналами. Специальным устройством преобразовали непрерывный сигнал в прерывистый. Машина вычисляла соотношение энергии в различных частях спектра речи, условно делила речь на гласные и согласные и в результате правильно опознала 97 процентов слов.
Недавно в Соединенных Штатах Америки был проведен интересный эксперимент по вводу в машину информации с голоса.
Оператор неоднократно повторял в микрофон слово.
Специальное устройство обрабатывало его и в виде цифр вводило информацию в машину. Запоминающие устройства машины создали как бы репродукцию или маску каждого слова.
При узнавании слова машина сравнивала его со всеми масками слова, хранящимися в ее памяти, и определяла, на какую маску больше всего похоже произносимое слово.
7 женщин и 9 мужчин однообразно говорили:
"Один, два, три, четыре..." и т. д.
16 голосов создали в машине большой выбор интонаций разных людей. И когда впоследствии они разговаривали с машиной, она пыталась узнать, кто именно с ней беседует. В результате она давала такие ответы:
- Это Джон сказал "три"... Говорящего определить нельзя, но сказана цифра "три",.. Невозможно определить ни личность говорящего, ни произносимое им слово.
Интересно, что машина сумела опознать каждую из семи женщин, слова же, произнесенные мужчинами, узнавались хуже - только на 98 процентов.