НОВОСТИ    БИБЛИОТЕКА    КАРТА САЙТА    ССЫЛКИ    О ПРОЕКТЕ  

предыдущая главасодержаниеследующая глава

Человек разговаривает с роботом

...Человек не нажимает кнопок, не поворачивает ручек, а лишь отдает соответствующие команды, и устройство, по внешнему виду напоминающее небольшую тележку, совершает сложные движения. Тележка движется то вперед, то назад, то стремительно поворачивается вправо или влево, в по команде "стоп" - немедленно останавливается.

Мы были свидетелями и другого интересного эксперимента. Подойдя к стоящей на столике пишущей машинке и сняв с нее чехол, человек стал подавать команды через микрофон в специальное устройство, смонтированное рядом с машинкой. Называя медленно, но четко буквы и цифры, человек диктовал свою волю машинке, и та послушно выполняла его приказы, автоматически печатая на бумаге колонки знаков...

Ученые Москвы, Киева, Минска и других городов решают сегодня трудную и в то же время очень интересную задачу - учат электронный комплекс узнавать человека по голосу, слушать и выполнять его приказы.

Способность человеческого мозга разбираться в хаосе звуков, выделять из этого хаоса нужные звуки - одно из самых его чудесных свойств. Раскрыть это свойство, смоделировать его - важная задача науки и практики.

Если еще не так давно размышления на эту тему относились скорее к области фантастики, то теперь электронные устройства, способные выполнять устные приказы и отвечать на вопросы, все увереннее выходят из лабораторий в цехи машиностроительных и других предприятий.

Электронные устройства в основном пока были "глухи" и "слепы". Всю информацию они получали с перфокарт и магнитных лент. Они не понимали нашего языка и не могли на нем говорить. Вследствие этого мы разговаривали с ними не на своем языке, не так, как удобно нам, а так, как удобно им, машинам. Разговор с машинами идет по сложной системе программ на специальном машинном языке. Машинный язык - это язык цифр. Какую бы задачу, вычислительную или логическую, ни решала электронная машина, она совершает операцию с цифрами, и только с ними. Тысячи математиков и программистов заняты составлением алгоритмов и программ для машин. Чтобы успешно решить проблему общения человека с машиной, нужно прежде всего достигнуть непосредственного взаимопонимания между ними. Для достижения этой цели электронную машину необходимо снабдить отличным слуховым аппаратом, который бы не только распознавал слуховые образы, но и "понимал" их смысл. Машина будет выполнять устные команды, действовать по инструкции, предлагать гипотезы и доказывать их, а человек - оценивать работу машины и давать ей новые распоряжения или инструкции. Каждое сообщение, подготовленное для машины, должно быть понято ею строго однозначно.

Голос каждого человека так же индивидуален, как и отпечатки пальцев. В современной жизни много случаев, когда важно использовать индивидуальные свойства голоса, воспользоваться так называемым "голосовым ключом". Например, пуск уникального оборудования может быть доверен только одному человеку. Дверь помещения или сейфа откроется только по вашему приказанию. Как в известной сказке: "Сезам, откройся!". Более широкое практическое применение "слышащих" машин, напротив, предполагает очищение голоса от его индивидуальных свойств, что позволит построить машины "с универсальным послушанием". В их числе будут и машины-роботы.

Машины с "универсальным послушанием" особенно перспективны в управлении промышленными и транспортными комплексами. Уже работает металлорежущий станок с программным управлением, отличительной особенностью которого является то, что программа его действий отдается оператором в микрофон, преобразуясь электронной машиной в привычную для станка цифровую форму. Станок, программируемый голосом, позволяет экономить время, нужное для перевода показателей величин подачи, глубины резания и т. д. в машинный код. Если же программу наговорить заранее, станок будет обрабатывать деталь без оператора. Электронной машине "безразлично", каким голосом отдается приказ: громким или тихим, басом или дискантом. Ее не смущает интонация и даже акцент.

Появились и автомобили, управление которыми осуществляется голосом. Устное распоряжение заставляет машину включать и выключать сцепление, переключать скорости, совершать повороты. Запуск и выключение двигателя также осуществляются по словесному приказу водителя.

Успехи в разработке устройств, управляемых голосом, налицо. Однако трудностей в решении задачи речевого общения человека и машины еще очень много. Так, например, еще не созданы совершенные устройства для ввода любого речевого сообщения в электронные машины. Известно, что речь состоит из фраз, слов, слогов. Наименьшим элементом речи является звук (фонема). С физической точки зрения звуки речи различаются и частным составом, и интенсивностью, и продолжительностью. В речи нет четких границ между звуками. Как буквы соединяются одна с другой промежуточными элементами, так звуки речи стыкуются в слова с помощью "переходов" - дополнительных звуков, которые возникают при перестройке голосового аппарата для присоединения следующего звука. У разных людей форманты (образующие) даже одних и тех же главных звуков несколько различаются по частоте и интенсивности. Даже у одного человека форманты одного и того же звука заметно различаются в зависимости от того, в каком слоге произносится звук, ударный он или безударный, высок он или низок.

Ученые уже вывели дифференциальное уравнение, которое дает довольно точное и вместе с тем компактное математическое представление о звуковых колебаниях человеческой речи. Это уравнение и легло в основу идеи синтезатора речи, который непосредственно подключается к электронной вычислительной машине и может преобразовать поток информации в 40 бит в секунду из двоичного кода в человеческую речь в темпе 120-180 слов в минуту, причем слова могут произноситься мужским, женским и детским голосами в любом тоне с любой интонацией. Такое устройство не пользуется предварительно записанными сегментами речи, работа его программируется. Синтезатор имеет практически неограниченный словарь, так как слова первоначально представляют в виде двоичных электрических сигналов, а их машина может запомнить огромное количество.

Советские ученые предложили установить между человеком и машиной своего рода "динамический союз". Надо было добиться, чтобы машина с каждым заданием становилась все "понятливее", чтобы, получая аналогичные задания, она не задавала одних и тех же вопросов. Такая машина сохраняет в своей электронной памяти "протоколы" бесед с человеком и пользуется своими новыми знаниями в дальнейшей работе.

Когда машина научится человеческому языку, она, вероятно, будет "перерабатывать" речь человека гораздо быстрее, чем это делают люди. Машины приобретут возможность общаться не только с людьми, но и друг с другом. "Наивысшим и совершеннейшим человеческим приспособлением" назвал речь выдающийся русский физиолог И. П. Павлов. И все же "...вполне возможно, чтобы человек разговаривал с машиной, машина - с человеком, и машина - с машиной". Эти слова принадлежат отцу кибернетики Норберту Винеру.

Сбываются ли сегодня предсказания Норберта Винера? Первая часть предвидения ученого близка к осуществлению. Много делается сегодня и для реализации возможности разговора между машиной и человеком. В иностранной печати появилось сообщение о том, что в университете города Торонто (Канада) состоялся разговор между профессором Берклеем и электронной вычислительной машиной. В "память" машины ввели триста английских слов и научили ее поддерживать несложную беседу. Обращаясь к машине, профессор спросил:

- Вы были рады дождю, который прошел сегодня после полудня?

Машина ответила:

- Нет, я больше люблю солнечную погоду.

- В жаркую погоду человеку нужна по крайней мере одна ванна в день,- заметил профессор.

- Да. я как раз был на улице и изнемогал от жары,- последовал ответ.

- Когда придет рождество, будет холодная погода,- заметил профессор.

- Холодная погода?- переспросила машина, и сама ответила.- Да, обычно в декабре морозно.

- Сегодня ясная погода,- сказал профессор и спросил машину.- Как вы думаете, долго ли она будет продолжаться?

- Позвольте мне не лгать,- взмолилась машина, сбитая с толку столь противоречивыми высказываниями.- Как же дождливая погода может быть ясной?

Будем надеяться, что в ближайшее время и третья часть предсказания Норберта Винера - о разговоре машины с машиной - сбудется.

Сегодня мы являемся свидетелями многих реальных разработок, приближающих нас к осуществлению мечты о создании серийных машин и механизмов, подчиняющихся команде заводского инженера-диспетчера.

Человек говорит с роботом, робот - с человеком. Это сегодня не такая уже редкость. Однако говорящих "по делу" роботов, а тем более знающих толк в том, что, как и где сказать, можно сегодня, что называется, пересчитать по пальцам.

Система "Речь-1", разработанная специалистами Института кибернетики имени В. М Глушкова Академии наук УССР совместно с минским отделом Центрального научно-исследовательского института связи, по своим технико-экономическим показателям находится на передовых рубежах в решении данной проблемы. В этом устройстве объединены функции распознавания и синтеза речи. Электронный автомат способен реагировать на двести команд-слов и синтезировать речь по печатному тексту. Нельзя не удивляться его умению разборчиво озвучивать произвольный текст на русском или украинском языках... Робот говорит не голосом , человека, записанным на магнитную ленту, как это сделано, например, в "говорящих часах", а самостоятельно воспроизводит звуки речи, складывает их в слова и фразы.

Около двадцати лет назад электронный робот произносил только отдельные слова, воспринимал чуть больше десятка слов: цифры от нуля до десяти и знаки плюс и минус. Теперь же он стал куда "умнее", солидно пополнил он и свой словарный запас, достаточный, чтобы вести оперативный диалог с инженером в наиболее привычной для него форме - голосом.

Чтобы научить машину хорошо слышать команду, ученым необходимо было разработать стенд, который позволил бы визуально изучить то или иное слово, создать его графический образ. И человек стал "видеть" голос, точнее - его штриховое изображение, нанесенное на обычную бумагу. Каждое слово, оказывается, имеет свой "портрет" в зависимости от того, кто и как его произносит. На бумаге голос оставляет детали этого портрета.

Как же обучается робот пониманию команд?

Готовя систему к работе, оператор должен каждое слово произнести в микрофон только один раз. Оно мгновенно запечатлевается в оперативной памяти. Причем, для каждого диктора создается собственный "банк данных" - своеобразный отпечаток звуковых образов, слов, которые сугубо индивидуальны. Устройство это представляет собой как бы промежуточное звено между человеком и ЭВМ, которая обеспечивает управление технологическими процессами, организацией производства, автоматизированное проектирование. Речевой диалог значительно ускоряет обмен информацией между человеком и ЭВМ, освобождает человеку-оператору глаза и руки, создает ему более комфортные условия труда. Речевой ввод команд удобен для управления и другими сложными производственными процессами, в том числе в операциях по контролю качества изделий на конвейере. При сортировке посылок на почтамте человек говорит машине только одно слово, например, город, куда направляется посылка - "Киев", "Одесса", "Харьков" и т. д. А она сама открывает окошко, принимающее посылку...

Устройства, управляемые голосом, особенно необходимы космонавтам. Ведь космонавт, находящийся в корабле, испытывает большие нагрузки, отрицательно действующие на организм, и в то же время он занят выполнением различных операций: управлением кораблем, работой с навигационными приборами, фото- и киносъемкой и т. д. Практически, космонавту, что называется, не хватает рук. Облегчить ему труд могло бы, например, электронное устройство, с помощью которого управление кораблем будет осуществляться устными командами.

У роботов, воспринимающих речевые команды человека, большое будущее.

предыдущая главасодержаниеследующая глава











© ROBOTICSLIB.RU, 2001-2019
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://roboticslib.ru/ 'Робототехника'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь