Новости
Библиотека
Карта сайтов
Ссылки
О сайте

27.03.2013

Цифровая «говорящая голова» научилась воспроизводить человеческие эмоции

Познакомьтесь с «Зои»: это цифровая «говорящая голова», которая по требованию может выражать человеческие эмоции с «беспрецедентной реалистичностью.

Знакомьтесь с «Зои», цифровой «говорящей головой» и интерфейсом будущего. Виртуальная «говорящая голова» «Зои» использует базовый сет из шести моделируемых эмоций, которые можно регулировать. Фото с сайта toshiba.eu
Знакомьтесь с «Зои», цифровой «говорящей головой» и интерфейсом будущего. Виртуальная «говорящая голова» «Зои» использует базовый сет из шести моделируемых эмоций, которые можно регулировать. Фото с сайта toshiba.eu

Разработчики считают, что она может стать началом новой эпохи взаимодействия человека и компьютера.

Исследователями была разработана виртуальная «говорящая голова», которая способна выражать полный спектр человеческих эмоций и может использоваться в качестве цифрового личного помощника, заменять чтение физической передачей информации или передавать сообщения.

Цифровое лицо способно передавать эмоции, такие как счастье, гнев и страх, и при этом менять голос в соответствии с тем, что хочет получить пользователь: можно задавать различные параметры. Разработчики утверждают, что это – самое выразительное управляемое цифровое лицо, которое когда-либо было создано.

Свое лицо вместо «Зои»

Система, названная «Зои», является результатом сотрудничества исследователей из Кембриджской научно-исследовательской лаборатории Toshiba и отдела разработки Кембриджского университета. Студенты уже определили сходство между цифровой головой и «Холли» – бортовым компьютером из британской научно-фантастической комедии «Красный карлик».

Лицо принадлежит актрисе Зои Листер. Чтобы оживить ее лицо и голос в качестве цифровой системы, исследователи провели несколько дней, делая записи речи и выражений лица Зои. Результат – система, которая достаточно проста, чтобы работать на мобильных устройствах, и может использоваться в качестве личного помощника на смартфонах.

В основе структуры «Зои» стоит шаблон, который в ближайшее время даст пользователям возможность загрузить свои лица и голоса, что, кстати, займет всего несколько секунд. Это означает, что в недалеком будущем любой сможет настраивать своих собственных эмоциональных и реалистичных цифровых помощников.

Если задумка разработчиков будет осуществлена, пользователь сможет, например, создать сообщение «я опаздываю» и прикрепить к нему эмоцию «расстройство». Можно будет отправлять живые сообщения, которые будут передавать лицо отправителя с таким выражением и голосом, какие он сам захочет.

Команда, которая создала «Зои», в настоящее время разрабатывает приложения, а также работает со школой аутичных и глухих детей, где данная технология могла бы использоваться, чтобы помочь ученикам «читать» лица с помощью эмоций и движений губ. На самом деле у системы огромное количество потенциальных вариантов использования, включая видеоигры, аудиовизуальные книги, средство для разработки онлайн-лекций и другие пользовательские интерфейсы.

«Эта технология могла бы стать началом совершенно нового поколения интерфейсов, которые обеспечивают взаимодействие человека и компьютера, больше похожее на общение двух реальных людей, – говорит профессор Роберто Сиполья из отдела разработки Кембриджского университета. – Нам потребовались дни, чтобы создать «Зои», потому что мы должны были начинать с нуля и учить систему понимать язык и выражения лица. Теперь, когда у нас уже есть алгоритм, настройка различных лиц и голосов не будет слишком сложной задачей».

Программа, используемая для управления «Зои», требует всего несколько десятков мегабайт свободного места, что означает, что ее можно легко установить на любые компьютерные устройства, включая планшеты и смартфоны.

Бесконечное совершенствование

Система работает на базе основных человеческих эмоций. У голоса «Зои», например, есть шесть главных параметров настройки – счастливая, грустная, нежная, сердитая, напуганная и нейтральная. Пользователь может по-своему отрегулировать эти параметры, каждый из которых имеет несколько уровней, а также изменить тон, скорость и глубину голоса.

С помощью сочетания уровней становится возможным задавать или создавать почти бесконечные эмоциональные комбинации. Например, если смешать счастье с нежностью и добавить небольшое увеличение скорости и глубины голоса, можно получить очень дружелюбного и радушного собеседника. Комбинация скорости, гнева и страха делает Зои очень взволнованной, на грани паники. Таким образом, разработка способна очень тонко передавать эмоциональную составляющую, что, как говорят ученые, до сих пор не было возможно в других подобных системах.

Чтобы сделать систему максимально реалистичной, исследовательская группа собрала сеть данных из тысяч высказываний, которые они использовали для обучения речевой модели с помощью реальной актрисы – Зои Листер. Ученые создавали математические алгоритмы, которые давали им голос и изображение лица, и подгоняли выражения лиц и текст так, чтобы получилась живая, а главное, достоверная картинка.

Эффективность системы была проверена с помощью добровольцев – пользователей популярного веб-сайта. Участникам предлагался видео- или аудиотест с единственным предложением, произнесенным «Зои». Их попросили идентифицировать, какую из шести основных эмоций копирует система. Ученые выбрали десять предложений, каждое из которых тестировали 20 человек.

Добровольцы, у которых было только видео без звука, распознавали эмоцию в 52% случаев. Когда был только звук, показатель успешности составлял 68%. Когда тестер включал и звук, и видео, успех составил 77%, что немного выше, чем уровень распознания эмоций настоящей Зои Листер, который составил 73%! Вероятно, искусственная «говорящая голова» более стилизована в поведении.

Теперь исследовательская группа будет работать над созданием версии системы, которая может быть персонифицирована самими пользователями.

Сегодня взаимодействие человека и компьютера все еще ограничивается печатанием на клавиатуре и перемещением курсора с помощью мыши, поэтому пользование компьютером является для многих людей сложной задачей. В будущем разработчики хотят открыть возможность пользования компьютером большему количеству людей, когда те смогут общаться с машинами более естественными способами – жестами или голосом. Именно поэтому была создана «Зои» – более выразительное, эмоционально отзывчивое лицо, с которым люди могут фактически разговаривать, заключает Сиполья.

Александр Федоров


Источники:

  1. KM.RU






Пользовательского поиска


Диски от INNOBI.RU



© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2001-2018
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://roboticslib.ru/ "RoboticsLib.ru: Робототехника"