Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

5 книг, которые помогут достичь успеха в выбранной нише 5 книг, которые помогут достичь успеха в выбранной нише

Книги, которые запросто справятся с ролью инструктора по достижению успеха

Популярная механика
Обойдемся без истерик: как Агата Кристи наказала первого мужа за измену Обойдемся без истерик: как Агата Кристи наказала первого мужа за измену

Узнав об измене мужа, Агата отомстила ему так, что он надолго запомнил урок

Cosmopolitan
ИИ научился создавать реалистичные спутниковые снимки будущих наводнений ИИ научился создавать реалистичные спутниковые снимки будущих наводнений

Ученые разработали метод, который генерирует «снимки» будущих наводнений

ТехИнсайдер
Нежелательный матрас: как МВД и «Мужское государство» воюют за чистоту русской нации Нежелательный матрас: как МВД и «Мужское государство» воюют за чистоту русской нации

Борьба с русофобией достигла новых высот

Forbes
Поток Поток

Психология оптимального переживания

kiozk originals
Горные зебры приняли пылевые ванны и создали оазисы в сухой саванне Горные зебры приняли пылевые ванны и создали оазисы в сухой саванне

На местах пылевых купаний зебр лучше растут однолетние растения

N+1
Часы войны Часы войны

Именно войнам мы обязаны появлением наручных часов

Вокруг света
Выпить за науку Выпить за науку

Ученые вывели важные правила получения идеальных напитков

Вокруг света
Стоп-менеджер Стоп-менеджер

Почему тебя до сих пор не повышают? Есть пять вероятных причин

Cosmopolitan
Как в кино: 9 реальных мест для нереальных сцен Как в кино: 9 реальных мест для нереальных сцен

Локации, которые попали в известные фильмы

Вокруг света
Ситуация рода Ситуация рода

Психолог Ирина Млодик о новом отношении к зрелости и ее возможностях

Seasons of life
Грустные истории журнала «Ералаш»: 6 трагических судеб звёзд киножурнала Грустные истории журнала «Ералаш»: 6 трагических судеб звёзд киножурнала

6 актёров «Ералаша», чья судьба сложилась трагически

Cosmopolitan
В Италии нашли самую большую коллекцию костяных орудий возрастом 400 тысяч лет В Италии нашли самую большую коллекцию костяных орудий возрастом 400 тысяч лет

Древние люди систематически обрабатывали останки слонов

N+1
Как помочь родителям, потерявшим ребенка во время беременности Как помочь родителям, потерявшим ребенка во время беременности

Как помочь пережить горе тем, кто столкнулся с перинатальной потерей

Psychologies
От таблеток до рака: 5 причин, когда на тесте две полоски, но беременности нет От таблеток до рака: 5 причин, когда на тесте две полоски, но беременности нет

Почему тест на беременность может показывать две полоски?

Cosmopolitan
«Я разрыдалась, мерзко!»: Катина, Кошкина и другие звезды о встречах с маньяками «Я разрыдалась, мерзко!»: Катина, Кошкина и другие звезды о встречах с маньяками

Звездные героини нашей статьи столкнулись лицом к лицу с маньяками

Cosmopolitan
Донбасс против Украины: кто победит? Донбасс против Украины: кто победит?

Сравнение военного потенциала участников войны в Донбассе

Эксперт
20 самых смешных мультсериалов для взрослых 20 самых смешных мультсериалов для взрослых

Открой для себя безумный мир анимации, если обычные ситкомы уже приелись

Maxim
«Муж и его любовница хотят свести меня с ума»: как я стала жертвой газлайтинга «Муж и его любовница хотят свести меня с ума»: как я стала жертвой газлайтинга

Из-за действий мужа и его любовницы она оказалась на грани суицида

Cosmopolitan
Повторяй за мной Повторяй за мной

Балетный сезон открывается постановками трех молодых хореографов

Vogue
Пятиминутный путеводитель по... фейковым новостям Пятиминутный путеводитель по... фейковым новостям

Лучшие фейки событий и теорий заговоров, мистических тварей и личностей

Esquire
Эпигенетическую регуляцию в мозге увидели с помощью диеты и МРТ Эпигенетическую регуляцию в мозге увидели с помощью диеты и МРТ

Разработана методика неинвазивной визуализации эпигенетических маркеров в мозге

N+1
SEO простыми словами. Основы поисковой оптимизации для предпринимателей SEO простыми словами. Основы поисковой оптимизации для предпринимателей

Как разобраться в терминологии и основных механиках SEO

Inc.
Что такое эйджлесс и как продлить молодость. Научные данные Что такое эйджлесс и как продлить молодость. Научные данные

Как дольше оставаться молодым и здоровым

РБК
Как перестать быть вежливым и полюбить безумное порно Как перестать быть вежливым и полюбить безумное порно

О реконструкции непристойности в фильме Раду Жуде «Безумное кино для взрослых»

Weekend
Канье Уэст Канье Уэст

Величайший художник всех времен – Канье Уэст

ЖАРА Magazine
Физики увеличили время когерентности в ультрахолодных молекулах Физики увеличили время когерентности в ультрахолодных молекулах

Физики изменили поведение ультрахолодных молекул в оптических ловушках

N+1
От «Дюны» до «Вечных»: 13 самых ожидаемых кинопремьер осени 2021 года От «Дюны» до «Вечных»: 13 самых ожидаемых кинопремьер осени 2021 года

Доставай календарь, чтобы планировать поход в кино!

Playboy
Стробинг: макияж, который преобразит твое лицо всего за 5 минут Стробинг: макияж, который преобразит твое лицо всего за 5 минут

Стробинг действительно творит чудеса – он придает лицу выразительное сияние

Cosmopolitan
Аксолотль: вечное детство Аксолотль: вечное детство

Аксолотль может размножаться, оставаясь ребенком

Вокруг света
Открыть в приложении