Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Продукты, снижающие и повышающие холестерин: правильное питание для сердца и сосудов Продукты, снижающие и повышающие холестерин: правильное питание для сердца и сосудов

Что именно нужно есть, а от чего лучше отказаться для здоровья сердца и сосудов

Популярная механика
Счастье из воздуха Счастье из воздуха

В светской Москве новый тренд — дышать газом

Tatler
С особым подходом: почему хакеры атакуют компании разных отраслей по-разному С особым подходом: почему хакеры атакуют компании разных отраслей по-разному

Как бизнес-интересы определяют способы атак на сайты российских компаний

Forbes
Часики тикают: почему понятие гендера в часовой индустрии скоро исчезнет Часики тикают: почему понятие гендера в часовой индустрии скоро исчезнет

В ближайшие годы часовая индустрия окончательно переродится

Forbes
История мира в шести стаканах История мира в шести стаканах

Как ваши любимые напитки изменили мир

kiozk originals
«Разжимая кулаки»: режиссер Кира Коваленко о победе в Каннах, Балагове и Сокурове «Разжимая кулаки»: режиссер Кира Коваленко о победе в Каннах, Балагове и Сокурове

Режиссер Кира Коваленко — о том, как снимать кино на языке, которого не знаешь

Forbes
Кредит доверия Кредит доверия

«Хочу, чтобы результат стал для меня сюрпризом и чтобы он был приятным»

SALON-Interior
Свежая листва Свежая листва

Реставратор Майкл Даффи шаг за шагом восстановил знаменитое полотно Ван Гога

Robb Report
Как нам чувствовать себя хорошо, когда вокруг все плохо? Как нам чувствовать себя хорошо, когда вокруг все плохо?

Как сохранить хорошее настроение, если события внушают тревогу?

Psychologies
Двойные послания в отношениях: что это такое и как их избежать? Двойные послания в отношениях: что это такое и как их избежать?

Как научиться конструктивному общению

Psychologies
Трудно дышать и нет сил жить: что нужно знать про анемию Трудно дышать и нет сил жить: что нужно знать про анемию

Почему возникает анемия, как она проявляется и чем грозит организму?

Cosmopolitan
8 потрясающих приключений 8 потрясающих приключений

8 маршрутов, наполненных активными развлечениями и экстримом

Playboy
Шах и мак Шах и мак

Что ждет Афганистан, из которого ушли очередные сеятели разумного и доброго?

Maxim
Шутка провалилась! Как Абрамов, Мирзализаде и другие комики разозлили россиян Шутка провалилась! Как Абрамов, Мирзализаде и другие комики разозлили россиян

Комики, которые прославились не только благодаря шуткам, но и громким скандалам

Cosmopolitan
«Мужчина зарабатывает меньше меня»: пора расходиться? «Мужчина зарабатывает меньше меня»: пора расходиться?

Как договориться при разном заработке и помочь друг другу развиваться?

Psychologies
«Муж начал рыдать на моих родах, и мне пришлось его выгнать из палаты» «Муж начал рыдать на моих родах, и мне пришлось его выгнать из палаты»

Иногда успокаивать приходится вовсе не рожениц, а будущих отцов

Psychologies
Besame mucho! 10 самых красивых испанских актеров — они сводят с ума весь мир Besame mucho! 10 самых красивых испанских актеров — они сводят с ума весь мир

Яркую во всех смыслах подборку испанских актеров

Cosmopolitan
«Обмануть крупнейший инвестбанк — это слишком»: компания Ozy дурит инвесторов, прикрываясь дружбой с YouTube и Amazon «Обмануть крупнейший инвестбанк — это слишком»: компания Ozy дурит инвесторов, прикрываясь дружбой с YouTube и Amazon

Как Ozy обманула Goldman Sachs, но продолжила привлекать инвесторов

VC.RU
Как связаны лишний вес и коррупция: 10 лауреатов Шнобелевской премии-2021 Как связаны лишний вес и коррупция: 10 лауреатов Шнобелевской премии-2021

Спасет ли вас борода в пьяной драке? Можно ли лечить оргазмом насморк?

РБК
«Лучше точно не будет». Как мы искали машину без наценок и не нашли «Лучше точно не будет». Как мы искали машину без наценок и не нашли

Что происходит с ценами на новые машины и когда все это закончится?

РБК
Как работает эрекция: ответы на вопросы, которые давно тебя мучат Как работает эрекция: ответы на вопросы, которые давно тебя мучат

Разбираем, что стоит за эрекцией — столь важным для половой жизни процессом

Playboy
Случайная остановка Случайная остановка

Сколько удивительных существ удаётся встретить в самом обычном месте!

Наука и жизнь
«Лет ми спик фром май харт»: откуда в языке берется акцент «Лет ми спик фром май харт»: откуда в языке берется акцент

Что такое акцент?

Популярная механика
Правило № 66. Нас ждет новый интернет Правило № 66. Нас ждет новый интернет

Как в скором времени будут зарабатывать инфлюенсеры

Tatler
Планетологи нашли очень молодую вулканическую область на Венере Планетологи нашли очень молодую вулканическую область на Венере

Потоки лавы могли течь по Венере всего несколько тысяч лет назад

N+1
Стас Намин Стас Намин

Стас Намин — о возрасте и легендарных друзьях

Maxim
15 стрижек для волос средней длины: они просто гениальны 15 стрижек для волос средней длины: они просто гениальны

Если длина до плеч... то выбирай любую из этих стрижек!

Cosmopolitan
Аглая Епанчина Аглая Епанчина

Психотерапевт размышляет о характере персонажа из романа «Идиот»

Psychologies
Судьба барабанщика Судьба барабанщика

24 августа 2021 года смолкла барабанная дробь Чарльза Роберта (Чарли) Уоттса

Playboy
Построена первая межвузовская квантовая сеть с открытым доступом Построена первая межвузовская квантовая сеть с открытым доступом

Квантовая сеть с открытым доступом объединила университеты в Москве

Популярная механика
Открыть в приложении