Электроды на лице и шее позволили нейросети озвучить беззвучную речь

Григорий Копиев

Американские исследователи создали прототип системы, которая считывает беззвучную речь при помощи электродов на лице и шее и превращает ее в слышимую речь с помощью нейросети. Потенциально это позволяет создать Bluetooth-гарнитуру, позволяющую разговаривать по телефону, не издавая звуков, или искусственный голосовой аппарат для людей с травмами гортани. Авторы представили разработку на конференции EMNLP 2020 и получили награду за лучшую статью.

При чтении мы обычно не просто видим слова и понимаем их суть, но и проговариваем их про себя, не издавая при этом никаких звуков. Этот процесс называется субвокализацией. Особенность субвокализации заключается в том, что, хотя мы и не произносим слова вслух, мозг все равно заставляет мышцы голосового тракта двигаться, пускай и намного меньше, чем при обычной вокализованной речи. Инженеры довольно давно научились использовать эти сокращения мыщц и считывать их с помощью различных методов, в основном при помощи электромиографии, которая регистрирует электрическую активность мышц.

В основном нейромышечные интерфейсы для распознавания субковализации используют для превращения беззвучной речи в текст. Дэвид Гэдди (David Gaddy) и Дэн Кляйн (Dan Klein) из Калифорнийского университета в Беркли создали алгоритм для превращения беззвучной речи в слышимую. Ранее другие исследователи уже решали эту задачу: на человеке закрепляли электроды и он произносил текст, а параллельно с этим исследователи записывали звук и электрическую активность. Затем они обучали алгоритм на парах звук-электрическая активность, что позволяло восстановить первое из второго. Этот подход изначально закладывает в результаты неточность, потому что электрическая активность мышц голосового аппарата при слышимой и неслышимой речи похожа, но не идентична.

Электроды на лице и шее позволили нейросети озвучить беззвучную речь

Рекомендуемые статьи

Что в XV-XVIII веках означало слово «чин»?

Как водители попадают в неприятные истории на дороге?

Действительно ли от нейросетей исходят серьезные угрозы?

Конец осени и начало зимы — это не повод отказываться от мейкап-экспериментов

Что служит причиной неудовлетворенности женщины и как это исправить

Что делать, чтобы уберечься от альфонса?

Какой бывает медитация и есть ли ограничения?

Чтобы игристое вино приносило только радость, учитесь правильно читать этикетку

Можно ли сегодня молчать об экологической обстановке?

Потрясающие факты о том, как мысли способны менять структуру и функции мозга

Узнаем, как освежить чувства и вернуть в семейную жизнь яркие моменты

Фильм «Картонная пристань» — пророческий для всей российской грядущей реальности

Чем славен радиотелескоп Аресибо

Отрывок из книги Марти Хейзелтон «Игры гормонов»

Как сейчас работает Black Star Burger и можно ли заработать на этой франшизе?

Одиннадцатая тренировка из цикла Rebbot: кардиопрограмма

И стало облако туманом

Пень многолик. Присмотримся к нему повнимательнее

Торжественный смотр самых значимых достижений автопрома за минувшие 366 дней

Раньше это заболевание поддавалось лишь паллиативному лечению

Зимой нашей коже требуется особый уход. Тогда она останется нежной и мягкой

Одежда, по которой мы узнаём королевских мушкетёров в фильмах

Что Владимир Маяковский считал «самым красивым в человеке»?

Правила жизни основателя бренда Roberto Cavalli

Ни одна из голливудских актрис не будоражит наши чувства так, как Марго Робби

Как бизнесу и НКО найти общий язык и вместе сделать нашу страну немного лучше

Всего за сто лет Литва стала крупнейшим государством Европы

Рассказываем обо всех нюансах, связанных с длиной верхней одежды

Veni, vidi, vici — это точно не про Илона Маска

Отрывок из книги Стивена Пинкера «Лучшее в нас»