Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как выжить, если вам угрожает медведь, акула или волк: порядок действий Как выжить, если вам угрожает медведь, акула или волк: порядок действий

Советы, которые могут спасти вам жизнь при встречи с диким животным

Популярная механика
«Письмо о хорошем», «каляки» и другие практики для снижения стресса «Письмо о хорошем», «каляки» и другие практики для снижения стресса

Сосредоточиться на делах невозможно, а мысли о будущем вызывают тревогу?

Psychologies
Воздушные винты помогли ходячему роботу сохранить равновесие во время бега Воздушные винты помогли ходячему роботу сохранить равновесие во время бега

Робот KOU-III не может летать — он использует винты для равновесия

N+1
36 вопросов, чтобы (снова) влюбиться 36 вопросов, чтобы (снова) влюбиться

Этот опросник способен (заново) воспламенить сердца меньше чем за час!

Psychologies
Возможно, вы взвешиваетесь неверно: несколько правил от ученых Возможно, вы взвешиваетесь неверно: несколько правил от ученых

Как понять свой истинный вес и взвеситься правильно?

ТехИнсайдер
Почему у животных разные формы зрачков Почему у животных разные формы зрачков

Как объяснить разнообразие зрачков у животных?

Популярная механика
Влияет ли качество сна на лишний вес? Спойлер — влияет, и очень сильно Влияет ли качество сна на лишний вес? Спойлер — влияет, и очень сильно

Избыточный вес может во многом зависеть от качества сна

Популярная механика
5 выдающихся современных авторов, пишущих серьезную научную фантастику 5 выдающихся современных авторов, пишущих серьезную научную фантастику

Авторы, которые продолжают традиции «твердой» фантастики

Популярная механика
Ученые зря ломали голову над этими технологиями: 9 гениальных изобретений, которые случайно придумали дети Ученые зря ломали голову над этими технологиями: 9 гениальных изобретений, которые случайно придумали дети

Некоторые дети стали настоящими изобретателями и внесли вклад в мир технологий

ТехИнсайдер
Каких людей нельзя впускать в свою жизнь — совет от протоиерея Сергия Филимонова Каких людей нельзя впускать в свою жизнь — совет от протоиерея Сергия Филимонова

Как научиться разбираться в людях?

Cosmopolitan
История кухарки, которая заразила полсотни человек: первый «нулевой пациент» История кухарки, которая заразила полсотни человек: первый «нулевой пациент»

Мэри Маллон стала первым в истории медицины «нулевым пациентом»

Популярная механика
Про интимное: как сохранить достоинство больного Про интимное: как сохранить достоинство больного

Президент фонда «Вера», о самых простых вещах, которые труднее всего заметить

Psychologies
Родион Галюченко: «Нужно всегда честно и прямо говорить!» Родион Галюченко: «Нужно всегда честно и прямо говорить!»

Родион Галюченко поделился с читательницами о проекте, роли и жизни

Cosmopolitan
Наука опровергла: 6 мифов о здоровье, в которые вы продолжаете верить Наука опровергла: 6 мифов о здоровье, в которые вы продолжаете верить

Устаревшие стереотипы о здоровье, которые испортят вам жизнь

ТехИнсайдер
Вести из лабораторий Вести из лабораторий

Важнейший этап геологоразведки — изучение состава руд и рудных материалов

Наука и жизнь
Сон в гробу за четыре пенса и другие услуги «Армии спасения»: история одного из самых гнусных изобретений человечества Сон в гробу за четыре пенса и другие услуги «Армии спасения»: история одного из самых гнусных изобретений человечества

Кого и от кого спасала "Армия спасения"?

Популярная механика
Частичное репрограммирование позволило частично снизить биологический возраст мышей Частичное репрограммирование позволило частично снизить биологический возраст мышей

Как сдвиг клеток сказывается на живом организме?

N+1
Вино, раскройся! Вино, раскройся!

Вино – как выбрать, с чем сочетать и что предписывает этикет

Лиза
Автостопом по метавселенным Автостопом по метавселенным

Какие они, миры будущего, и в какую новую реальность они ведут нас

РБК
Вампиры, супергерои и чудо-технологии: лучшие сериалы для тревожных времен Вампиры, супергерои и чудо-технологии: лучшие сериалы для тревожных времен

Сериалы, которые помогут ненадолго отключиться от внешнего мира

Forbes
«В нужный момент в нужном месте» «В нужный момент в нужном месте»

Человек, который предотвратил ядерную катастрофу

Дилетант
Варвара: «Любовь — ежедневный выбор» Варвара: «Любовь — ежедневный выбор»

Глядя на Варвару, невольно удивляешься: неужели у нее совершенно взрослые дети?

Лиза
Как общаться с трудными людьми: 11 правил диалога Как общаться с трудными людьми: 11 правил диалога

11 правил диалога, которые помогут вернуть контакт в общении с близкими

Psychologies
От суфражисток до профсоюзных лидеров: 5 фильмов о женской солидарности От суфражисток до профсоюзных лидеров: 5 фильмов о женской солидарности

Фильмы о героинях, которые борются за равные права с мужчинами

Forbes
Плюс один Плюс один

«Покупка» младенца или единственный способ иметь биологического ребенка?

Grazia
Почему мы до сих пор пользуемся литий-ионными аккумуляторами вместо графеновых Почему мы до сих пор пользуемся литий-ионными аккумуляторами вместо графеновых

Где же обещанные графеновые аккумуляторы? Давайте разбираться

CHIP
Если вы трогали эти предметы – помойте руки! 10 крайне негигиеничных вещей Если вы трогали эти предметы – помойте руки! 10 крайне негигиеничных вещей

На некоторых вещах микробов в сотни раз больше, чем в общественном туалете

Популярная механика
Прекрати самобичевание: 6 шагов к избавлению от чувства вины Прекрати самобичевание: 6 шагов к избавлению от чувства вины

Можно ли как-то избавиться от чувства вины?

VOICE
Птенцы городских синиц справились с жарой лучше лесных сородичей Птенцы городских синиц справились с жарой лучше лесных сородичей

Хотя в городах жарче, смертность птенцов от жары здесь оказалась ниже

N+1
Следы на песке: история автопробега Андре Ситроена через Сахару Следы на песке: история автопробега Андре Ситроена через Сахару

Андре Ситроен и внедорожник от инженера Николая II в автопробеге через Африку

Esquire
Открыть в приложении