Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

8 продуктов, которые помогут снизить риск инсульта 8 продуктов, которые помогут снизить риск инсульта

Если есть эти продукты регулярно, можно снизить риск инсульта на 27%!

Популярная механика
Что такое стоицизм и как античная философия поможет тебе сохранить самообладание сейчас Что такое стоицизм и как античная философия поможет тебе сохранить самообладание сейчас

Стоицзм — практическое пособие о том, как справиться со страхами и тревогой

Maxim
Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция? Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдер
Как выдерживать эмоции окружающих: 9 советов Как выдерживать эмоции окружающих: 9 советов

Как быть с эмоциями других людей, ведь их мы не в силах контролировать?

Psychologies
Хочу чужую жизнь: почему мы недовольны тем, что имеем и хотим получить то, чего у нас нет Хочу чужую жизнь: почему мы недовольны тем, что имеем и хотим получить то, чего у нас нет

Почему нам постоянно мало того, что у нас уже есть?

VOICE
Отважный микс Отважный микс

Брутальный интерьер с явным стремлением к минимизации деталей и форм

Идеи Вашего Дома
10 неожиданных признаков высокого интеллекта 10 неожиданных признаков высокого интеллекта

По каким признакам можно отличить обладателей высокого IQ и какие есть нюансы

Psychologies
Роскошная простота. Минимализм в интерьере Роскошная простота. Минимализм в интерьере

Как обустроить квартиру в стиле минимализм?

Лиза
Когда зажегся свет. Астрономы создали модель Когда зажегся свет. Астрономы создали модель

Было время, когда наша Вселенная была не чем иным, как непрозрачным газом

Популярная механика
Возможность острова Возможность острова

Фареры — это 18 небольших островов в северной части Атлантического океана

Seasons of life
Шаг для человечества: какой была первая ракета Шаг для человечества: какой была первая ракета

Как Роберт Годдард создал первую ракету на жидком топливе?

Популярная механика
«Толпа фаундеров с квадратными глазами»: как Ереван стал для россиян новой Долиной «Толпа фаундеров с квадратными глазами»: как Ереван стал для россиян новой Долиной

С какими трудностями столкнулись россияне при переезде бизнеса в Армению?

Forbes
Сколько человек сейчас живёт на Земле? Сколько человек сейчас живёт на Земле?

Население мира — это оценка общего числа людей, живущих на планете

Популярная механика
Как перепрошить мозг человека? Как перепрошить мозг человека?

Насколько быстрее было бы загрузить знания прямо в мозг!

Популярная механика
Зачем нам красота и почему сегодня она нужна каждому Зачем нам красота и почему сегодня она нужна каждому

Почему красота — то, за что можно держаться в полные сомнений моменты

РБК
«Купаемся в гормонах стресса»: что такое манипуляция страхом и как ей противостоять «Купаемся в гормонах стресса»: что такое манипуляция страхом и как ей противостоять

Отрывок из книги «Эмоциональный интеллект: побеждай без манипуляций»

Forbes
50 ошибок в общении, которые вы совершаете ежедневно 50 ошибок в общении, которые вы совершаете ежедневно

Как бы ни хотелось закрыться от мира, общаться с людьми все же приходится

Psychologies
Авангардная масть: история «Бубнового валета» Авангардная масть: история «Бубнового валета»

Что важно знать об одном из главных художественных объединений XX века

Культура.РФ
8 опасных привычек, которые повышают риск деменции 8 опасных привычек, которые повышают риск деменции

Если хотите сохранить ясность ума до старости, откажитесь от этих привычек

Популярная механика
Не трогай это! Что такое контактный дерматит Не трогай это! Что такое контактный дерматит

Каким бывает дерматит и почему он возникает?

РБК
Распространённое лекарство от артрита даёт надежду на лечение облысения Распространённое лекарство от артрита даёт надежду на лечение облысения

Препарат от артрита эффективно лечит очаговую алопецию

Популярная механика
Кругосветное путешествие Алексея Камерзанова. Первопроход Кругосветное путешествие Алексея Камерзанова. Первопроход

Путешествие по Чаду на автомобилях

4x4 Club
12 упражнений для ног: техника выполнения и советы тренера 12 упражнений для ног: техника выполнения и советы тренера

Упражнения, которые помогут прокачать мышцы ног

РБК
Звезды, рост которых не выше 160 см Звезды, рост которых не выше 160 см

Нам даже не приходило в голову, что эти знаменитости такого маленького роста

VOICE
Седан или хэтчбек: плюсы и минусы каждого типа кузова Седан или хэтчбек: плюсы и минусы каждого типа кузова

Чем седан отличается от хэтчбека и какой из них лучше?

РБК
Ему домкрат, тебе духи: как гендерные праздники тиражируют стереотипы о женщинах Ему домкрат, тебе духи: как гендерные праздники тиражируют стереотипы о женщинах

14 февраля, 23 февраля и 8 марта — дни, когда реклама транслирует стереотипы

Forbes
Самый богатый знак зодиака — кому звезды обещают богатство? Самый богатый знак зодиака — кому звезды обещают богатство?

Хочешь узнать, кому на роду написано быть богатым? Читай наш гороскоп

VOICE
Ячмень: симптомы, лечение в домашних условиях и профилактика Ячмень: симптомы, лечение в домашних условиях и профилактика

Что такое ячмень и как с ним справиться?

Cosmopolitan
10 громких допинговых скандалов на Олимпиадах 10 громких допинговых скандалов на Олимпиадах

Некоторые истории с допингом заканчивались на Олимпиадах и вовсе тюрьмой

Maxim

Что было источником цунами, которое охватило весь земной шар?

Популярная механика
Открыть в приложении