Как создают музыку с помощью нейросетей и почему здесь не обойтись без человека

РБКHi-Tech

Дмитрий Евграфов: « В торговых центрах будет играть плохая музыка от ИИ»

Беседовала Юлия Макарова

Искусственный интеллект продвинулся по многим направлениям — от написания текстов до управления дорожным трафиком и предприятиями. Но в музыке ИИ пока не очень силен и вряд ли совершит прорыв в ближайшие годы, уверен композитор и сооснователь стартапа Endel Дмитрий Евграфов. В интервью РБК он рассказал, как создают музыку с помощью нейросетей и почему здесь пока не обойтись без человека.

РБК: Почему вы как профессиональный композитор решили развивать музыкальный ИИ? Не страшно было рубить сук, на котором сидите?

Д.Е.: Да, со стороны ситуация выглядит иронично: человек с музыкальной карьерой решил запустить стартап в сфере музыкальных технологий. Но на самом деле у нас нет и никогда не было цели оставить без работы всех композиторов и заменить их на искусственный интеллект. Наоборот, имея профессиональное представление о музыке, мне было очень интересно побывать по разные стороны баррикад. Так вот, «на той стороне» пока все не так страшно, как принято считать.

РБК: Что уже умеет музыкальный ИИ, а что у него пока не получается?

Д.Е.: Сейчас очень много заблуждений по поводу возможностей искусственного интеллекта в музыкальной сфере. Многие уверены, что ИИ уже может свободно создавать музыку в виде аудиопотока. Но на деле создавать аудиопоток сложно и дорого, а результат получается очень неэстетичным. В этом году мы потратили огромное количество времени и несколько сотен долларов на аренду серверов, чтобы обучить нейросеть. А на выходе получились два десятисекундных отрывочка, которые звучали как из преисподней. Это было невозможно ни слушать, ни использовать.

Но нейронная сеть может довольно эффективно работать с текстовым форматом, писать новости и даже стихи. Ноты — это тоже текстовый формат, хотя и специфический. Поэтому в музыке нейронная сеть создает не аудиопоток, а последовательность нот и аккордов.

РБК: Как именно Endel использует нейросети для создания музыки?

Д.Е.: В момент запуска проекта мы были очень вдохновлены академическими композиторами второй половины XX века и их экспериментами с генеративной музыкой. Они давали музыкантам не жесткую партитуру, которую нужно точно сыграть от начала до конца, а своего рода набор шансов и возможностей. В итоге каждый раз произведение звучало иначе. При этом мы знали сильные и слабые стороны нейросети и понимали, что ее произведения сами по себе звучат не очень хорошо. У нее есть свой узнаваемый почерк — довольно некрасивый и неестественный, нечеловечный.

Поэтому мы постарались объединить в приложении генеративную модель и нейросети. Наша музыка должна быть фоновой, но мы не можем сами написать тысячи мелодий, которые звучали бы хорошо и притом незаметно. Поэтому мы привлекаем нейросеть и просим ее сделать бесконечные мелодии по определенным правилам.

РБК: Все мелодии от ИИ получаются пригодными для использования?

Д.Е.: Нет, отсеивается больше половины. Курирование и ручной отбор — очень важная часть работы. Пока без человека ИИ не способен выдавать гарантированно качественный и эстетичный продукт.

РБК: На какие правила опирается нейросеть при создании музыкального ряда?

Д.Е.: Самое простое правило — использовать пентатонику, это наш основной лад. В случае Endel это означает, что мелодия играется только по черным клавишам. То есть соседние полутона, которые могли бы дать диссонанс, не используются.

Если нейросеть обучается по таким правилам, то по идее не должна генерировать какофонию. Но иногда она все равно соскакивает на что-то другое или задерживается на одной ноте.

РБК: Какой пример использования нейросети в музыке самый неудачный, на ваш взгляд?

Д.Е.: Несколько лет назад весь мир облетела новость о том, что нейросеть написала для Sony новый трек в стиле The Beatles. И этот трек звучал реально круто. Но как только начинаешь разбираться, то оказывается, что обученная нейросеть просто создала прогрессию аккордов. Потом люди взяли эти голые партитуры, сделали аранжировку, записали реальные музыкальные инструменты, добавили эффекты. То есть степень участия ИИ была примерно такой же, как если бы модный Instagram-блогер пришел в студию, напел мотив и попросил «сделать красиво», а всю остальную работу за него выполнили профессионалы.

Но обыватели обычно не вдаются в детали. Поэтому такие эксперименты лишь закрепляют ложные представления о возможностях ИИ в музыке.

РБК: Но ваша нейросеть все-таки сделала 20 альбомов для Warner Music. Как строилась работа в проекте и чем он завершился?

Д.Е.: Наше приложение выдает бесконечный звуковой ряд, адаптируя его под множество факторов — погоду, сердцебиение, настроение. Но приложение платное, и идея Warner Music нам показалась неплохой альтернативой. Если пользователь не хочет платить и получать персонализированную музыку, он может пойти в Spotify и получить тот же контент, только не индивидуальный, а открытый для всех.

В итоге мы подготовили 20 альбомов с музыкой, созданной при участии ИИ. Но тут тоже не удалось избежать спекуляций. Когда мы заключили контракт и начали выпускать релизы, различные СМИ написали, что близится конец традиционной музыки. Якобы в Endel пару раз нажали на кнопку и сделали десяток альбомов. Но на самом деле этому предшествовало полтора года работы, в которой были задействованы десятки людей. Проще было бы никакие кнопки не нажимать и сделать все по старинке.

РБК: Недавно в Endel написали джингл для подкаста РБК Тренды «Время остановиться». Сколько длилась работа?

Д.Е.: Когда система уже собрана и отстроена, все происходит быстро и просто. Мы старались ориентироваться на вашу аудиторию и те потребности, которые возникают у деловых людей. В первую очередь настройка на рабочий лад, фокусирование на задачах. Для этого мы выбрали достаточно активный музыкальный фон, который побуждает войти в состояние потока, включить мышление на максимум.

РБК: Какие новые проекты сейчас в работе у Endel?

Д.Е.: Поскольку наша система умеет адаптироваться к разным параметрам и факторам, нам интересно пробовать сферы, где есть дополнительные переменные. К примеру, «умные» колонки — это весело, но никаких новых переменных они в нашу систему не вводят. Другое дело — автомобиль, где можно адаптировать музыку под скорость и стиль вождения. Поэтому сейчас мы работаем с несколькими автоконцернами и пробуем себя в этом направлении.

Вообще, мы занялись музыкой не просто потому, что ее любим. Музыка интересна в первую очередь тем, что позволяет влиять на когнитивные состояния человека через звук. Но в будущем мы хотим работать не только со звуком.

Наш гранд-концепт — это «мегаумный» дом, который умеет подстраиваться под настроение обитателей. Он сможет получать информацию из календаря, навигатора, гироскопа автомобиля и других устройств. Поэтому он будет знать, что днем ты провел пять встреч, а потом еще три часа простоял в пробке. И исходя из этих данных настраивать свет, температуру, предлагать подходящие фильмы и музыку.

РБК: Как в целом музыкальный ИИ будет развиваться в обозримой перспективе?

Д.Е.: Думаю, что лет через пять–десять, когда технологии ИИ станут доступнее, качество выдаваемой музыки все еще будет слабым. Но для компаний с не очень большим бюджетом, которые не могут себе позволить вручную отбирать треки и делать аранжировки, это будет приемлемый вариант. Обязательно найдутся владельцы кафе и ресторанов, магазинов и торговых центров, которые не захотят платить лейблам или музыкантам. И тогда в ТЦ будет играть плохая, но доступная музыка от ИИ.

Дмитрий Евграфов, композитор и сооснователь сервиса Endel. Созданное стартапом приложение генерирует звуковой фон, подстраиваясь под внешние факторы и задачи пользователя, — например, помогает сосредоточиться, уснуть или расслабиться. Параллельно с работой в Endel Дмитрий выпускает собственные альбомы в стиле неоклассики.

Фото: Endel

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Гид в уверенное будущее Гид в уверенное будущее

Какие специалисты помогают выстроить образовательную и карьерную траектории

РБК
История одной песни: «В лесу родилась елочка» История одной песни: «В лесу родилась елочка»

Теперь ты узнаешь, кто ее родил

Maxim
Зверские гаджеты Зверские гаджеты

Хитроумные гаджеты для домашних животных

ТехИнсайдер
Кризисы дают возможность по-новому посмотреть абсолютно на все Кризисы дают возможность по-новому посмотреть абсолютно на все

Как построить работу огромного холдинга во время пандемии

Эксперт
«Очень приличный император» «Очень приличный император»

Римский император Диоклетиан: тот, кто променял власть на капусту

Дилетант
Почему мы толстеем от диет? Почему мы толстеем от диет?

Неожиданные последствия нашей одержимости похудением

kiozk originals
Как пилоты «Формулы-1» выходят из аварий целыми и (почти) невредимыми Как пилоты «Формулы-1» выходят из аварий целыми и (почти) невредимыми

На «Формуле-1» автомобиль может разбиться в дребезги, а пилот не пострадать

GQ
5 идей, как улучшить отношения с самим собой 5 идей, как улучшить отношения с самим собой

Чем крепче наша дружба с собой, тем легче нам общаться с другими

Psychologies
2003 год 2003 год

Арест Михаила Ходорковского, появление ГНК, триумф t.A.T.u. и Пол Маккартни

Esquire
Рома Зверь — про непротестный рок, надоевший рэп и зло из телевизора Рома Зверь — про непротестный рок, надоевший рэп и зло из телевизора

Вечно молодой группе «Звери» исполнилось 20 лет: интервью с ее лидером

РБК
Красота как образ жизни Красота как образ жизни

Известный визажист и блогер Елена Крыгина — девушка очень занятая

OK!
Не успела в салон: 5 домашних масок для волос с мгновенным эффектом Не успела в салон: 5 домашних масок для волос с мгновенным эффектом

Эти маски восстановят блеск и шикарный внешний вид волос за считанные минуты

Cosmopolitan
Дарья Бобылева: Способы не попасть в ад. Отрывок из романа «Неучтенная планета» Дарья Бобылева: Способы не попасть в ад. Отрывок из романа «Неучтенная планета»

Отрывок из нового психотерапевтического романа Дарьи Бобылевой

СНОБ
Бессонница на ранних сроках беременности: считать овец или пить таблетки? Бессонница на ранних сроках беременности: считать овец или пить таблетки?

Бессонница на ранних сроках беременности – частое явление

9 месяцев
Не только Cyberpunk 77: топ-5 игр в киберпанк-эстетике Не только Cyberpunk 77: топ-5 игр в киберпанк-эстетике

Пять видеоигр, работающих с наследием киберпанка и стимпанка

Esquire
Байки из дзота. Кто такие панфиловцы, от чего умер Гастелло и как звали Матросова Байки из дзота. Кто такие панфиловцы, от чего умер Гастелло и как звали Матросова

Подвиг их неизвестен, но имя их бессмертно!

Maxim
Красота против времени. Самые необычные кладбища автомобилей Красота против времени. Самые необычные кладбища автомобилей

Экзотические автомобили, сквозь которые прорастает природа

РБК
Кошелек или иск: как брокеры пытаются взыскать долги с потерявших более ₽1 млрд из-за отрицательных цен на нефть Кошелек или иск: как брокеры пытаются взыскать долги с потерявших более ₽1 млрд из-за отрицательных цен на нефть

Что известно о человеке, инициировавшем иск пострадавших инвесторов к Мосбирже?

Forbes
Недослышанные Недослышанные

В России впервые провели инициативный опрос 14-летних

Огонёк
Правила жизни Тайгера Вудса Правила жизни Тайгера Вудса

Правила жизни великого гольфиста Тайгера Вудса

Esquire
Стройка с нулевыми отходами Стройка с нулевыми отходами

В строительную отрасль внедряются принципы безотходного производства

РБК
Самые известные фейковые фотографии, которые принимают за реальные исторические кадры Самые известные фейковые фотографии, которые принимают за реальные исторические кадры

Это «Фотошоп» или «Инстаграм»

Maxim
Температура электронов в болометре приблизилась к теоретическому минимуму Температура электронов в болометре приблизилась к теоретическому минимуму

Новый температурный рекорд, который поможет в изучении реликтового излучения

N+1
Геннадий Сахаров: «Цифровизация как фундамент стройкомплекса» Геннадий Сахаров: «Цифровизация как фундамент стройкомплекса»

Какие компетенции сегодня нужны строителям и где их взять

РБК
«Атлант, что не расправил плечи»: на Netflix вышел черно-белый шедевр Дэвида Финчера «Манк» «Атлант, что не расправил плечи»: на Netflix вышел черно-белый шедевр Дэвида Финчера «Манк»

«Манк» — биографическая драма Дэвида Финчера о Германе Манкевиче

Forbes
Как big data помогает повысить качество услуг: кейс «Почты России» Как big data помогает повысить качество услуг: кейс «Почты России»

Зачем компаниям нужен анализ big data

Inc.
Невероятная история CD-диска. Часть 2 Невероятная история CD-диска. Часть 2

Как Philips и Sony внедряли CD-диски на рынок

Популярная механика
Константин Воробьев и Ольга Самошина. «Ни в парше, ни в парче, а так, вообче» Константин Воробьев и Ольга Самошина. «Ни в парше, ни в парче, а так, вообче»

Они поженились восемнадцатилетними, на втором курсе театрального института

Караван историй
Николай Цискаридзе: «...Всё проиграть и всё начать сначала» Николай Цискаридзе: «...Всё проиграть и всё начать сначала»

Артист и педагог Николай Цискаридзе о стойкости и способности многое преодолеть

Здоровье
7 секретов стиля Грейс Келли, которые сделали ее модной иконой 7 секретов стиля Грейс Келли, которые сделали ее модной иконой

В чем секрет обворожительной Грейс Келли?

Cosmopolitan
Открыть в приложении