Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Павел первый и единственный Павел первый и единственный

Империя Павла Дурова остается уникальной территорией хороших новостей

Men Today
Святое Собеседование: рождение жанра Святое Собеседование: рождение жанра

Живописец Ян ван Эйк жил по принципу: «любой каприз за ваши деньги»

Дилетант
6 способов защиты от болезни Альцгеймера 6 способов защиты от болезни Альцгеймера

Есть полезные привычки, которые помогут сохранить ясность ума

Psychologies
Елена Долгопят: «Хроники забытых сновидений». Дневник кинозрителя Елена Долгопят: «Хроники забытых сновидений». Дневник кинозрителя

Отрывок из книги «Хроники забытых сновидений», где сны мешаются с явью

СНОБ
Шнековая или центробежная соковыжималка: чей сок лучше Шнековая или центробежная соковыжималка: чей сок лучше

Чем отличаются разные соковыжималки по принципу работы?

CHIP
«Жанна д’Арк из Сирии»: как Назик аль-Абид добивалась свободы для страны и для женщин «Жанна д’Арк из Сирии»: как Назик аль-Абид добивалась свободы для страны и для женщин

Назик аль-Абид — женщина-генерал, посвятившая жизнь борьбе за права женщин

Forbes
«Чаадаевское дело». Идеология, риторика и государственная власть в николаевской России «Чаадаевское дело». Идеология, риторика и государственная власть в николаевской России

Отрывок из книги «Чаадаевское дело» — о правительственных решениях Николая I

N+1
Греть предметы, а не воздух: в чем особенность инфракрасных обогревателей Греть предметы, а не воздух: в чем особенность инфракрасных обогревателей

Какой обогреватель лучше — инфракрасный или конвекционный?

CHIP
Инсулиновая помпа восстановила структуру мозга у подростков-диабетиков Инсулиновая помпа восстановила структуру мозга у подростков-диабетиков

Как разные способы введения инсулина влияют на мозг подростков с диабетом

N+1
Парадокс добродетели: почему людям присущи подлинная доброта и немыслимая жестокость Парадокс добродетели: почему людям присущи подлинная доброта и немыслимая жестокость

Отрывок из книги антрополога Ричарда Рэнгема «Парадокс добродетели»

Forbes
7 советов, которые помогут похудеть после 40 лет 7 советов, которые помогут похудеть после 40 лет

Кто сказал, что красивая фигура после 40 лет – сложно?

ТехИнсайдер
Посмотрите на 10 самых древних произведений искусства Посмотрите на 10 самых древних произведений искусства

Как самовыражался древний человек?

ТехИнсайдер
Скорость взаимодействия ридберговских кубитов приблизили к фундаментальному пределу Скорость взаимодействия ридберговских кубитов приблизили к фундаментальному пределу

Японским физикам удалось добиться обмена энергией между кубитами

N+1
Токсичные родители: стоит ли прекратить общение? Токсичные родители: стоит ли прекратить общение?

Поможет ли взрослым людям полный разрыв с родителями-агрессорами?

Psychologies
История одной песни: «Gangnam Style», PSY, 2012 История одной песни: «Gangnam Style», PSY, 2012

Летом 2012 года YouTube пережил первое в своей истории музыкальное потрясение

Maxim
15 главных фактов о коньяке, без которых его просто стыдно пить 15 главных фактов о коньяке, без которых его просто стыдно пить

12 фактов о самом благородном из алкогольных напитков

Maxim
Тяга к алкоголю у женщин чаще превращается в зависимость Тяга к алкоголю у женщин чаще превращается в зависимость

Связь между плохим настроением и желанием выпить может привести к зависимости

ТехИнсайдер
Искусственные эмбрионы мыши развились до восьмого дня вне матки Искусственные эмбрионы мыши развились до восьмого дня вне матки

Ученые создали мышиные эмбрионы и дорастили их до восьмого дня развития

N+1
Треть цинка попала на Землю вместе с метеоритами Треть цинка попала на Землю вместе с метеоритами

Метеориты могут быть источником цинка, ртути, селена на Земле

N+1
«Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения? «Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения?

Почему женщины не хотят секса в браке и как об этом говорить?

Правила жизни
Снимите это немедленно Снимите это немедленно

В каких случаях очки могут тебе навредить

Лиза
Стесняюсь спросить: почему женщинам бывает тяжело достичь оргазма с партнером? Стесняюсь спросить: почему женщинам бывает тяжело достичь оргазма с партнером?

Что делать, если оргазм не наступает без подручных средств?

Правила жизни
Земля кочевая Земля кочевая

Башкирская земля всегда рада гостям

Отдых в России
6 главных ошибок при заваривании чая, превращающих благородный напиток в яд 6 главных ошибок при заваривании чая, превращающих благородный напиток в яд

Может ли чай быть вреден для здоровья?

ТехИнсайдер
Как покупать винил: для чайников и продвинутых Как покупать винил: для чайников и продвинутых

Где и как приобретать пластинки в России, как не купить ерунду?

Maxim
Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна

Знаковые романы Роберта Хайнлайна

ТехИнсайдер
Что не так с истребителем F-35: проблемы авиации V поколения Что не так с истребителем F-35: проблемы авиации V поколения

Почему в истребителях F-35 пилоты чувствуют себя плохо?

ТехИнсайдер
Почему новый стартап скандального основателя WeWork похож на предыдущий Почему новый стартап скандального основателя WeWork похож на предыдущий

Почему к стартапам в портфеле Адама Нойманна столько вопросов?

Forbes
Возьмем себя в руки Возьмем себя в руки

Мастер-класс «эрогенной анатомии»

Psychologies
Почему короли и императоры веками вступали в близкородственные браки? Почему короли и императоры веками вступали в близкородственные браки?

Корона, кольцо, ваш двоюродный брат — что еще нужно для королевской свадьбы?

ТехИнсайдер
Открыть в приложении