Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Психофизическое онемение: почему мы привыкаем к плохим новостям и начинаем меньше сопереживать Психофизическое онемение: почему мы привыкаем к плохим новостям и начинаем меньше сопереживать

Почему мы продолжаем читать плохие новости, но начинаем меньше переживать?

Правила жизни
«Охота на девушек»: как модельный бизнес зарабатывал на торговле подростками «Охота на девушек»: как модельный бизнес зарабатывал на торговле подростками

Возможно ли изменить модельный бизнес с помощью кино?

Forbes
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Новые открытия в Помпеях рассказывают подробности жизни римского среднего класса Новые открытия в Помпеях рассказывают подробности жизни римского среднего класса

Каким был римский средний класс?

ТехИнсайдер
Правила жизни Салмана Рушди Правила жизни Салмана Рушди

Правила жизни романиста Салмана Рушди

Правила жизни
Формула долголетия: 5 книг, которые помогут вам привить полезные привычки Формула долголетия: 5 книг, которые помогут вам привить полезные привычки

Книги, которые помогут сформировать привычки, ведущие к счастью и богатству

ТехИнсайдер
5 продуктов, которые можно есть перед сном, если вы хотите похудеть 5 продуктов, которые можно есть перед сном, если вы хотите похудеть

Чтобы сбросить лишний вес, есть на ночь не только можно, но и нужно!

ТехИнсайдер
Норманны vs славяне. 300-летняя война Норманны vs славяне. 300-летняя война

Кого призвали старейшины: братьев-славян или братьев-варягов?

Дилетант
«Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения? «Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения?

Почему женщины не хотят секса в браке и как об этом говорить?

Правила жизни
Археологи раскопали дом небогатых жителей Помпей Археологи раскопали дом небогатых жителей Помпей

Внутри дома в Помпеях находились предметы быта и остатки мебели

N+1
«Мы вам перезвоним» «Мы вам перезвоним»

9 причин, почему тебя не берут на работу и что с этим делать

Лиза
Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна Библия сексуальной революции и космические мечты: что почитать у Роберта Хайнлайна

Знаковые романы Роберта Хайнлайна

ТехИнсайдер
«Невидимый страж». Как иммунитет защищает нас от внешних и внутренних угроз «Невидимый страж». Как иммунитет защищает нас от внешних и внутренних угроз

Отрывок из книги «Невидимый страж» — о теории гуморального иммунитета

N+1
Жители эллинистической Береники разнообразно использовали ракушки от съеденных моллюсков Жители эллинистической Береники разнообразно использовали ракушки от съеденных моллюсков

Морские ресурсы играли важную роль в жизни эллинистической Береники

N+1
Антиоксиданты: что это такое, и зачем они нужны Антиоксиданты: что это такое, и зачем они нужны

Как работают антиоксиданты?

ТехИнсайдер
Как быстро очистить подошву утюга от пригара: возвращаем бытовой технике прежний вид Как быстро очистить подошву утюга от пригара: возвращаем бытовой технике прежний вид

Мы знаем, как вернуть утюгу былой блеск и чистоту

ТехИнсайдер
«Боец музыкального фронта» «Боец музыкального фронта»

Жавдет Айдаров навсегда остался настоящим ленинградцем

Дилетант
7 милых и крайне опасных представителей мира животных 7 милых и крайне опасных представителей мира животных

Милые животные, встреча с которыми может быть смертельно опасна

ТехИнсайдер
История одной песни: Slayer, «Angel of Death», 1986 История одной песни: Slayer, «Angel of Death», 1986

Вещица про холокост и Освенцим, которая переменила рельеф экстремального металла

Maxim
4 национальных символа, которые на самом деле «иностранцы» 4 национальных символа, которые на самом деле «иностранцы»

Ты знал, что Сталинградский завод был построен в США?

Maxim
8 забавных фактов о полицейских собаках 8 забавных фактов о полицейских собаках

А ты знал, что в Штатах у собак есть офицерские звания?

Maxim
Он держался до последнего: какого рода слово Он держался до последнего: какого рода слово

Так как правильно: "горячий кофе" или все же "горячее"?

ТехИнсайдер
Дорогие мои: 6 вещей, которые помогут выглядеть солидно Дорогие мои: 6 вещей, которые помогут выглядеть солидно

Что такое статусный гардероб? Шкаф, набитый брендовой одеждой?

Правила жизни
Растянутая футболка или стильный халат: зачем нужно красиво одеваться дома? Растянутая футболка или стильный халат: зачем нужно красиво одеваться дома?

Почему мы на улице и мы дома — два разных человека?

Psychologies
Какие тайны выдают дома Анастасии Волочковой, Николая Баскова и Яны Рудковской о своих владельцах — рассказывает эксперт Какие тайны выдают дома Анастасии Волочковой, Николая Баскова и Яны Рудковской о своих владельцах — рассказывает эксперт

О чем говорит дизайн домов знаменитостей

Maxim
Бегаю в туалет каждые 15 минут: как я живу с гиперактивным мочевым пузырем Бегаю в туалет каждые 15 минут: как я живу с гиперактивным мочевым пузырем

Как проявляется гиперактивность мочевого пузыря?

VOICE
Яна Сексте: Яна Сексте:

Бомба замедленного действия — Яна Сексте

Караван историй
Уровень воды в Ниле позволил египтянам подвозить камень к месту строительства пирамид Уровень воды в Ниле позволил египтянам подвозить камень к месту строительства пирамид

Как египтяне возводили пирамиды Гизы?

N+1
«Джеймс Уэбб» обнаружил кандидата в древнейшую известную галактику «Джеймс Уэбб» обнаружил кандидата в древнейшую известную галактику

Астрономы обнаружили очередного кандидата в древнейшую галактику

N+1
Откуда вырос арифметический корень? Откуда вырос арифметический корень?

Попробуем разобраться в запутанной истории появления на свет знака радикала

Наука и жизнь
Открыть в приложении