Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Сознание глобального гражданина и искусственный интеллект | Global Citizen Consciousness and Artificial Intelligence Сознание глобального гражданина и искусственный интеллект | Global Citizen Consciousness and Artificial Intelligence

Южнокорейский путь в реализации «третьей миссии» университетов

Позитивные изменения
Токсичные родители: стоит ли прекратить общение? Токсичные родители: стоит ли прекратить общение?

Поможет ли взрослым людям полный разрыв с родителями-агрессорами?

Psychologies
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
6 фактов о здоровье сердца, которые важно знать именно женщинам 6 фактов о здоровье сердца, которые важно знать именно женщинам

Болезни сердца – вторая причина смертности среди женщин во всем мире

Лиза
Новая «нормальность» российского свиноводства Новая «нормальность» российского свиноводства

Перспективы развития сектора российского свиноводства в 2022–2025 годах

Агроинвестор
Металлические стекла оказались частично жидкими Металлические стекла оказались частично жидкими

Доказано, что часть атомов в металлических стеклах движется подобно жидкости

N+1
Почему сила воли бесполезна в борьбе с вредными привычками Почему сила воли бесполезна в борьбе с вредными привычками

Сильная воля хороша только для краткосрочных целей

Psychologies
Гид по метаверсу от Покраса Гид по метаверсу от Покраса

Покрас Лампас — о метаверсе, метаценностях и метамодернизме

Собака.ru
Сильные и опасные: 8 пород собак, которых нельзя заводить, если у тебя дети Сильные и опасные: 8 пород собак, которых нельзя заводить, если у тебя дети

Собаки, которые не очень ладят с детьми

VOICE
Красота по-османски: 5 бьюти-правил турчанок, которые стоит взять на заметку Красота по-османски: 5 бьюти-правил турчанок, которые стоит взять на заметку

Мы раскрыли тайну османских красавиц — бери их ключевые бьюти-правила на заметку

VOICE
Как отпустить человека, которого любишь: 4 шага Как отпустить человека, которого любишь: 4 шага

Как отпустить любовь и сохранить себя

Psychologies
6 мифов о космосе, в которые вы до сих пор верите 6 мифов о космосе, в которые вы до сих пор верите

По количеству существующих мифов космос может соперничать разве что с медициной

ТехИнсайдер
Почему пародия на кино категории Б «Убойный монтаж» открыла Каннский кинофестиваль Почему пародия на кино категории Б «Убойный монтаж» открыла Каннский кинофестиваль

Каким получился «Убойный монтаж» Мишеля Хазанавичуса

СНОБ
Магия кристалла Магия кристалла

Многогранный и статусный интерьер просторной квартиры в центре столицы

SALON-Interior
«Прошу признать меня некрофилом»: история петербургского душителя Дмитрия Вороненко «Прошу признать меня некрофилом»: история петербургского душителя Дмитрия Вороненко

В последнем слове Дмитрий Вороненко заявил, что ему безразличен приговор

VOICE
«Его считают трусом, но он был храбрее всех»: краткая биография Михаила Горбачева «Его считают трусом, но он был храбрее всех»: краткая биография Михаила Горбачева

Как жил и чем запомнится первый и единственный президент СССР

СНОБ
Китайские ученые лишили мышей хромосомы. А потом еще одной Китайские ученые лишили мышей хромосомы. А потом еще одной

Ученые научились сшивать мышиные хромосомы между собой

N+1
Рыбников и Ларионова: неидеальная история любви самой красивой пары советского кинематографа Рыбников и Ларионова: неидеальная история любви самой красивой пары советского кинематографа

Николай Рыбников всю жизнь любил только одну женщину - Аллу Ларионову

VOICE
Плоды осени: самые полезные ягоды, овощи и фрукты Плоды осени: самые полезные ягоды, овощи и фрукты

Осенний урожай очень богат и разнообразен

ТехИнсайдер
Кокетливый язык тела: какие жесты заводят мужчин и женщин Кокетливый язык тела: какие жесты заводят мужчин и женщин

Язык тела позволяет выразить наши чувства и желания

Psychologies
Электрон попал внутрь полости октафторкубана Электрон попал внутрь полости октафторкубана

Химики из Японии впервые синтезировали полностью фторированный аналог кубана

N+1
6 советов, которые помогут сделать жизнь экологичнее 6 советов, которые помогут сделать жизнь экологичнее

Помочь природе может каждый, даже слегка изменив повседневную рутину

СНОБ
Смотреть в корень Смотреть в корень

Может ли секс быть ресурсом?

Psychologies
О чем говорит цвет выделений из носа О чем говорит цвет выделений из носа

Носовая слизь может менять цвет и текстуру в зависимости от причины ее появления

ТехИнсайдер
Из чего делают стекло: секреты состава удивительного материала Из чего делают стекло: секреты состава удивительного материала

Как в реальности создают стекло?

ТехИнсайдер
Освободить тело Освободить тело

Избавиться от зажимов помогут танцевальные практики

Psychologies
Жить – можно Жить – можно

Что такое «биполярка» и почему шизофрения больше не приговор?

Psychologies
«Лингвисты, пришедшие с холода». История структурной лингвистики в СССР «Лингвисты, пришедшие с холода». История структурной лингвистики в СССР

Лингвистические задачи, придуманным Андреем Анатольевичем Зализняком

N+1
Рушим мифы об эндоскопическом омоложении: убедись во всем на звездных примерах! Рушим мифы об эндоскопическом омоложении: убедись во всем на звездных примерах!

Разберем популярные мифы об эндоскопическом омоложении на звездных примерах

VOICE
Как подключить ноутбук к монитору: провода необязательны Как подключить ноутбук к монитору: провода необязательны

Как легко подключить лэптоп к обычному монитору?

CHIP
Открыть в приложении