Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Цена успеха: как дорого мы готовы заплатить Цена успеха: как дорого мы готовы заплатить

Как устроен успех и можно ли быть успешным во всем?

Psychologies
Совсем не игрушки Совсем не игрушки

Сколько могут стоить машины, которые были у дедушки, когда он был внуком

Автопилот
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Этих слов нет в русском языке, но мы почему-то их произносим. А вы знали? Этих слов нет в русском языке, но мы почему-то их произносим. А вы знали?

Проверим, кто все это время говорил неправильно?

ТехИнсайдер
Как бессонница вдохновила бывшего консультанта придумать систему домашнего освещения, которая бережет ваши глаза (и психику) Как бессонница вдохновила бывшего консультанта придумать систему домашнего освещения, которая бережет ваши глаза (и психику)

Колин Биллингс терял сон

Inc.
С заботой друг о друге: кому сейчас нужна помощь и как ее можно оказать С заботой друг о друге: кому сейчас нужна помощь и как ее можно оказать

Делимся историями людей и организаций, которые сейчас находят способы помогать

Psychologies
После людей После людей

Призраки прошлого служат наглядным напоминанием об ошибках человечества

Вокруг света
Одна вокруг света: знаменитая Дорога смерти и Королевская Кордильера Одна вокруг света: знаменитая Дорога смерти и Королевская Кордильера

181-я серия о кругосветном путешествии москвички Ирины Сидоренко: Боливия

Forbes
Самые бюджетные бренды, в которые одеваются современные королевы и принцессы Самые бюджетные бренды, в которые одеваются современные королевы и принцессы

Масс-маркет, который можно носить по-королевски

VOICE
Археологи раскопали дом небогатых жителей Помпей Археологи раскопали дом небогатых жителей Помпей

Внутри дома в Помпеях находились предметы быта и остатки мебели

N+1
Как выглядела прокладка кабеля под Атлантическим океаном в 1866 году Как выглядела прокладка кабеля под Атлантическим океаном в 1866 году

Как первопроходцы прокладывали кабель через океан в XIX веке?

Maxim
Все испортили? Почему дизайнеры наняли моделей плюс-сайз и все равно не угодили девушкам Все испортили? Почему дизайнеры наняли моделей плюс-сайз и все равно не угодили девушкам

Что не так с современной модой для плюс-сайз девушек?

VOICE
Анализ 777 древних геномов прояснил происхождение популяций эпохи палеометалла Анализ 777 древних геномов прояснил происхождение популяций эпохи палеометалла

Историю индоевропейских языков можно проследить до ямной культуры

N+1
Ядовитые реки, отравленные моря Ядовитые реки, отравленные моря

Катастрофы, угрожающие живым организмам, происходят довольно часто

Наука и жизнь
Оказалось, что вода спонтанно превращается в перекись — и с этим связана сезонность простуды и гриппа Оказалось, что вода спонтанно превращается в перекись — и с этим связана сезонность простуды и гриппа

Ученые доказали, что микрокапли воды могут превращаться в перекись сами по себе

ТехИнсайдер
Ниоткуда, с любовью Ниоткуда, с любовью

SUV как повод к ресентименту

Автопилот
«Пока не сыграл в ящик»: как составить список самых важных дел «Пока не сыграл в ящик»: как составить список самых важных дел

Как составить bucket list и при этом избежать ошибок?

Psychologies
Кто придумал баскетбол и хоккей? Главное о популярных видах спорта Кто придумал баскетбол и хоккей? Главное о популярных видах спорта

Как появились всем известные регби, фигурное катание и гольф

ТехИнсайдер
Правда ли, что искусственный интеллект научился выявлять рак точнее рентгенолога: прорыв в диагностике онкологии Правда ли, что искусственный интеллект научился выявлять рак точнее рентгенолога: прорыв в диагностике онкологии

Может ли искусственный интеллект выявить рак? Как это поможет врачам?

ТехИнсайдер
«Джуны» не нужны: почему выпускникам IT-курсов стало сложнее найти работу «Джуны» не нужны: почему выпускникам IT-курсов стало сложнее найти работу

Что может помочь молодым IT-специалистам с трудоустройством

Forbes
5 эффективных приемов, которые продлят жизнь продуктов и сохранят их свежими надолго 5 эффективных приемов, которые продлят жизнь продуктов и сохранят их свежими надолго

Лайфхаки, которые продлят жизнь продуктам и значительно сократят расходы

ТехИнсайдер
«Жизнь по вызову»: каким получился новый сериал Сарика Андреасяна об эскорте в России «Жизнь по вызову»: каким получился новый сериал Сарика Андреасяна об эскорте в России

«Жизнь по вызову» — отставший от жизни проект о проституции

Forbes
Как удалить дубликаты контактов на Android Как удалить дубликаты контактов на Android

Как с помощью программ удалить повторы в телефонной книге на Android

ТехИнсайдер
«Я люблю вас сильно-сильно»: история маньяка Вячеслава Соловьева, который убил даже жену и дочь «Я люблю вас сильно-сильно»: история маньяка Вячеслава Соловьева, который убил даже жену и дочь

Вячеслав Соловьев без малейших колебаний убивал тех, кто его раздражал

VOICE
Древнейшие земледельцы сформировались из трех предковых популяций Древнейшие земледельцы сформировались из трех предковых популяций

Ученые разобрались в происхождении населения эпохи докерамического неолита

N+1
Блефаропластика: операция на веках, которая возвращает лицу молодость Блефаропластика: операция на веках, которая возвращает лицу молодость

Блефаропластика – малоинвазивная операция на верхних и нижних веках

ТехИнсайдер
Впервые на русском — роман Джойс Кэрол Оутс «Ночь, сон, смерть и звезды» Впервые на русском — роман Джойс Кэрол Оутс «Ночь, сон, смерть и звезды»

Отрывок из новой семейной саги современного классика Джойс Кэрол Оутс

СНОБ
«Конец привычного мира»: а как построить новый? «Конец привычного мира»: а как построить новый?

Прежняя жизнь закончилась. Как создать новую?

Psychologies
Зачем TikTok база изображений сексуализированного насилия над несовершеннолетними Зачем TikTok база изображений сексуализированного насилия над несовершеннолетними

С какими материалами работают модераторы контента в TikTok?

Forbes
Строгая красота Строгая красота

Проект, в котором соединились классические элементы с современной эстетикой

SALON-Interior
Открыть в приложении