Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

6 главных финансовых ошибок, которые люди совершают с 30 до 40 лет 6 главных финансовых ошибок, которые люди совершают с 30 до 40 лет

О деньгах нужно заботиться в любом возрасте, но с 30 до 40 — особенно

Maxim
«Нам с мужем ребенок в путешествиях не мешает» «Нам с мужем ребенок в путешествиях не мешает»

Рената Пиотровски провела с семьей отпуск в солнечном Дубае

OK!
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Что вы знаете о Лермонтове? 7 неожиданных фактов из жизни русского поэта Что вы знаете о Лермонтове? 7 неожиданных фактов из жизни русского поэта

7 неочевидных фактов о самом романтичном поэте своего времени

ТехИнсайдер
Эффективные способы укрепить ногти в домашних условиях Эффективные способы укрепить ногти в домашних условиях

На красоту и здоровье ногтей влияет множество факторов

VOICE
Как оптимизировать Windows 11 и Windows 10 для игр: компьютер будет «летать»! Как оптимизировать Windows 11 и Windows 10 для игр: компьютер будет «летать»!

Мало купить мощный компьютер, его нужно еще и оптимизировать

ТехИнсайдер
Ломать и строить Ломать и строить

Пожары, наводнения и набеги врагов развивали градостроительство

Вокруг света
Самые бюджетные бренды, в которые одеваются современные королевы и принцессы Самые бюджетные бренды, в которые одеваются современные королевы и принцессы

Масс-маркет, который можно носить по-королевски

VOICE
Как часто нужно стирать подушки: совет, который мы привыкли игнорировать Как часто нужно стирать подушки: совет, который мы привыкли игнорировать

Как правильно поддерживать гигиену подушек?

ТехИнсайдер
Знай свою норму: от чего зависит, как быстро ты пьянеешь и как плохо тебе будет наутро? Знай свою норму: от чего зависит, как быстро ты пьянеешь и как плохо тебе будет наутро?

Почему некоторых развозит сразу, а кто-то вдруг перепьет здоровых мужиков

Maxim
«Подбрасывание лисиц и другие забытые и опасные виды спорта». Гид по маргинальным развлечениям прошлого «Подбрасывание лисиц и другие забытые и опасные виды спорта». Гид по маргинальным развлечениям прошлого

Вряд ли кто-то из вас пробовал конный бокс или рукопашный бой с медведем

N+1
Работа инсулина и рост нервов: открытия в биологии и медицине, сделанные женщинами Работа инсулина и рост нервов: открытия в биологии и медицине, сделанные женщинами

Женщины-лауреаты Нобелевской премии

Forbes
Сына никогда не видел, а дочь встретил однажды и потом тосковал до самой смерти: как сложилась судьба детей Маяковского Сына никогда не видел, а дочь встретил однажды и потом тосковал до самой смерти: как сложилась судьба детей Маяковского

Дети Маяковского родились и жили в разных странах

ТехИнсайдер
Время пить из самовара: как и зачем выбирать водогрейную машину в XXI веке Время пить из самовара: как и зачем выбирать водогрейную машину в XXI веке

Есть ли у тебя самовар, товарищ? Нет? Напрасно!

Maxim
Отец объемной мультипликации: как жил и работал Владислав Старевич Отец объемной мультипликации: как жил и работал Владислав Старевич

«Этот человек обогнал всех аниматоров мира на несколько десятилетий»

Правила жизни

У Веры было много талантов, один из них — это умение дружить

Караван историй
Как приготовить омлет «Пуляр», фирменное блюдо Александра Богданова, бренд-шефа Cafe Claret и Marius Как приготовить омлет «Пуляр», фирменное блюдо Александра Богданова, бренд-шефа Cafe Claret и Marius

Омлет «Пуляр» настолько пышный и воздушный, что напоминает скорее десерт

Правила жизни
Всегда под рукой: 10 способов упростить себе жизнь с помощью смартфона Всегда под рукой: 10 способов упростить себе жизнь с помощью смартфона

10 приложений, которые помогут сделать повседневную жизнь проще и удобнее

VOICE
Как полировать фары автомобиля: три способа и советы эксперта Как полировать фары автомобиля: три способа и советы эксперта

Вернуть фарам изначальный вид можно при помощи полировки

РБК
Электрическая стимуляция мозга улучшила память пожилых людей Электрическая стимуляция мозга улучшила память пожилых людей

Транскраниальная электрическая стимуляция мозга помогает улучшить память

N+1
Если голуби перестанут трясти головой, они ослепнут! 5 удивительных фактов про голубей, о которых вы не догадывались Если голуби перестанут трясти головой, они ослепнут! 5 удивительных фактов про голубей, о которых вы не догадывались

Оказывается, голуби не так просты, как кажется!

ТехИнсайдер
Феномен незавершенных действий: что такое эффект Зейгарник и как довести все до конца Феномен незавершенных действий: что такое эффект Зейгарник и как довести все до конца

Мысли о незавершенных делах способны повысить тревожность

Forbes
Первые встречи людей и неандертальцев не были мирными. Древняя оружейная мастерская в Румынии Первые встречи людей и неандертальцев не были мирными. Древняя оружейная мастерская в Румынии

Археологи исследуют в западной Румынии древнюю стоянку Homo Sapiens

ТехИнсайдер
Как работает восьмицилиндровый двигатель: полный разбор на наглядном примере Как работает восьмицилиндровый двигатель: полный разбор на наглядном примере

Engineering Explained распечатал на 3D-принтере объемную модель двигателя V8

ТехИнсайдер
Почему маленькие дети так часто заражаются острицами и как уберечь ребенка от паразитов Почему маленькие дети так часто заражаются острицами и как уберечь ребенка от паразитов

Острицы способны нарушить даже самые всеобъемлющие стандарты гигиены

ТехИнсайдер
«Родина щедро поила меня»: из чего в СССР делали березовый сок «Родина щедро поила меня»: из чего в СССР делали березовый сок

«И родина щедро поила меня березовым соком, березовым соком»

VOICE
Больше половины видов с неясным природоохранным статусом оказались под угрозой исчезновения Больше половины видов с неясным природоохранным статусом оказались под угрозой исчезновения

Ученые создали компьютерную модель, которая оценивает риск исчезновения видов

N+1
Искренняя книга о жизни и надежде Александра Гулько «Райгород» Искренняя книга о жизни и надежде Александра Гулько «Райгород»

История нескольких поколений семьи Лейба Гройсмана, гениального предпринимателя

СНОБ
Мама, не грусти Мама, не грусти

Мамы проходят испытание послеродовой депрессией, даже не подозревая об этом

Лиза
Что не так с истребителем F-35: проблемы авиации V поколения Что не так с истребителем F-35: проблемы авиации V поколения

Почему в истребителях F-35 пилоты чувствуют себя плохо?

ТехИнсайдер
Открыть в приложении