Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Профессиональные бездельники»: кто такие NEET-сотрудники и как заставить их работать «Профессиональные бездельники»: кто такие NEET-сотрудники и как заставить их работать

Чем NEET-поведение опасно для бизнеса и как включить таких сотрудников в работу

Forbes
Беспределы роста. Для избранных? Беспределы роста. Для избранных?

Как будет развиваться глобальная энергетика в ближайшую четверть века

Монокль
Зарядки, SIM-карты и кнопки: какие технологии в гаджетах могут исчезнуть уже через пару лет Зарядки, SIM-карты и кнопки: какие технологии в гаджетах могут исчезнуть уже через пару лет

О том, какие технологии в гаджетах имеют тенденцию к полному исчезновению

ТехИнсайдер
Бодрость и предубеждение Бодрость и предубеждение

Может ли здоровый образ жизни принести вред вместо пользы? К сожалению, да

VOICE
Мы выбираем друг друга не случайно Мы выбираем друг друга не случайно

Выбор партнера предопределен всем предшествующим ходом нашей жизни

Psychologies
Мифы о щитовидке Мифы о щитовидке

Все ли, что мы знаем о щитовидной железе, соответствует действительности?

Лиза
Пишем красиво Пишем красиво

Надо ли тратить силы и время, чтобы научить ребенка красиво писать?

Лиза
Лингвистические фантомы Лингвистические фантомы

Как в русском языке появляются псевдоанглицизмы

Наука и жизнь
Генетики получили полные геномы 6 видов человекообразных обезьян Генетики получили полные геномы 6 видов человекообразных обезьян

Ученые секвенировали полные геномы шести видов человекообразных обезьян

ТехИнсайдер
Терапия будущего Терапия будущего

Марк Бартон — про ИИ-психолога и инновации в сфере психологической помощи

Psychologies
Роскошь прочтения Роскошь прочтения

Что нового в фэшн-индустрии? Старомодное чтение

Grazia
Колоссального кальмара впервые сняли на видео в естественной среде обитания Колоссального кальмара впервые сняли на видео в естественной среде обитания

Как удалось запечатлеть колоссального кальмара в родных для него глубинах океана

N+1
Ушедшее в народ Ушедшее в народ

Как сон мастера картонажа прославил духов Мексики?

Вокруг света
C понедельника начну C понедельника начну

Новая работа – это здорово, но и немного страшно. Как сделать все хорошо?

VOICE
К чему приведет отмена лимитов по IT-ипотеке К чему приведет отмена лимитов по IT-ипотеке

Банки положительно оценивают отмену лимитов по IT-ипотеке

Ведомости
Развитие вместо красивых отчетов Развитие вместо красивых отчетов

Как Intelligence Top 100: Global NOC & IOC отражает работу нефтегазовых компаний

Эксперт
ChatGPT: а что в сухом остатке? ChatGPT: а что в сухом остатке?

ИИ сегодня пока не более чем новый формат поисковой системы в интернете

Монокль
Татьяна Геворкян: «С годами на лице проявляются все эмоции, которые мы проживали» Татьяна Геворкян: «С годами на лице проявляются все эмоции, которые мы проживали»

Телеведущая Татьяна Геворкян о том, как выглядеть стильно без больших затрат

Здоровье
ПВЗ под прицелом, маркетплейсам приготовиться ПВЗ под прицелом, маркетплейсам приготовиться

Как интерес ФНС к числу самозанятых поменяет бизнес-модель цифровых платформ?

Монокль
«Издательский проект Петра Первого: Илья Копиевский и новые русские книги» «Издательский проект Петра Первого: Илья Копиевский и новые русские книги»

Как был устроен перенос научно-технических знаний на русский язык

N+1
Хуже станет всем Хуже станет всем

ВТО прогнозирует сокращение в 5 раз американо-китайской торговли

Ведомости
Созданы в России Созданы в России

Доля семян российской селекции в посевах приблизилась к 68%

Агроинвестор
Лариса Голубкина: «Я очень много молчу. Вот вы уйдете, я ни с кем не заговорю» Лариса Голубкина: «Я очень много молчу. Вот вы уйдете, я ни с кем не заговорю»

«Я больше 30 лет никогда ни с кем не обнималась. А это очень хорошая штука»

Караван историй
Интернет высокого полета Интернет высокого полета

Когда в России заработает сеть низкоорбитальных спутников связи

Эксперт
Вклад в людей и технологии Вклад в людей и технологии

Москва поддерживает бизнес, выделяя гранты на развитие экспортной деятельности

Ведомости
Биология на рубеже веков, или Сто лет тому вперед Биология на рубеже веков, или Сто лет тому вперед

Биология в 1900-х годах по темпам своего развития ничуть не отставала от физики

Знание – сила
«Спонсоров важно вовлекать в процесс» «Спонсоров важно вовлекать в процесс»

Татьяна Кочарян о спонсорских доходах и работе со зрителями баскетбола

Ведомости
От Петра I до коней на Манежной площади: главные работы Зураба Церетели От Петра I до коней на Манежной площади: главные работы Зураба Церетели

Ключевые работы Зураба Церетели, без которых сложно представить облик городов

Forbes
Трудная жизнь нефтерубля Трудная жизнь нефтерубля

Если хочешь экономического мира, готовься к экономической войне

Деньги
Нашу ближайшую соседку галактику Малое Магелланово Облако рвет на части Нашу ближайшую соседку галактику Малое Магелланово Облако рвет на части

Притяжение Большого Магелланова Облака может разрывать Малое Облако на части

ТехИнсайдер
Открыть в приложении