Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Принудительная стерилизация и рекордные аборты: как живут женщины в Гренландии Принудительная стерилизация и рекордные аборты: как живут женщины в Гренландии

За что борются активистки Гренландии?

Forbes
Весна в облигациях Весна в облигациях

Бизнес не намерен снижать программы по капитальным инвестициям

Ведомости
Велосипеды, ткацкие станки и кофемолки: что выпускали известные автомобильные бренды до машин Велосипеды, ткацкие станки и кофемолки: что выпускали известные автомобильные бренды до машин

С каких товаров начинали свой путь автомобильные гиганты?

ТехИнсайдер
Зарплатно-гендерный вопрос Зарплатно-гендерный вопрос

Удовлетворенность размером зарплаты среди мужчин и женщин практически сравнялась

Ведомости
Как набрать мышечную массу согласно науке: секреты рельефного тела Как набрать мышечную массу согласно науке: секреты рельефного тела

Набор мышечной массы – это не просто про штангу и куриную грудку

ТехИнсайдер
Беспределы роста. Для избранных? Беспределы роста. Для избранных?

Как будет развиваться глобальная энергетика в ближайшую четверть века

Монокль
«Галилея археологов» «Галилея археологов»

Археологи давно борются с искушением перекопать поглубже всю Святую Землю

Знание – сила
C понедельника начну C понедельника начну

Новая работа – это здорово, но и немного страшно. Как сделать все хорошо?

VOICE
В одной упряжке В одной упряжке

Нарты и собаки: как романтика каюров стала частью туризма

Отдых в России
Лидеры немного замедлились Лидеры немного замедлились

Топ-25 игроков увеличили выпуск комбикормов на 2,8%

Агроинвестор
Исследование показало, что видеоигры не оказывают негативного влияния на мозг детей, а наоборот, повышают их IQ Исследование показало, что видеоигры не оказывают негативного влияния на мозг детей, а наоборот, повышают их IQ

Дети, активно играющие в видеоигры, имеют высокий уровень умственной активности

Inc.
Зал ожиданий Зал ожиданий

Для психического здоровья фитнес даже полезнее, чем для физического

VOICE
Жизнь в магнитном поле Жизнь в магнитном поле

Как изучают незаметные для органов чувств магнитные эффекты

Наука и жизнь
Савва и Мария Савва и Мария

Мария Червоткина о материнском фэшн-пути и окситоциновых слезах

Собака.ru
Культура сбережений: зачем откладывать на завтра то, что можно потратить сегодня? Культура сбережений: зачем откладывать на завтра то, что можно потратить сегодня?

Зачем каждому гражданину нужно выработать у себя привычку делать сбережения?

Наука и техника
Амарант Амарант

Почему амарант — суперфуд и важнейшая пищевая культура XXI века

Здоровье
Биология на рубеже веков, или Сто лет тому вперед Биология на рубеже веков, или Сто лет тому вперед

Биология в 1900-х годах по темпам своего развития ничуть не отставала от физики

Знание – сила
Жизнь по своему коду: как понять свою истинную природу и перестать подстраиваться Жизнь по своему коду: как понять свою истинную природу и перестать подстраиваться

Как достичь внутренней свободы и начать жить в согласии с собой

VOICE
Как сохранить близость с детьми, даже когда они становятся взрослыми Как сохранить близость с детьми, даже когда они становятся взрослыми

Если вы хотите, чтобы ваши дети всегда доверяли вам, следуйте этим советам

Inc.
3 бизнес-ошибки основателя фастфуд-сети Mary Wong 3 бизнес-ошибки основателя фастфуд-сети Mary Wong

Основатель Mary Wong — о шишках, которые набил в процессе развития фастфуд-сети

Inc.
Петр Ануров: Это волнующе и рискованно Петр Ануров: Это волнующе и рискованно

Как продюсер Петр Ануров выбирает проекты и собирает звёздные составы

Ведомости
Василий Мищенко: «Табаков не отпустил меня сниматься к Михалкову» Василий Мищенко: «Табаков не отпустил меня сниматься к Михалкову»

Василию Мищенко сказали на экзаменах: «По-моему, это сумасшедший, надо брать!»

Коллекция. Караван историй
Редкие инвестиции Редкие инвестиции

Почему так важны РЗМ и можно ли в них инвестировать

Ведомости
Редкий вид Редкий вид

Как выкупить жилье после его аренды

Деньги
Фокус Фокус

Кто убил Джона Кеннеди и почему все фигуранты по этому делу умирали?

Правила жизни
Странный, но очень важный аспект: почему спринтеры начинают свой забег с низкого старта Странный, но очень важный аспект: почему спринтеры начинают свой забег с низкого старта

Каково преимущество низкого старта и почему его не используют марафонцы

ТехИнсайдер
10 забытых триллеров 90-х, которые и сегодня смотрятся современно 10 забытых триллеров 90-х, которые и сегодня смотрятся современно

Крепкие фильмы, которые остались в тени Квентина Тарантина и Мартина Скорсезе

Maxim
Пётр Шумилов: «Микрофлора уникальна. Что у одного человека – норма, у другого может быть аномалией» Пётр Шумилов: «Микрофлора уникальна. Что у одного человека – норма, у другого может быть аномалией»

Как микрофлора организма влияет на все процессы, происходящие в нем

Здоровье
Лучший производитель великих дел Лучший производитель великих дел

Бурхард Кристоф Миних был настоящим русским патриотом и храбрым воякой

Дилетант
От факелов до светодиодов: история эволюции светильников От факелов до светодиодов: история эволюции светильников

История эволюции светильников от древних времен до нашей эпохи

ТехИнсайдер
Открыть в приложении