Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

В чем суть открытия

Рекомендуемые статьи

Чем NEET-поведение опасно для бизнеса и как включить таких сотрудников в работу

Как будет развиваться глобальная энергетика в ближайшую четверть века

О том, какие технологии в гаджетах имеют тенденцию к полному исчезновению

Может ли здоровый образ жизни принести вред вместо пользы? К сожалению, да

Выбор партнера предопределен всем предшествующим ходом нашей жизни

Все ли, что мы знаем о щитовидной железе, соответствует действительности?

Надо ли тратить силы и время, чтобы научить ребенка красиво писать?

Как в русском языке появляются псевдоанглицизмы

Ученые секвенировали полные геномы шести видов человекообразных обезьян

Марк Бартон — про ИИ-психолога и инновации в сфере психологической помощи

Что нового в фэшн-индустрии? Старомодное чтение

Как удалось запечатлеть колоссального кальмара в родных для него глубинах океана

Как сон мастера картонажа прославил духов Мексики?

Новая работа – это здорово, но и немного страшно. Как сделать все хорошо?

Банки положительно оценивают отмену лимитов по IT-ипотеке

Как Intelligence Top 100: Global NOC & IOC отражает работу нефтегазовых компаний

ИИ сегодня пока не более чем новый формат поисковой системы в интернете

Телеведущая Татьяна Геворкян о том, как выглядеть стильно без больших затрат

Как интерес ФНС к числу самозанятых поменяет бизнес-модель цифровых платформ?

Как был устроен перенос научно-технических знаний на русский язык

ВТО прогнозирует сокращение в 5 раз американо-китайской торговли

Доля семян российской селекции в посевах приблизилась к 68%

«Я больше 30 лет никогда ни с кем не обнималась. А это очень хорошая штука»

Когда в России заработает сеть низкоорбитальных спутников связи

Москва поддерживает бизнес, выделяя гранты на развитие экспортной деятельности

Биология в 1900-х годах по темпам своего развития ничуть не отставала от физики

Татьяна Кочарян о спонсорских доходах и работе со зрителями баскетбола

Ключевые работы Зураба Церетели, без которых сложно представить облик городов

Если хочешь экономического мира, готовься к экономической войне

Притяжение Большого Магелланова Облака может разрывать Малое Облако на части