Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От Петра I до коней на Манежной площади: главные работы Зураба Церетели От Петра I до коней на Манежной площади: главные работы Зураба Церетели

Ключевые работы Зураба Церетели, без которых сложно представить облик городов

Forbes
Липецк: за рулем и пешком Липецк: за рулем и пешком

Как в Липецкой области мастера восстанавливают связь между прошлым и настоящим

Вокруг света
Цифровой сценарист: как ИИ создает иллюзию свободы выбора Цифровой сценарист: как ИИ создает иллюзию свободы выбора

Как научиться распознавать технологические манипуляции

Forbes
Как USAID научило армян ненавидеть Россию Как USAID научило армян ненавидеть Россию

Операция USAID под кодовым названием «Армения» войдет в учебники

Монокль
Как мужчины разрушают нашу самооценку: что делать и как дать отпор Как мужчины разрушают нашу самооценку: что делать и как дать отпор

Как неосторожные слова и поступки мужчин могут подрывать нашу самооценку

VOICE
Раскрыта cтратегия, которой следуют успешные люди на пути к большой цели Раскрыта cтратегия, которой следуют успешные люди на пути к большой цели

Какими качествами должны обладать эффективные лидеры и сотрудники

Inc.
Бренд народного происхождения Бренд народного происхождения

Как в России развиваются художественные промыслы

Эксперт
Кто такие «бежевые» мамы и чем опасен новый тренд? Кто такие «бежевые» мамы и чем опасен новый тренд?

Почему «бежевое материнство» стало популярным и в чем его опасность для ребенка?

VOICE
Земля ратного подвига Земля ратного подвига

Щит России: чем живёт и развивается Белгородская область сегодня

Отдых в России
Астрономы впервые достоверно нашли экзопланету с кратной полярной орбитой Астрономы впервые достоверно нашли экзопланету с кратной полярной орбитой

Ученые впервые подтвердили существование экзопланеты с кратной полярной орбитой

N+1
Новый папа Новый папа

«Конклав» — фильм о выборах папы римского, ставший метафорой современного мира

Дилетант
Николай Лебедев: Сейчас я бы очень хотел снять космическую фантастику Николай Лебедев: Сейчас я бы очень хотел снять космическую фантастику

Как Н. Лебедев стал постановщиком «Кракена» и чем ему помог плюшевый осьминог

Ведомости
Добавь изюминку Добавь изюминку

Как быстро и бюджетно преобразить дачный интерьер

Лиза
Российское бьюти-чудо: как меняется отечественная индустрия косметики Российское бьюти-чудо: как меняется отечественная индустрия косметики

Как российская косметика становится полноценным трендсеттером

РБК
Гости из настоящего и будущего Гости из настоящего и будущего

Столичная туриндустрия укрепляет свои позиции как драйвера развития Москвы

Ведомости
Тонкости переобувки: чем опасны старые шины и как избежать штрафов за утилизацию Тонкости переобувки: чем опасны старые шины и как избежать штрафов за утилизацию

Чем опасна пыль от истирания колес и почему покрышки нельзя сжигать в костре?

ТехИнсайдер
Я скоро стану мамой Я скоро стану мамой

Какие обследования и когда важно пройти будущим мамам?

Лиза
Немедикаментозное снижение массы обрекло канадца на хроническую боль Немедикаментозное снижение массы обрекло канадца на хроническую боль

Почему может развиться хроническая боль на фоне снижения массы тела

N+1
Алёна Александрова: «В каждой женщине – невероятная сила» Алёна Александрова: «В каждой женщине – невероятная сила»

Главный редактор рассказала о юбилейных проектах и работе редакции «Лизы»

Лиза
Минеральные льготы: как работает господдержка производителей удобрений Минеральные льготы: как работает господдержка производителей удобрений

Нуждаются ли компании отрасли удобрений в дополнительной поддержке?

Forbes
Революция со счастливым концом Революция со счастливым концом

Рубеж XIX и XX веков отмечен бурными событиями в целом ряде наук

Знание – сила
И бедные, и богатые: почему изменение климата все больше осложняет жизнь женщин И бедные, и богатые: почему изменение климата все больше осложняет жизнь женщин

О том, как изменение климата сказывается на здоровье жительниц больших городов

Forbes
Нейроиммунная регуляция страха оказалась чувствительна к действию психоделиков Нейроиммунная регуляция страха оказалась чувствительна к действию психоделиков

Ученые обнаружили в мозге мышей нейроиммунную сеть, отвечающую за чувство страха

N+1
Дискуссия о формате: почему российской рознице нужны единые стандарты регулирования Дискуссия о формате: почему российской рознице нужны единые стандарты регулирования

Государство хочет установить правила регулирования работы маркетплейсов

Forbes
Непонятный кодекс Непонятный кодекс

Юристы пожаловались на усложнение налоговых норм для восприятия

Ведомости
Хватит играть в GTA: топ-5 крутых игр с открытым миром на ПК Хватит играть в GTA: топ-5 крутых игр с открытым миром на ПК

Каким играм с открытым миром стоит уделить время?

Maxim
Борьба со старением: новые подходы и тренды Борьба со старением: новые подходы и тренды

Что сегодня предлагает от старения превентивная медицина?

РБК
Звезды манящие Звезды манящие

Ослепительная вспышка, которой уже некого слепить, миг неуловимый

Знание – сила
IDеальное преступление IDеальное преступление

Четыре года назад «Популярная механика» опубликовала свой первый кибердетектив

ТехИнсайдер
От жуткого хоррора до ироничной пародии: как кино переосмысливает классические сказки на новый лад От жуткого хоррора до ироничной пародии: как кино переосмысливает классические сказки на новый лад

Оригинальные проекты, переосмысливающие классические сказки в неожиданном ключе

Правила жизни
Открыть в приложении