Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Тренд золотых девочек»: как женщины ищут компаньонок для совместной жизни на пенсии «Тренд золотых девочек»: как женщины ищут компаньонок для совместной жизни на пенсии

Женские коммуны вместо домов престарелых — как женщины борются с одиночеством

Forbes
Мир, дружба, Мир, дружба,

Актеры Кирилл Кяро и Даниил Страхов — о дружбе, работе и “Гипнозисеˮ

Men Today
«Думающие» ИИ-спутники сами выбирают момент съемки Земли «Думающие» ИИ-спутники сами выбирают момент съемки Земли

Как работает система, позволяющая спутникам анализировать обстановку

ТехИнсайдер
«Сейчас период повышения внутренней эффективности» «Сейчас период повышения внутренней эффективности»

Дмитрий Фосман — о перспективах развития экспорта и работе по привлечению кадров

Агроинвестор
Список уловок телефонных мошенников: разбираем самые частые способы обмана Список уловок телефонных мошенников: разбираем самые частые способы обмана

Список из самых распространенных атак телефонных мошенников

Maxim
Из ответственных рабочих — в мастера Из ответственных рабочих — в мастера

Как в условиях кадрового голода на рынке труда удержать работников?

Монокль
Кто такая пикми: разбираем феномен пикми-герл с психологами Кто такая пикми: разбираем феномен пикми-герл с психологами

Что стоит за пикми-поведением?

РБК
Как научиться принимать комплименты Как научиться принимать комплименты

Почему бывает трудно принимать комплименты и как с этим справиться

Inc.
«Огонь-батареи»: как изменились космические солнечные батареи за 67 лет «Огонь-батареи»: как изменились космические солнечные батареи за 67 лет

Какой путь прошли солнечные элементы космического типа с момента изобретения?

ТехИнсайдер
Плетущие судьбы Плетущие судьбы

Послания, зашифрованные в орнаментах и узорах России

Вокруг света
Бренд народного происхождения Бренд народного происхождения

Как в России развиваются художественные промыслы

Эксперт
Чудо-молекулы Чудо-молекулы

Зачем нашей коже нужны ниацинамид и эктоин

Лиза
Мы идем своим путем Мы идем своим путем

Русская внешняя политика как культурное явление

Эксперт
Светлана Коркошко: «Одиночество — это моя природа» Светлана Коркошко: «Одиночество — это моя природа»

«Я долго не могла переступить порог моего любимого МХАТа после его раздела»

Коллекция. Караван историй
Куда приводят мечты инженеров Куда приводят мечты инженеров

Маршрут выходного дня по Калужской области

Weekend
«У художника нет цели — только путь» «У художника нет цели — только путь»

Зорикто Доржиев о том, как искать себя в легендах и находить на Christie’s

Weekend
Еда с повышенным содержанием расходов Еда с повышенным содержанием расходов

Что толкает цены на продовольствие вверх

Эксперт
Люся Чеботина: «Люблю вызовы и эксперименты» Люся Чеботина: «Люблю вызовы и эксперименты»

Люся Чеботина о весне, вдохновении и любви

Лиза
Самокаты все ближе к потолку Самокаты все ближе к потолку

Рынок кикшеринга вырастет в 1,7 раза к 2027 г

Ведомости
Секаторы на пенсию: топ-5 аккумуляторных кусторезов 2025 года Секаторы на пенсию: топ-5 аккумуляторных кусторезов 2025 года

Как выбрать аккумуляторный кусторез для сада?

CHIP
Вступление в брак может повысить риск деменции: шокирующие выводы ученых Вступление в брак может повысить риск деменции: шокирующие выводы ученых

Как счастливая семейная жизнь может быть связана с когнитивными способностями?

ТехИнсайдер
Как выбрать мойку высокого давления: основные характеристики Как выбрать мойку высокого давления: основные характеристики

Список критериев, по которым стоит выбирать мойку высокого давления

CHIP
Угольщикам недогрузили триллионы Угольщикам недогрузили триллионы

Минэнерго оценило потери российской угольной отрасли в 2 трлн руб

Ведомости
Липецк: за рулем и пешком Липецк: за рулем и пешком

Как в Липецкой области мастера восстанавливают связь между прошлым и настоящим

Вокруг света
В абитуриенте ценят личность В абитуриенте ценят личность

Как увеличится роль индивидуальных достижений при поступлении в вузы

Ведомости
Какие были парфюмы в Древней Греции? Узнайте интересные факты! Какие были парфюмы в Древней Греции? Узнайте интересные факты!

Мир ароматов в Древней Греции был куда богаче, чем может показаться

ТехИнсайдер
Гости из настоящего и будущего Гости из настоящего и будущего

Столичная туриндустрия укрепляет свои позиции как драйвера развития Москвы

Ведомости
Охота на пиратов Охота на пиратов

Как спортивные каналы и лиги борются с пиратами

Ведомости
Эхо прошедшей войны Эхо прошедшей войны

Это после Великой Отечественной они стали народными актерами, но на фронте...

Коллекция. Караван историй
Территория детства Территория детства

7 особенностей дизайна, которые точно понравятся твоему ребенку

Лиза
Открыть в приложении