Как система KnowHalu помогает бороться с галлюцинацими

ТехИнсайдерHi-Tech

Разработан новый метод борьбы с галлюцинациями больших лингвистических моделей

Исследователи из Университета Иллинойса в Урбане-Шампейне представили систему для обнаружения галлюцинаций в тексте, генерируемом LLM. Система получила название KnowHalu

Владимир Губайловский

Галлюцинация LLM. DALLE-3

Галлюцинации становятся едва ли не главным препятствием в развитии больших лингвистических моделей. Человек хочет использовать модели, но он не может доверять.

Большие языковые модели (LLM) — это диалоговые системы на основе искусственного интеллекта, которые могут отвечать на запросы пользователей и генерировать убедительные тексты, следуя инструкциям пользователя (промптам). После появления ChatGPT, разработанной OpenAI, эти модели становятся все более популярными, и все больше компаний сейчас инвестируют в их разработку.

Но чем чаще люди используют LLM, тем большую ответственность они возлагают на модели. Если необходимо постоянно проверять ответы модели, она просто теряет смысл. Она не должна бы ошибаться, а она ошибается и так редко.

Ее ошибки получили название «галлюцинаций». Можно ли избавиться, если от всех то большинства таких ошибок, или хотя уверенно их диагностировать.

Исследователи из Университета Иллинойса в Урбане-Шампейне представили систему для обнаружения галлюцинаций в тексте, генерируемом LLM. Система получила название KnowHalu. Она описана в статье, опубликованной на сервере препринтов arXiv.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как появилась Вселенная? Ответ может скрываться в водах Байкала Как появилась Вселенная? Ответ может скрываться в водах Байкала

Ключ к разгадке сотворения Вселенной может находиться в глубинах Байкала

ТехИнсайдер
CRISPR-терапия показала безопасность и частичный эффект при дегенерации сетчатки CRISPR-терапия показала безопасность и частичный эффект при дегенерации сетчатки

Успех клинических испытаний CRISPR-терапии наследственной дегенерации сетчатки

N+1
Я, мы, робот: как андроиды проникли в наши дома и головы Я, мы, робот: как андроиды проникли в наши дома и головы

О том, как роботы медленно, но верно становятся частью нашей жизни

Forbes
Народ и роли Народ и роли

Как советское кино изображало народ

Weekend
Мозг, исцеляющий себя Мозг, исцеляющий себя

Реальные истории людей, которые победили болезни и преобразили свой мозг

kiozk originals
Итоги Канн-2024: почему фильм про сына русского олигарха «Анора» взял главный приз Итоги Канн-2024: почему фильм про сына русского олигарха «Анора» взял главный приз

Почему жюри во главе с Гервиг мог понравиться фильм Бэйкера

Forbes
Девять технологий, которые не оправдали надежд Девять технологий, которые не оправдали надежд

Могли ли эти технологии перевернуть мир или на них возложили напрасные ожидания?

Монокль
Новые улики: как тру-крайм-сериалы и подкасты помогают в реальных расследованиях Новые улики: как тру-крайм-сериалы и подкасты помогают в реальных расследованиях

Тру-крайм проекты, которые помогли сдвинуть расследования с мертвых точек

Forbes
Полезно ли делать «зарядку для глаз» Полезно ли делать «зарядку для глаз»

«Зарядка для глаз» — звучит полезно, но есть ли от неё реальная польза?

ТехИнсайдер
Символ эпохи: как Одри Хепберн меняла Голливуд и боролась с несправедливостью Символ эпохи: как Одри Хепберн меняла Голливуд и боролась с несправедливостью

Как Одри Хепберн пыталась изменить мир к лучшему?

Forbes
Человек с большой цифры Человек с большой цифры

Как технологии лишают нас сна, памяти, эмпатии и отучают знакомиться

Men Today
Иран: линия прежняя, обстоятельства жестче Иран: линия прежняя, обстоятельства жестче

Почему вокруг смерти президента Ирана Эбрахима Раиси так много конспирологии?

Монокль
Социальное такси: кому положено и как им пользоваться Социальное такси: кому положено и как им пользоваться

Все о социальном такси: кто может пользоваться, какие условия, как вызвать

РБК
Чем накормить гения Чем накормить гения

Как помочь нашим детям хорошо сдать экзамены?

Лиза
Машина для большой семьи, которая вызывает ностальгию: обзор кросс-вэна Suzuki Ertiga Машина для большой семьи, которая вызывает ностальгию: обзор кросс-вэна Suzuki Ertiga

Олдскульный семиместный кросс-вэн Suzuki Ertiga

ТехИнсайдер
Зачем люди сидят на диете из мяса и зелени? Интересные факты о питании: стоит узнать! Зачем люди сидят на диете из мяса и зелени? Интересные факты о питании: стоит узнать!

Как комбинирование мяса с зеленью может помочь регулировать уровень сахара

ТехИнсайдер
Пэтфуд как бизнес Пэтфуд как бизнес

Как идет импортозамещение на рынке кормов для непродуктивных домашних животных

Агроинвестор
Генетики пересчитали время смешения предков современных людей и неандертальцев Генетики пересчитали время смешения предков современных людей и неандертальцев

Когда произошло смешение предков современных людей с неандертальцами?

N+1
Бум внутри периметра: можно ли удвоить долю фондового рынка в российской экономике Бум внутри периметра: можно ли удвоить долю фондового рынка в российской экономике

Быстрый рост фондового рынка возможен, считает главный экономист «Эксперта РА»

Forbes
Как сохранять концентрацию: 3 рабочие стратегии Как сохранять концентрацию: 3 рабочие стратегии

Как управлять вниманием и учиться держать фокус в рабочее время и не только?

Psychologies
Защити свою энергию Защити свою энергию

Как распознать энергетических вампиров среди своего окружения

Лиза
Египетская сила Египетская сила

Как британцы пустили 180 тысяч кошачьих мумий на удобрение

N+1
Когда пить кофе: 7 вопросов о бодрящем напитке Когда пить кофе: 7 вопросов о бодрящем напитке

Что нужно знать, чтобы пить правильный кофе?

Psychologies
Настоящее и будущее веб-технологий в цифрах и фактах Настоящее и будущее веб-технологий в цифрах и фактах

Какие цифры описывают Всемирную паутину?

РБК
Почему некоторые кабриолеты называют спайдерами и при чем тут пауки Почему некоторые кабриолеты называют спайдерами и при чем тут пауки

Слово Spider кажется совершенно неуместным, когда речь заходит об автомобилях

Maxim
Эксперимент Таскиги: одна из самых жестоких медицинских программ в истории человечества Эксперимент Таскиги: одна из самых жестоких медицинских программ в истории человечества

Проект Таскиги стал одним из самых жестоких случаев медицинского расизма

ТехИнсайдер
Почему мы любим делать несколько дел сразу: пример «обеда за просмотром кино» Почему мы любим делать несколько дел сразу: пример «обеда за просмотром кино»

Есть, отвлекаясь на сериал, — один из самых простых способов переесть

ТехИнсайдер
Альбина Мухаметзянова: «Моя жизнь трансформировалась благодаря «ЯРКО»!» Альбина Мухаметзянова: «Моя жизнь трансформировалась благодаря «ЯРКО»!»

«У нас не было времени долго раскачиваться — мы заходили в сформированный рынок»

Караван историй
Эмоциональная анестезия: как перестать выбирать холодных партнеров Эмоциональная анестезия: как перестать выбирать холодных партнеров

Что такое «химия» отвержения и эмоциональной депривации? Как она работает?

Psychologies
Что такое «Пифагоровы штаны» и как египтяне строили пирамиды: 6 вопросов о геометрии, которые мучили вас со школы Что такое «Пифагоровы штаны» и как египтяне строили пирамиды: 6 вопросов о геометрии, которые мучили вас со школы

Об удивительных примерах использования геометрических знаний

ТехИнсайдер
Открыть в приложении