Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Музыка против голода: как фестиваль Live Aid изменил благотворительность и культуру Музыка против голода: как фестиваль Live Aid изменил благотворительность и культуру

Как фестиваль Live Aid стал поворотной точкой для благотворительности в музыке

Forbes
7 остросюжетных сериалов, которые заставят задуматься о справедливости 7 остросюжетных сериалов, которые заставят задуматься о справедливости

Сериалы о том, существует ли карма и воздаяние на этой нелепой планете

Maxim
Пять качеств личности, которые приводят к успеху Пять качеств личности, которые приводят к успеху

Что помогает предпринимателю привлекать команду и выстраивать сильный бизнес?

Inc.
«Секс по расписанию изменил нашу жизнь»: личная история — попробуйте с партнером «Секс по расписанию изменил нашу жизнь»: личная история — попробуйте с партнером

История, как секс по расписанию может изменить отношения с партнером

Psychologies
Сколько нужно стоять в планке в зависимости от возраста Сколько нужно стоять в планке в зависимости от возраста

Ориентиры по возрасту для стояния в планке

Maxim
Моя оборона Моя оборона

У нас много вопросов к специалистам по кибербезопасности

Men Today
Новые Земли: есть ли во Вселенной планеты, на которые может переселиться человечество Новые Земли: есть ли во Вселенной планеты, на которые может переселиться человечество

Где искать планеты, намного больше подходящие для жизни, чем Земля?

ТехИнсайдер
Извержения древних вулканов помогли раскрыть то, как происходило Великое вымирание — самая жуткая катастрофа в истории Извержения древних вулканов помогли раскрыть то, как происходило Великое вымирание — самая жуткая катастрофа в истории

Южное полушарие Земли было покрыто обломками вулканических извержений

ТехИнсайдер
Как бросить курить? Поможет Как бросить курить? Поможет

Может ли новое умное устройство одежды помочь бросить курить?

ТехИнсайдер
Как бывший гендиректор «Мегафона» стал совладельцем крупнейших компаний Рунета Как бывший гендиректор «Мегафона» стал совладельцем крупнейших компаний Рунета

Как Иван Таврин стал акционером крупнейших компаний Рунета?

Forbes
Что такое Rivian R1S, как он едет и зачем нужен? Делимся впечатлениями Что такое Rivian R1S, как он едет и зачем нужен? Делимся впечатлениями

Поговорим о трёхрядном внедорожнике Rivian R1S

4x4 Club
«Санта-Клаус на каникулах»: история предпринимателя из Сиднея, который потерял все деньги и уехал жить на остров «Санта-Клаус на каникулах»: история предпринимателя из Сиднея, который потерял все деньги и уехал жить на остров

Бывший предприниматель проводит дни в компании двух манекенов на острове

VC.RU
Вам письмо: как компании увольняют сотрудников по электронной почте Вам письмо: как компании увольняют сотрудников по электронной почте

Добро пожаловать в эпоху цифровых уведомлений об увольнении

Forbes
Исследование: ежедневное употребление двух или более чашек кофе при гипертонии может удвоить риск смерти Исследование: ежедневное употребление двух или более чашек кофе при гипертонии может удвоить риск смерти

Как связаны кофе и сердечно-сосудистые заболевания?

Inc.
Петербург Ивана Крылова: как Город на Неве отметил свой столетний юбилей и пережил череду невзгод Петербург Ивана Крылова: как Город на Неве отметил свой столетний юбилей и пережил череду невзгод

Торжества, устроенные Александром I, надолго запомнились петербуржцам

Вокруг света
«Мне стало легче». Истории людей, которые отомстили своим обидчикам и не жалеют об этом «Мне стало легче». Истории людей, которые отомстили своим обидчикам и не жалеют об этом

Наши герои пошли по пути мести и решили объяснить, почему они это сделали

Лиза
Королевство кривых зеркал Королевство кривых зеркал

Когда недовольство внешностью пора лечить

VOICE
Худшие национальные блюда всех времен и народов Худшие национальные блюда всех времен и народов

Путеводитель по миру гурманов обновил свой рейтинг самой несъедобной еды

Maxim
Будь проще Будь проще

Вкусная еда необязательно должна быть сложной в приготовлении

Добрые советы
Неправильная феминистка: как писательница Колетт пыталась придумать сильную героиню Неправильная феминистка: как писательница Колетт пыталась придумать сильную героиню

Отрывок из книги «Прощай, грусть!» — переосмысление французской классики

Forbes
«Любовь — это чувство, которое дается не всем» «Любовь — это чувство, которое дается не всем»

Владимир Кошевой всегда знал, что будет актером, что ему нужно на сцену

OK!
Кудрявый метод мытья и укладки волос: как и зачем его применять Кудрявый метод мытья и укладки волос: как и зачем его применять

Как правильно мыть, сушить, стричь и укладывать вьющиеся волосы?

РБК
Расставили нейросети: поработит ли нас искусственный интеллект Расставили нейросети: поработит ли нас искусственный интеллект

История взаимоотношений "человек — машина" с 1800-х по настоящее время

Правила жизни
В Ташкенте — жить: актуальный гид по самой гостеприимной столице Средней Азии В Ташкенте — жить: актуальный гид по самой гостеприимной столице Средней Азии

Рассказываем, как устроиться, что посмотреть, попробовать и купить в Ташкенте

Вокруг света
Достижения российских военных врачей, которые изменили мировую медицину Достижения российских военных врачей, которые изменили мировую медицину

Как военные врачи внесли серьезный вклад в развитие мировой медицины

Maxim
Архитектура Школы будущего | The Architecture of the School of the Future Архитектура Школы будущего | The Architecture of the School of the Future

Что должен учитывать архитектор, проектируя Школу будущего?

Позитивные изменения
Сергей Потоцкий: «Не признавать законности захвата власти большевиками» Сергей Потоцкий: «Не признавать законности захвата власти большевиками»

Среди российских военных агентов особое место занимал Сергей Николаевич Потоцкий

Дилетант
За что Ту-104 назвали самым опасным лайнером в мире За что Ту-104 назвали самым опасным лайнером в мире

Что не так с Ту-104?

ТехИнсайдер
Астрономы годами изучали 5000 сверхмассивных черных дыр, чтобы понять, почему те так странно мерцают Астрономы годами изучали 5000 сверхмассивных черных дыр, чтобы понять, почему те так странно мерцают

Ученые разгадали тайну необычного мерцания черных дыр во мраке космоса

ТехИнсайдер
Зачем в СССР делали гигантские «Антеи», «Русланы» и «Мрии» Зачем в СССР делали гигантские «Антеи», «Русланы» и «Мрии»

Кому нужна была такая мощь и почему сейчас про эти самолёты ничего не слышно?

ТехИнсайдер
Открыть в приложении