Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мухи с котлетами: почему третий бак не решит проблему переработки пищевых отходов Мухи с котлетами: почему третий бак не решит проблему переработки пищевых отходов

Почему отдельный бак для пищевых отходов не избавит страну от выброшенной еды?

Forbes
«Печать ведет себя все хуже»: как в Российской империи и СССР цензурировали СМИ «Печать ведет себя все хуже»: как в Российской империи и СССР цензурировали СМИ

Рассказываем о становлении и развитии цензуры в прессе и публицистике

Forbes
Проблема поколения? Исследование: молодежь на работе страдает из-за одиночества и недооцененности Проблема поколения? Исследование: молодежь на работе страдает из-за одиночества и недооцененности

Почему молодые работники испытывают чувство одиночества на работе?

ТехИнсайдер
Вячеслав Малафеев: «Бывает, что перебарщиваю, но вообще я не буйный!» Вячеслав Малафеев: «Бывает, что перебарщиваю, но вообще я не буйный!»

Легендарный вратарь Вячеслав Малафеев — об отдыхе, семье и работе

Maxim
Как увеличить член: 12 способов в домашних условиях и у специалиста Как увеличить член: 12 способов в домашних условиях и у специалиста

Как увеличить размер члена и действительно ли тебе это нужно?

Playboy
Мордвинова уехала в США, Сагалова родила троих детей: что стало со звездами сериалов нулевых Мордвинова уехала в США, Сагалова родила троих детей: что стало со звездами сериалов нулевых

Что стало с кумирами прошлого?

VOICE
Тест-драйв Haval Dargo-X: а сразу так нельзя было? Тест-драйв Haval Dargo-X: а сразу так нельзя было?

Haval Dargo-X: какой получилась спецверсия кроссовера?

ТехИнсайдер
Идеальный дом Идеальный дом

Большая семья, цвет айвори, семейный уют, стиль Ralph Lauren и кружка кофе

SALON-Interior
Гуманная педагогика 2.0 | Humane Pedagogy 2.0 Гуманная педагогика 2.0 | Humane Pedagogy 2.0

Педагогика: от идей Антона Макаренко до Людмилы Петрановской и Димы Зицера

Позитивные изменения
Золотые реки цвета какао Золотые реки цвета какао

Репортаж из Бодайбо. Как живут люди, добывающие золото

Эксперт
Драма в бетоне: московские новостройки уже не по карману покупателям Драма в бетоне: московские новостройки уже не по карману покупателям

На спросе новостроек сильно сказалось изменение условий «ипотеки от застройщика»

Forbes
Стресс-код: 5 способов быстро расслабиться Стресс-код: 5 способов быстро расслабиться

Техники, которые помогут моментально успокоиться

VOICE
Зачем составляют карты распределения материи по Вселенной? Отвечает астроном Зачем составляют карты распределения материи по Вселенной? Отвечает астроном

Когда-нибудь мы поймаем этот неуловимый нейтрино

Вокруг света
Любовь по расчёту Любовь по расчёту

Инвестиции в искусство — одна из возможностей диверсифицировать свой портфель

Robb Report
Чипсы, пожарские котлеты и даже оливье: 9 продуктов, которые появились в нашей жизни по ошибке Чипсы, пожарские котлеты и даже оливье: 9 продуктов, которые появились в нашей жизни по ошибке

Мы могли бы и не узнать вкус этих любимых нами продуктов

VOICE
Как выглядели пирамиды Гизы на момент постройки: драгоценные камни Египта Как выглядели пирамиды Гизы на момент постройки: драгоценные камни Египта

На момент постройки пирамиды Гизы были покрыты блестящей осадочной породой

ТехИнсайдер
Как бросить курить? Поможет Как бросить курить? Поможет

Может ли новое умное устройство одежды помочь бросить курить?

ТехИнсайдер
Как женщины сталкиваются с сексуализированным насилием в больницах Как женщины сталкиваются с сексуализированным насилием в больницах

Почему в месте, где люди должны чувствовать себя безопасно, присутствует насилие

Forbes
Почему измена — лучший способ разрушить жизнь: 9 негативных последствий Почему измена — лучший способ разрушить жизнь: 9 негативных последствий

Почему измена обязательно станет катастрофой

Psychologies
Биполярное расстройство: из крайности в крайность Биполярное расстройство: из крайности в крайность

Насколько серьезно биполярное расстройство и чем оно опасно для человека?

ТехИнсайдер
Обратный отсчет Обратный отсчет

Витамины и минералы anti-age для женщин 45+, которые помогают не стареть

Добрые советы
Сериал «Раневская»: как Фаина Фельдман стала великой актрисой вопреки всем преградам Сериал «Раневская»: как Фаина Фельдман стала великой актрисой вопреки всем преградам

Какой сложный путь к славе проделала Фаина Раневская

Forbes
Как подключить тюльпаны к телевизору Как подключить тюльпаны к телевизору

Многие пользователи теряются, когда нужно подключить к телевизору тюльпаны

CHIP
13 ложных признаков успешного человека 13 ложных признаков успешного человека

Люди обожают притворяться богатыми и счастливыми

Maxim
Супер-средство: как обычное растительное масло может помочь справиться со многими бытовыми проблемами Супер-средство: как обычное растительное масло может помочь справиться со многими бытовыми проблемами

10 гениальных лайфхаков для всего дома с использованием этого чудо-продукта

ТехИнсайдер
Разонравился! Разонравился!

Как вернуть в магазин товар без брака, если он просто разонравился

Лиза
Почему киты иногда взрываются после смерти? Почему киты иногда взрываются после смерти?

Что происходит с телом кита после того, как животное умирает?

ТехИнсайдер
Колесо эмоций Роберта Плутчика: как разобраться в себе — используйте простой инструмент Колесо эмоций Роберта Плутчика: как разобраться в себе — используйте простой инструмент

Рассказываем о простом инструменте, который помогает ориентироваться в эмоциях

Psychologies
На изящном: что восхищало современников Леонардо да Винчи в «Тайной вечере» На изящном: что восхищало современников Леонардо да Винчи в «Тайной вечере»

Поговорим о вечном — о "Тайной вечере" да Винчи

Правила жизни
Тебя обманули: эти звезды играли влюбленных в кино, но ненавидели друг друга в жизни Тебя обманули: эти звезды играли влюбленных в кино, но ненавидели друг друга в жизни

Оказывается, эти актеры за кадром терпеть друг друга не могли

VOICE
Открыть в приложении