Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От «Больницы Питт» до «Терапии»: 8 лучших новых медицинских сериалов От «Больницы Питт» до «Терапии»: 8 лучших новых медицинских сериалов

Медицинские драмы переживают новую волну популярности! А вот их подборка

Forbes
Страшное бессилие Страшное бессилие

«Раневская»: попытка биографии

Weekend
Маргарет Этвуд и Миучча Прада: женщины, которые вошли в рейтинг 50 Over 50 Forbes USA Маргарет Этвуд и Миучча Прада: женщины, которые вошли в рейтинг 50 Over 50 Forbes USA

Некоторые из тех, кто доказывает, что возраст — не помеха достижениям

Forbes
Как вьетнамский беженец Дэвид Тран стал миллиардером благодаря острому соусу Как вьетнамский беженец Дэвид Тран стал миллиардером благодаря острому соусу

Как Дэвид Тран превратил производство соуса шрирача в многомиллиардный бизнес

Forbes
«Это ведь не считается!»: 3 неочевидных признака эмоциональной неверности, которые опасно игнорировать «Это ведь не считается!»: 3 неочевидных признака эмоциональной неверности, которые опасно игнорировать

Как понять, что вы вот-вот измените, пусть и не в стандартном понимании?

Psychologies
Диковинки на колесах: посмотрите на 10 самых редких автомобилей в мире Диковинки на колесах: посмотрите на 10 самых редких автомобилей в мире

Некоторые из этих автомобилей существуют в единственном экземпляре

Вокруг света
Что известно о Софье Егоровой – ведьме и новой жене рэпера Фараона Что известно о Софье Егоровой – ведьме и новой жене рэпера Фараона

Рассказываем, что известно о девушке рэпера Фараона

VOICE
«Любовь — это чувство, которое дается не всем» «Любовь — это чувство, которое дается не всем»

Владимир Кошевой всегда знал, что будет актером, что ему нужно на сцену

OK!
Полуостров вулканов Полуостров вулканов

Камчатка — самая вулканически активная зона планеты

Вокруг света
Жители США буквально живут в «декорациях» фильма. Но это угрожает их здоровью и экологии Жители США буквально живут в «декорациях» фильма. Но это угрожает их здоровью и экологии

Фильм-катастрофа в штате Огайо неожиданно стал реальностью

ТехИнсайдер
В Польше нашли покрытое дегтем составное орудие возрастом десять тысяч лет В Польше нашли покрытое дегтем составное орудие возрастом десять тысяч лет

Археологи представили результаты исследования составного орудия эпохи мезолита

N+1
Основатели холдинга Lucky Group — об успешных и проблемных ресторанах Основатели холдинга Lucky Group — об успешных и проблемных ресторанах

Основатели компании Lucky Group — что делать, чтобы ваш ресторан был успешным

РБК
Паркуем деньги Паркуем деньги

Стоит ли инвестировать в покупку машиномест

Деньги
Не могу сказать «прости» Не могу сказать «прости»

Как правильно просить прощения?

Лиза
Какой вид спорта выбрать, если куришь: объясняет врач Какой вид спорта выбрать, если куришь: объясняет врач

Насколько здоровье курильщиков позволяет им заниматься спортом и какой лучше?

Maxim
Ирина Шевчук: «Судьба нам подарила фильм «...А зори здесь тихие» Ирина Шевчук: «Судьба нам подарила фильм «...А зори здесь тихие»

Ко мне подошла женщина и спросила: «Риточка, скажите, а как ваш сын сейчас?»

Караван историй
Новый вид “американского морского черта” заметили в Атлантике. Рыба с Новый вид “американского морского черта” заметили в Атлантике. Рыба с

Неизвестный представитель и без того непростого вида рыб

ТехИнсайдер
Восемь шагов к здоровью и долголетию Восемь шагов к здоровью и долголетию

Восемь простых правил здоровой жизни

Здоровье
Что надо знать о ламбруско — самом недооцененном вине современности Что надо знать о ламбруско — самом недооцененном вине современности

Почему ламбруско любят в России и США и чем оно отличается от других игристых

СНОБ
Открытие Милы Открытие Милы

Мила Ершова поделилась, почему она любит «социальные» роли

Grazia
Чистая монета Чистая монета

Что если инвестировать в деньги? Хорошая идея, если речь о коллекционных монетах

Robb Report
«Я уже не маленький»: как отношения с родителями мешают нам быть уверенными «Я уже не маленький»: как отношения с родителями мешают нам быть уверенными

Как справиться с беззащитностью в себе и найти ресурсы действовать как взрослый?

Psychologies
Почему так трудно с тем, кто не любит себя: самоценность и отношения в паре Почему так трудно с тем, кто не любит себя: самоценность и отношения в паре

Как быть, если у одного из партнеров низкая самооценка?

Psychologies
Трудности переводов Трудности переводов

Как россиянам за границей получить доступ к своим средствам

Деньги
Как стать поддержкой для самого себя. 7 инсайтов из книги «Внутренняя опора» Как стать поддержкой для самого себя. 7 инсайтов из книги «Внутренняя опора»

Опираясь на самого себя, вы обретаете силу, которую не одолеть никому

Psychologies
Волшебник и малышка: как люди выгорают из-за несоответствия своих субличностей Волшебник и малышка: как люди выгорают из-за несоответствия своих субличностей

Отрывок из книги Леонида Кроля «Жизнь без выгорания»

Forbes
О чем говорят мужчины: откровенная беседа читателей о любви — 5 историй О чем говорят мужчины: откровенная беседа читателей о любви — 5 историй

Пять мужчин — о встречах, расставаниях, изменах, романах и о любви

Psychologies
Аутизм: путь к социуму Аутизм: путь к социуму

Что такое аутизм и чем "дети дождя" отличаются от остальных?

ТехИнсайдер
Как визуально увеличить маленькую комнату, чтобы она казалась больше: 10 дизайнерских решений Как визуально увеличить маленькую комнату, чтобы она казалась больше: 10 дизайнерских решений

Несколько дизайнерских решений, которые помогут визуально увеличить пространство

ТехИнсайдер
Сонный паралич: болезнь, знак ведьмы или вариант нормы Сонный паралич: болезнь, знак ведьмы или вариант нормы

Сонный паралич: страшное, но достаточно безобидное явление

ТехИнсайдер
Открыть в приложении