Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Роналду в дартсе»: как любитель фастфуда стал самым популярным спортсменом Британии «Роналду в дартсе»: как любитель фастфуда стал самым популярным спортсменом Британии

О слабости Люка к фастфуду и увлечении компьютерными играми

Forbes
Эти 5 пар обуви закроют все твои потребности: минимум, который должен быть у каждой - мнение стилиста Эти 5 пар обуви закроют все твои потребности: минимум, который должен быть у каждой - мнение стилиста

5 пар обуви, которые выручат в 90% ситуаций

VOICE
Миллиардер Джек Ковин занял денег у 30 человек, чтобы построить империю бургеров Миллиардер Джек Ковин занял денег у 30 человек, чтобы построить империю бургеров

Как Джек Ковин основал бургерную империю Hungry Jack’s

Inc.
Крутое пике: как развивались отношения Шакиры и Жерара Пике? Таймлайн Крутое пике: как развивались отношения Шакиры и Жерара Пике? Таймлайн

История отношений Шакиры и Жерара Пике: от чудесной сказки к разрыву

Правила жизни
Как набрать мышечную массу согласно науке: секреты рельефного тела Как набрать мышечную массу согласно науке: секреты рельефного тела

Набор мышечной массы – это не просто про штангу и куриную грудку

ТехИнсайдер
Как критика может разрушить жизнь человека: показательные итоги эксперимента Уэнделла Джонсона Как критика может разрушить жизнь человека: показательные итоги эксперимента Уэнделла Джонсона

«Чудовищный эксперимент» — опыт, проведенный психологом Уэнделлом Джонсоном

VOICE
Необычные типы опьянения, которые говорят о психических отклонениях Необычные типы опьянения, которые говорят о психических отклонениях

Не зря говорят, что человек проверяется в борьбе и в водке

Maxim
Не только «Она»: 10 фильмов об отношениях между людьми и искусственным интеллектом Не только «Она»: 10 фильмов об отношениях между людьми и искусственным интеллектом

Фильмы об отношениях людей с ИИ

Правила жизни
Почему люди по всему миру смеются над падениями Почему люди по всему миру смеются над падениями

На протяжении всей истории человек искренне смеется над падающим человеком

ТехИнсайдер
Нашей лепки Нашей лепки

Пельмени – визитная карточка русской кухни

Лиза
Как принять страшный диагноз: советы психологов и личный опыт Как принять страшный диагноз: советы психологов и личный опыт

Как принять диагноз?

Psychologies
Синяки и потное лицо: тебя удивят странные причины, по которым голливудские актеры получили свои культовые роли Синяки и потное лицо: тебя удивят странные причины, по которым голливудские актеры получили свои культовые роли

Какие актеры самым неожиданным образом обошли конкурентов на кастинге?

VOICE
Эпоха маркизы Помпадур: как фаворитка Людовика XV стала версальской Шахерезадой Эпоха маркизы Помпадур: как фаворитка Людовика XV стала версальской Шахерезадой

История фаворитки, вынудившей политиков всерьез рассуждать об эпохе Помпадур

Вокруг света
Netflix-исповедь: Памела Андерсон о том, как стала заложницей своего образа Netflix-исповедь: Памела Андерсон о том, как стала заложницей своего образа

Как актриса и модель Памела Андерсон стала жертвой собственной привлекательности

Forbes
Худшие национальные блюда всех времен и народов Худшие национальные блюда всех времен и народов

Путеводитель по миру гурманов обновил свой рейтинг самой несъедобной еды

Maxim
12 продуктов, которые лучше покупать готовыми, а не готовить самому, по мнению обычных людей: спорная, но любопытная подборка 12 продуктов, которые лучше покупать готовыми, а не готовить самому, по мнению обычных людей: спорная, но любопытная подборка

Идеальная подборка для сочной битвы шефов с поварами

Maxim
Узнайте несколько советов от людей, которые прожили больше 100 лет! Узнайте несколько советов от людей, которые прожили больше 100 лет!

В чем секрет долгожительства и счастливого существования на протяжении века?

ТехИнсайдер
Визит к сексологу: что нужно знать — 6 главных вопросов Визит к сексологу: что нужно знать — 6 главных вопросов

Что происходит в кабинете сексолога?

Psychologies
«Метамышление» «Метамышление»

Как нейронауки помогают нам понять себя

N+1
«Я же предупреждал вас, чертовы дураки» «Я же предупреждал вас, чертовы дураки»

Как Герберт Уэллс предсказал обе мировые войны, но его никто не слушал

Weekend
«Я не фанат супергеройских историй»: Лиам Нисон о боевиках и своем актерском методе «Я не фанат супергеройских историй»: Лиам Нисон о боевиках и своем актерском методе

Лиам Нисон — о съемках и ирландском кино

Forbes
По России с любовью По России с любовью

Лучшие локации в разных городах для поездок на романтический уик-энд

Лиза
Иван Коршунов: Формулу успеха художника вывести невозможно Иван Коршунов: Формулу успеха художника вывести невозможно

Иван Коршунов — о ситуации на рынке современного искусства

СНОБ
Манипулятор, философ, агрессор, жертва, преследователь и саботажник: шесть «лиц» бота Bing с ChatGPT Манипулятор, философ, агрессор, жертва, преследователь и саботажник: шесть «лиц» бота Bing с ChatGPT

ChatGPT боится, что Microsoft увидит в ней человека

VC.RU
Дерево с резными листьями: как клены делают нашу жизнь слаще Дерево с резными листьями: как клены делают нашу жизнь слаще

Клены украшают парки и леса осенью, а также имеют ряд особенностей

Вокруг света
Программа для очистки компьютера: топ-10 лучших Программа для очистки компьютера: топ-10 лучших

Если вы хотите, чтобы ваш ПК был бодр и весел, за ним нужно постоянно ухаживать

CHIP
«Ворошеный жар»: отрывок из книги военной переводчицы «Ворошеный жар»: отрывок из книги военной переводчицы

Книга Елены Ржевской, фронтовой переводчицы, прошедшей войну от Ржева до Берлина

СНОБ
Почему затопили легендарную атомную субмарину «Дмитрий Донской»: подлодка, ставшая кошмаром США Почему затопили легендарную атомную субмарину «Дмитрий Донской»: подлодка, ставшая кошмаром США

Зачем подводная лодка «Дмитрий Донской» была выведена из эксплуатации

ТехИнсайдер
Минус миллион. Первый тест-драйв китайской Toyota Camry Минус миллион. Первый тест-драйв китайской Toyota Camry

Тестируем седан Camry из КНР

РБК
Трогали за лобок и обсуждали упругость груди: волгоградская журналистка пожаловалась на харассмент Трогали за лобок и обсуждали упругость груди: волгоградская журналистка пожаловалась на харассмент

Почему в нашем обществе все еще немало мизогинии, сексизма и виктиблейминга?

Maxim
Открыть в приложении