Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Жена айтишника»: с чем сталкиваются женщины, которые эмигрируют из-за работы мужа «Жена айтишника»: с чем сталкиваются женщины, которые эмигрируют из-за работы мужа

Как повышение близкого человека может стать источником проблем

Forbes
Как кофеин влияет на сон Как кофеин влияет на сон

Что будет, если выпить кофе перед сном?

ТехИнсайдер
Сложный стартап и звездный статус: почему Селены Гомес пока нет в списке миллиардеров Сложный стартап и звездный статус: почему Селены Гомес пока нет в списке миллиардеров

Бизнес-портфель Селены Гомес, главные активы и точки роста

Forbes
Мальчик, который выше: как Гарри Стайлс плюет на стереотипы и меняет мужской гардероб Мальчик, который выше: как Гарри Стайлс плюет на стереотипы и меняет мужской гардероб

Рассказываем и показываем, с помощью чего Стайлс творит революцию в мужской моде

Правила жизни
Отец телевидения Владимир Зворыкин: история изобретения, изменившего мир Отец телевидения Владимир Зворыкин: история изобретения, изменившего мир

Почему отец телевидения Владимир Зворыкин возненавидел свое творение

ТехИнсайдер
Война за Аляску Война за Аляску

Как проходило освоение Россией Аляски

Дилетант
«Просвещение может нам помочь»: биолог Александр Панчин о будущем научпопа в России «Просвещение может нам помочь»: биолог Александр Панчин о будущем научпопа в России

Александр Панчин рассказывает, что сейчас происходит с научпопом в России

Forbes
Синдром «героя реалити-шоу»: как снимаются программы о преображении — рассказ продюсера Синдром «героя реалити-шоу»: как снимаются программы о преображении — рассказ продюсера

Продюсер рассказывает о закулисье реалити-шоу о преображениях

Psychologies
Мал да удал: как выглядят актеры-карлики, которые покорили Голливуд Мал да удал: как выглядят актеры-карлики, которые покорили Голливуд

Наши герои не вышли ростом, но это не помешало им сделать карьеру

VOICE
Что делать при землетрясении: ответы на 5 самых важных вопросов Что делать при землетрясении: ответы на 5 самых важных вопросов

Нужно ли стоять в дверном проеме или выбегать из здания при землетрясении?

Maxim
Как пережить смерть родителей в любом возрасте: 5 шагов, чтобы помочь себе, — советы психиатра Как пережить смерть родителей в любом возрасте: 5 шагов, чтобы помочь себе, — советы психиатра

Сколько бы лет нам ни было, смерть отца или матери всегда причиняет сильную боль

Psychologies
Как связаны энергетики и лечение синдрома поликистозных яичников Как связаны энергетики и лечение синдрома поликистозных яичников

Могут ли энергетики помочь справиться с поликистозом яичников?

СНОБ
«Диван, чемодан, саквояж...» Что можно провозить в ручной клади и какие вещи нельзя брать с собой в самолетан, чемодан, саквояж... «Диван, чемодан, саквояж...» Что можно провозить в ручной клади и какие вещи нельзя брать с собой в самолетан, чемодан, саквояж...

Что можно и что нельзя перевозить в ручной клади в самолете

ТехИнсайдер
Шизофрения: спастись от расщепления Шизофрения: спастись от расщепления

Согласно статистике, на планете 0,5% людей страдают шизофренией

ТехИнсайдер
Золотой запас: эти продукты лучше покупать замороженными и всегда держать в холодильнике Золотой запас: эти продукты лучше покупать замороженными и всегда держать в холодильнике

Кое-что гораздо надежнее сразу покупать в заморозке и всегда держать про запас

VOICE
От неудачных переговоров до гибели «Варяга» и «Петропавловска»: как началась война, которую в России никто не понимал От неудачных переговоров до гибели «Варяга» и «Петропавловска»: как началась война, которую в России никто не понимал

Война, которая не принесла России ни одной победы и породила революцию 1905 года

Вокруг света
10 фильмов, после которых захочется бросить все и отправиться навстречу приключениям 10 фильмов, после которых захочется бросить все и отправиться навстречу приключениям

После просмотра этих фильмов вам захочется отправиться в путешествие

Правила жизни
Страшно интересно: пять мест с мистической атмосферой в России Страшно интересно: пять мест с мистической атмосферой в России

Предлагаем пять мест, пользующихся дурной славой, где можно пощекотать нервы

Караван историй
Классика для молодёжи Классика для молодёжи

Комфортный современный интерьер на классической основе для молодых людей

SALON-Interior
Стечение обстоятельств: что не так с приговором Сергею Фургалу Стечение обстоятельств: что не так с приговором Сергею Фургалу

К хронологии действий следствия по делу Фургала есть серьезные вопросы

Forbes
Как говорить с партнером о сексе Как говорить с партнером о сексе

Как нужно говорить с партнером о своих желаниях и страхах в сексе

СНОБ
4 важных детали в 5 серии «Одни из нас», которые ты, скорее всего, пропустил 4 важных детали в 5 серии «Одни из нас», которые ты, скорее всего, пропустил

Такие мелочи в сериале «Одни из нас» мог заметить только фанат оригинальной игры

Maxim
Расшифрованы 57 неизвестных писем Марии Стюарт Расшифрованы 57 неизвестных писем Марии Стюарт

Криптоаналитики обнаружили зашифрованные письма Марии Стюарт

ТехИнсайдер
В гуще псевдособытий В гуще псевдособытий

Как мокьюментари превращается в мокьюреалити

Weekend
Успеть до весны: 5 процедур, которые стоит сделать прямо сейчас Успеть до весны: 5 процедур, которые стоит сделать прямо сейчас

Специалисты считают зиму лучшим периодом для активных омолаживающих процедур

Правила жизни
Азы Таро: что нужно знать, чтобы твоя колода не пылилась на полке Азы Таро: что нужно знать, чтобы твоя колода не пылилась на полке

Что нужно знать, чтобы прибегать к помощи карт самостоятельно

VOICE
«Метазоа: Зарождение разума в животном мире» «Метазоа: Зарождение разума в животном мире»

Что морские создания могут рассказать об эволюции человека

N+1
Закат Хаттусы Закат Хаттусы

Почему могущественные хетты покинули свою столицу

N+1
Школы в России и за рубежом | Schools in Russia and Abroad Школы в России и за рубежом | Schools in Russia and Abroad

В чем отличие подходов к обучению в российских и зарубежных школах?

Позитивные изменения
Почему у мужчин есть проблемы с эрекцией во время секса? Простое объяснение Почему у мужчин есть проблемы с эрекцией во время секса? Простое объяснение

Почему возникают проблемы с эрекцией и как с ними справиться?

ТехИнсайдер
Открыть в приложении