Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Ностальгический вайб: какие звезды из 1990-х переживают новую волну популярности Ностальгический вайб: какие звезды из 1990-х переживают новую волну популярности

Почему артисты, дебютировавшие около 30 лет назад, снова становятся хедлайнерами

Forbes
Фэн-шуй кухни для богатства и удачи: что делать, чтобы привлечь изобилие Фэн-шуй кухни для богатства и удачи: что делать, чтобы привлечь изобилие

Что нужно сделать, чтобы сердце твоего дома билось ритмичнее

VOICE
«Клиенты из Москвы смотрели на нас с недоверием». Как региональному бизнесу пробиться на глобальный рынок: опыт IT-компании из Воронежа «Клиенты из Москвы смотрели на нас с недоверием». Как региональному бизнесу пробиться на глобальный рынок: опыт IT-компании из Воронежа

Почему ключевой актив — не локация, а стратегия бизнеса?

Inc.
«Просвещение может нам помочь»: биолог Александр Панчин о будущем научпопа в России «Просвещение может нам помочь»: биолог Александр Панчин о будущем научпопа в России

Александр Панчин рассказывает, что сейчас происходит с научпопом в России

Forbes
От Чувака до Гарфилда: 13 киногероев, которые сделали лень культовой От Чувака до Гарфилда: 13 киногероев, которые сделали лень культовой

Киногерои, чье бездействие стало зеркалом тревог и надежд целых поколений

Правила жизни
Все по парам! Все по парам!

Осваиваем Foodpairing – искусство составления продуктовых пар

Здоровье
Сонный паралич: болезнь, знак ведьмы или вариант нормы Сонный паралич: болезнь, знак ведьмы или вариант нормы

Сонный паралич: страшное, но достаточно безобидное явление

ТехИнсайдер
«Песочницы» социальных инвестиций | «Sandboxes» for Social Investments «Песочницы» социальных инвестиций | «Sandboxes» for Social Investments

Как в мире развиваются проекты Social Impact Bonds

Позитивные изменения
Эротический массаж Эротический массаж

Техники и советы, которые помогут получить удовольствие вдвоем

Лиза
Свободная касса Свободная касса

Как стать фрилансером и не жалеть об этом каждый месяц

VOICE
Слишком мечтательная феминистка: как Незихе Мухиддин боролась за равноправие в Турции Слишком мечтательная феминистка: как Незихе Мухиддин боролась за равноправие в Турции

Вспоминаем историю феминистки Незихе Мухиддин

Forbes
Настоящий Декстер: история бразильского убийцы Педро Родригеса Фильо, который охотился на маньяков Настоящий Декстер: история бразильского убийцы Педро Родригеса Фильо, который охотился на маньяков

Маньяк, ставший прототипом Моргана Декстера из романов писателя Джеффа Линдсея

VOICE
История обручального кольца Мэрилин Монро — самого загадочного украшения Голливуда История обручального кольца Мэрилин Монро — самого загадочного украшения Голливуда

Благодаря ей все девушки запомнили, что их лучшие друзья — бриллианты

Правила жизни
За что Ту-104 назвали самым опасным лайнером в мире За что Ту-104 назвали самым опасным лайнером в мире

Что не так с Ту-104?

ТехИнсайдер
Проект «Тукдам»: как изучают тибетских монахов, тела которых остаются нетленными после смерти Проект «Тукдам»: как изучают тибетских монахов, тела которых остаются нетленными после смерти

Тела некоторых тибетских монахов остаются «нетленными» после смерти

ТехИнсайдер
Ставки эпохи возрождения Ставки эпохи возрождения

Что ожидает рынки акций после рекордных провалов

Деньги
Сколько пользы я приношу сейчас миру? И расту ли я сам? — Два критерия вашего импакта в карьере | How am i improving the world right now? am i improving myself? — The two criteria of impact in your career Сколько пользы я приношу сейчас миру? И расту ли я сам? — Два критерия вашего импакта в карьере | How am i improving the world right now? am i improving myself? — The two criteria of impact in your career

Импакт — один из трендов карьеры 2022 года

Позитивные изменения
Когда связи рвутся Когда связи рвутся

Как помочь ребенку пережить развод родителей?

Лиза
Из семьи крестьян на мировую сцену: 150 лет назад родился певец Федор Шаляпин Из семьи крестьян на мировую сцену: 150 лет назад родился певец Федор Шаляпин

Почему Федор Шаляпин не смог вернуться в страну после зарубежного тура

СНОБ
Записки отельера: бабушка уходит в отрыв Записки отельера: бабушка уходит в отрыв

Историю пожилой гостьи, которая решила кутить наполную

Правила жизни
Ледники на Северном и Южном полюсах Земли растаят гораздо раньше, чем предсказывали ученые Ледники на Северном и Южном полюсах Земли растаят гораздо раньше, чем предсказывали ученые

Ледяные щиты Гренландии и Антарктиды ждет необратимый распад

ТехИнсайдер
«Только когда я сам превратился в букашку, я понял, почему разглядывал природу» «Только когда я сам превратился в букашку, я понял, почему разглядывал природу»

Михаил Пришвин о людях, зверях и обществе

Weekend
Открытие Милы Открытие Милы

Мила Ершова поделилась, почему она любит «социальные» роли

Grazia
Материнство по выбору: женщины, боровшиеся за право на контрацепцию Материнство по выбору: женщины, боровшиеся за право на контрацепцию

Рассказываем о секс-просветительницах, которых даже тюрьма не останавливала

Forbes
Айфон выключился и не включается: как решить проблему Айфон выключился и не включается: как решить проблему

Почему айфон может внезапно выключиться и что с этим сделать?

CHIP
Ода тягости Ода тягости

«Больше чем никогда»: зачем нужны слезоточивые фильмы об умирающих

Weekend
Из лондонского политолога — в российского повара: откровенная история о поиске себя Из лондонского политолога — в российского повара: откровенная история о поиске себя

Вдохновляющая история от нашей героини, как изменить свою профессиональную жизнь

Psychologies
Какие бывают коннекторы зарядок для электромобилей и как их отличать Какие бывают коннекторы зарядок для электромобилей и как их отличать

Как выглядят разные коннекторы для электромобилей и как жить в таком “зоопарке”

ТехИнсайдер
Определи, что мешает тебе похудеть — медицинский фактор или психологический? Определи, что мешает тебе похудеть — медицинский фактор или психологический?

Все мы хотим быть здоровыми, стройными и красивыми, но многим что-то мешает

VOICE
Истории безумия: правда ли, что большинство знаменитых художников страдали ментальными расстройствами? Истории безумия: правда ли, что большинство знаменитых художников страдали ментальными расстройствами?

Верно ли, что ментальное расстройство и творческий гений ходят рука об руку

Правила жизни
Открыть в приложении