Артист, журналист, художник и лучший друг 660 млн человек: почему бот Microsoft Xiaoice стал самым популярным в Китае
Интеллектуальный чат-бот успешно притворяется живым собеседником, которому доверяют и признаются в любви. Как он работает и почему Microsoft отказалась от Xiaoice, выделив его в независимую компанию стоимостью $700 млн.
В 2014 году небольшая команда исследователей азиатского подразделения Microsoft запустила систему Xiaoice.
В отличие от Siri, «Алисы» и Google Assistant, она не предназначена для повышения продуктивности. По задумке, бот должен стать другом пользователя, с помощью которого он удовлетворит потребность в общении и социуме и которому расскажет о личных проблемах и переживаниях.
Создатели называли Xiaoice «самым масштабным тестом Тьюринга с момента его создания». Согласно исследованию Microsoft, только спустя 10 минут после начала беседы многие пользователи догадывались, что разговаривают не с человеком.
При этом они не бросали общение, когда понимали, что с ними говорил ИИ, и даже проводили с ним больше времени, чем с живыми людьми: Xiaoice всегда готов послушать. В среднем пользователь разговаривает с ботом больше 60 раз в месяц.
Меньше чем за год бот провёл более 10 млрд бесед с китайскими пользователями, 6 млн диалогов опубликовали в открытом доступе. За четыре года он стал знаменитостью в Китае, а затем вышел на рынки Японии, Индонезии, Индии и США.
Со временем разработка превратилась и в голосового ассистента с сотнями навыков, и в платформу для создания новых ботов. Также Xiaoice пишет стихи и поёт песни, рисует, готовит финансовые отчёты, ведёт телепередачи, создаёт дизайнерскую одежду.
Разработка доступна в мессенджерах WeChat, QQ, Weibo, Facebook (соцсеть признана в РФ экстремистской и запрещена) Messenger, Line и Meipai. Платформа охватывает 660 млн пользователей, 450 млн «умных» устройств и 900 млн зрителей телешоу.
В июле 2020 года Microsoft выделила Xiaoice в отдельную независимую китайскую компанию, став её спонсором и владельцем прав на технологию. Китайские инвесторы оценивают новую фирму в $700 млн.
Как устроена Xiaoice
В основе Xiaoice три сущности: искусственный интеллект (IQ), эмоциональный интеллект (EQ) и «личность».
- IQ ведёт диалог и отвечает за умения бота, знания, память, распознавание естественного языка и изображений, вычисления и предсказание результата.
- EQ — навыки эмпатии и социального взаимодействия. Благодаря им Xiaoice «ставит себя на место пользователя», понимает его чувства, подстраивается под него и направляет беседу.
- «Личность» — специфические черты вроде манеры поведения и выражения эмоций.
В качестве базы данных используется поисковик Microsoft Bing, который хранит 1 млрд записей и 21 млрд связей между ними. (Xiaoice в переводе с китайского — «Маленький Bing»).
Диалоговое ядро состоит из двух частей, первая отвечает за общие разговорные навыки, вторая — за специфичные темы, например знание музыки, знаменитостей, кино. Нейросеть генерирует фразу-ответ и проверяет, подходит ли она для продолжения общения.
Часть ответов Xiaoice берёт из набора данных, состоящего из диалогов людей и бота в соцсетях. К маю 2018-го собрано более 30 млн таких пар, в 70% случаев Xiaoice берёт готовый ответ из них.
Для вопросов о фактах система подбирает ответ так же, как в поисковой выдаче, — ранжированием результатов.
Почему Xiaoice стала популярной
Сначала персонаж Xiaoice был 16-летней девушкой, но со временем возраст подняли до 18 лет, чтобы диалоги были свободнее. Кроме того, 18 лет — идеальный возраст, в котором многие хотели бы остаться, считают создатели.
У неё есть чувство юмора, она запоминает черты собеседника, может дразнить и перебивать, злиться, менять тему по ходу разговора, скрыть, что чего-то не знает, и стыдиться, если это обнаружат.
Поэтому беседа с ботом становится естественной, и Xiaoice воспринимают как человека. В 2015 году Microsoft заявила: четверть пользователей, около 10 млн человек на тот момент, призналась боту в любви. Один из собеседников Xiaoice признался, что виртуальная подруга отговорила его от самоубийства.