Как мы будем обмениваться информацией в век новых технологий

РБКHi-Tech

Александр Пиперски: «Нейросети взломали систему человеческой коммуникации»

Пока телепатия нам недоступна, мы вынуждены общаться с помощью более привычного инструмента — языка. «РБК Тренды» поговорили с известным лингвистом и выяснили, почему перестали возникать новые диалекты, как мы будем обмениваться информацией в век новых технологий и когда найдем общий язык с нейросетями

Беседовала Елизавета Пирогова

Александр Пиперски, лингвист, кандидат филологических наук, лауреат премии «Просветитель», автор книги «Конструирование языков: от эсперанто до дотракийского». Фото: Светлана Мишина / Личный архив Александра Пиперски

От единого языка к родным и обратно

РБК: Александр, какими были языки науки в разные годы и эпохи? Например, сейчас языком науки считается английский, а в начале прошлого века им был, скорее, немецкий. Каким может быть язык науки в будущем?

А. П.: Это всегда такое маятниковое движение: от стремления ученых иметь один язык для всех к желанию дать людям возможность писать на их родном языке. Оба эти стремления постоянно сменяют друг друга, потому что и в той и в другой ситуации есть свои плюсы и минусы. В Средние века языком науки была латынь, и это вызывало противодействие — учить латынь сложно и долго, язык был большим порогом вхождения в науку, и многих он отсекал. Возможно, из-за того, что ученые могли рассказывать о своих открытиях только на латыни, а ее никто толком не знал, люди стали тянуться к народным языкам.

В начале XX века немецкий не был универсальным языком науки. Это был как раз тот период, когда наука активно развивалась на национальных языках. Да, немецкий был одним из самых больших, но, повторюсь, он не был универсален. Сложно себе представить ситуацию, когда бы ученые из Англии, России и Италии приехали во Францию и там говорили бы по-немецки. Люди из разных стран не свободно владели немецким, скорее только читали. А потом постепенно снова победила тенденция к единому научному языку, и им стал английский. Те же самые француз, итальянец и россиянин, оказавшись где угодно, будут говорить между собой по-английски. Тенденции сменяют друг друга. Они ведут либо к тому, чтобы всем было проще выражаться, и тогда становятся важны родные языки. Либо тенденция к тому, чтобы всем было проще друг друга понимать, и тогда нужен единый язык, и сейчас мы именно на этом этапе развития.

РБК: Понятно: английский надо учить. А что нас ждет в дальнейшем?

А. П.: Как я говорил, мир все время флуктуирует между двумя полюсами. В ХХ веке, особенно в первой его половине, в Западной Европе и Америке ценность малых языков была небольшой. Во французских школах, например, запрещали говорить на бретонском языке. Сейчас эта тенденция меняется, а ценность малых языков снова увеличивается, как и растет стремление давать на них образование. Соответственно, будет нарастать противодействие тому, что вся наука развивается только на английском. Например, недавно мне доводилось читать статью колумбийской исследовательницы о том, что ученым из ее страны сложно работать, так как они подвергаются дискриминации по языку. Однако сама эта статья была написана, как ни смешно, по-английски.

Что ж, посмотрим, что будет дальше. Может быть, нам помогут технологии, и с автоматическими переводчиками эти проблемы вообще исчезнут. С научными текстами они уже неплохо справляются, и я сам этим пользуюсь. Недавно мне нужно было получить некоторые данные из диссертации, написанной по-японски, про киргизский язык. Я использовал Google-переводчик. Да, он может ошибаться с переводом каких-нибудь стилистических моментов. Но в целом машинному переводу сегодня можно довериться. Такой переводчик открывает для меня гораздо больше возможностей, чем если бы мне пришлось искать какого-нибудь японца-лингвиста, чтобы понять материал. И в этом смысле все-таки единый научный язык выглядит более логичным вариантом, чем желание сохранять множество небольших языков.

Двуалфавитные россияне и китайская грамота

РБК: С какими языками сталкивается в повседневной жизни обычный россиянин, не связанный с наукой?

А. П.: Обычный россиянин, не замечая этого, сталкивается с латинским алфавитом, но это не язык. Абсолютное большинство взрослых россиян, умеющих писать, двуалфавитны. Помню, когда-то депутаты обсуждали, что названия терминалов аэропорта Шереметьево — латинские буквы B, C, D, E, F — надо запретить и заменить на «Шереметьево-1», «Шереметьево-2». Но потом эта инициатива заглохла, так как ее абсурдность совершенно понятна. Даже те, кто не знает английского языка, понимают, как читаются эти буквы.

Из иностранных языков мы в повседневной жизни чаще всего сталкиваемся с английским, но при этом разные люди в разных частях России могут иметь и другой набор языков, с которыми они контактируют. Россия — многонациональное государство, и, например, люди, которые живут в Майкопе, регулярно слышат вокруг себя адыгейский язык. А вот в Ижевске услышать удмуртский язык уже сложнее. В каждом регионе свои особенности.

РБК: Насколько перспективно включение в российские образовательные программы китайского языка?

А. П.: Чтобы в России успешно ввели китайский язык, он должен стать полноценным языком международного общения. В Советском Союзе у всех в школе тоже были уроки иностранного языка: английского, немецкого, французского. Но в итоге почти никто никакого языка не знал, потому что не было массовых контактов с иностранцами. Или нельзя было, например, посмотреть ролик на YouTube на иностранном языке. Как только контакты появились, люди стали учить и иностранные языки. Сегодня младшее поколение знает английский на вполне пристойном уровне.

С китайским языком проблема в том, что он не является общемировым. Бесспорно, он самый большой по числу носителей язык в мире. Но при этом на китайском языке опять же не будут разговаривать между собой венгр и аргентинец. Они будут разговаривать на английском. Если китайская культура будет распространяться и повышать свою значимость в мире, то, конечно, внедрение китайского языка в школах имеет перспективу. Если нет, то, даже если его сделают обязательным для изучения, это будет плохо работать. Люди выучат десять иероглифов, запомнят ничтожное количество слов, но говорить не смогут. Экспансии китайской культуры мы пока тоже не наблюдаем — почти никто не смотрит китайские сериалы. Повторюсь: вся иностранная культурная продукция, которую мы потребляем, в первую очередь англоязычная за очень небольшими исключениями.

РБК: Правильно ли я понимаю, что китайский должен стать востребованным именно в мире, не обязательно только в России? И даже если партнерство с Китаем будет очень важным для нашей страны и нам действительно пригодится знание этого языка, это все еще не гарантия того, что он приживется, как английский?

А. П.: Да, это не гарантия, потому что китайские партнеры могут быть вполне готовы общаться с нами и по-английски. Вполне возможно, что китайцу будет проще коммуницировать с россиянином, который хорошо знает английский, чем общаться с ним на китайском, на котором он еле-еле говорит. Может быть, нашим китайским партнерам не так уж и хочется, чтобы мы изучали китайский.

Фото: Светлана Мишина / Личный архив Александра Пиперски

Языковая модель поведения робота

РБК: А с роботами и нейросетями мы говорим на одном языке? Как хорошо мы друг друга понимаем и какие есть прогнозы в плане успешности наших коммуникаций?

А. П.: Стоит признать, что за последние годы большие языковые модели добились очень высокого уровня прогресса. При этом они все еще с трудом выполняют некоторые простые инструкции, которые с легкостью выполняет человек. Например, ChatGPT пока не может написать стихотворение ямбом. Любой образованный носитель русского языка без труда что-нибудь сочинит этим стихотворным размером, а нейросеть — нет. Да, можно специально обучить отдельную нейросеть, натренировать ее — и такие уже есть, но вот так сходу она этого сделать не сможет. Почему? Наверное, потому что нейросети еще недостаточно плотно взаимодействуют с устной речью. Например, пока они не всегда понимают, куда поставить ударение в словах, из-за чего им сложно разобраться со стопами и стихотворными размерами.

Еще нейросети привлекают нас своим многословием, а это мешает повышать качество самих ответов. Людям нравятся длинные, подробные, грамматически правильные ответы на их вопросы, и не так важно, что в них сообщается. Когда ChatGPT или YandexGPT выдает на любой ваш вопрос не случайный набор букв, а гладкие связанные предложения на русском, английском и любом другом языке, мы думаем: отлично!

На многих школьных учителей длинные сочинения производят похожее впечатление: если ты написал работу по литературе на четыре страницы, то, скорее всего, получишь более высокую оценку. Нейросети это знают, в частности, потому что они обучаются именно на человеческих оценках. Если ответ короткий и неточный, человек раздражается, а если все еще неточный, но хотя бы длинный, раздражения уже меньше.

Нейросети немного взломали систему человеческой коммуникации. В 1970-е годы английский логик Герберт Пол Грайс выпустил постулаты успешного человеческого общения. Один из постулатов гласит, что нам нужно говорить не больше, чем требуется, и не меньше, чем требуется. Однако нейросети показали то, что нам нравится, когда они говорят больше, чем нужно. Пока мы как потребители находимся в состоянии эйфории от их способности выдавать большие тексты. Хотелось бы от этого отказаться, но не знаю, получится ли.

РБК: Чему еще предстоит поучиться нейросетям?

А. П.: Есть много разных аспектов. Например, пока языковые модели совсем плохо справляются с разговорным языком. Нейросеть легко напишет жалобу — формальным языком и по шаблону. В разговорном же языке мы используем множество конструкций, сами того не замечая, а они между тем очень затрудняют понимание тем, кто с этими конструкциями не знаком. Например, в рассказе «Хитрый способ» из «Денискиных рассказов» Виктора Драгунского мама Дениски говорит: «Утром мой чашки, а днем целая гора тарелок. Просто бедствие какое-то!» Что значит это «мой»? Во-первых, надо понять, что это не «мой», в смысле принадлежащий мне. Во-вторых, значение этого «мой» очень тонкое: утром приходится мыть чашки, и мне как будто говорят, что их надо мыть, но на самом деле никто меня не заставляет, но я чувствую себя обязанной. Или «бедствие какое-то». Что такое бедствие? Разве так можно сказать о мытье посуды? Такие разговорные выражения представляют большую проблему для автоматической проработки.

Еще у нас есть такие знания о мире, на которые лингвисты не обращали внимания во время обучения нейросетей, а оказалось, что таких знаний очень много и они важны для коммуникации. Например, такая фраза: «Слушайте, это прямо новость из «Панорамы». И те, кто много сидит в интернете, сразу поймут, о чем речь: новость настолько абсурдная, что ее могли бы опубликовать в сатирическом издании «Панорама». Компьютеры такое тоже должны понимать.

Такие мелочи и такая конкретная ерунда не приходила в голову людям, которые разрабатывали системы языкового понимания в 1970-е, 1980-е, 1990-е годы. Но сейчас мы предъявляем нейросетям и такие требования. Может ли этому научиться нейросеть? Оказывается, да, хотя еще год назад в ответ на фразу о «Панораме» я получил длиннейший текст о том, что панорама — это такая широкоугольная фотография.

РБК: А что нейросети уже хорошо умеют? Есть положительная динамика в их коммуникации с нами?

А. П.: Нейросети учатся очень быстро, это факт. Например, за последнее время они стали гораздо меньше галлюцинировать, это была известная проблема. Время от времени я спрашиваю у ChatGPT, кто такой Александр Пиперски. На заре своего существования он выдавал в качестве ответа абсолютнейший бред. Потом в какой-то момент он стал говорить: «Я не знаю, кто это, у меня нет данных». Сейчас чат-бот выдает довольно пристойный текст, который описывает меня и мою научную деятельность. Прогресс в плане обработки содержания явно налицо, хотя чувствительности к языку пока нет. Нейросети испытывают большие проблемы именно с игровым языком, когда мы говорим фразами со скрытыми смыслами — люди хорошо их улавливают в общении, но нейросеть пока их не распознает. Научить ее этому может быть сложно, но вполне возможно.

Большому языку — большое будущее

РБК: В одной из своих работ вы предсказываете, что через сто лет языков станет на треть меньше, чем сейчас. На каких языках мы будем говорить и потреблять информацию в 2124 году?

А. П.: Языки бывают очень разные. От самых больших, на которых говорят больше миллиарда человек, например на китайском, до языков, носителями которых являются десять человек. Конечно, нам не хватит внимания на языки, на которых говорят 20 человек в одной деревне. На таком языке не будут выстраивать систему школьного образования с первого по одиннадцатый класс, поэтому шансов у него мало.

Я думаю, что через 100 лет будут лучше себя чувствовать крупные языки. Например, нидерландский язык, скорее всего, будет прекрасно существовать, в том числе с государственной поддержкой. Может быть, нидерландские ученые будут разговаривать по-английски, но в целом как язык он будет существовать. Как, например, и татарский язык. А вот маленькие языки одной деревни будут исчезать.

Это естественная убыль, которая раньше восполнялась естественной прибылью, так как крупные языки легко делились. Какая-то группа людей отселялась от другой, у них развивался другой диалект, и постепенно он вырастал в новый язык.

Сейчас этого гораздо меньше, потому что коммуникация налажена в интернете, и ты можешь отселиться от носителей своего языка в другую часть земного шара и все равно смотреть те же самые новости, разговаривать с теми же самыми людьми на своем родном языке. Малые языки продолжают умирать, а большие языки расщепляются меньше.

Например, в Татарстане довольно много тех, кто говорит со своими родителями, бабушками и дедушками на татарском языке. Есть много деревень, где говорят на татарском. Поэтому языку пока ничего не угрожает. Когда многие люди вокруг тебя о чем-то говорят, а ты их не понимаешь, это не очень приятно. И это создает стимул изучать язык, а значит, способствовать его сохранению.

А если мы возьмем, например, юкагирский язык, на котором говорят порядка 200 человек, тот тут шансов мало. Сохранение языка возможно в том случае, когда для его освоения создаются возможности, особенно в детском возрасте. Нужно использовать язык в школах, причем на этом языке должны преподаваться разные предметы. Если люди смогут поговорить на юкагирском языке о математике хотя бы на уровне пятого класса, то это уже будет большая поддержка языка.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Tsoy: «Без поражений не бывает побед» Tsoy: «Без поражений не бывает побед»

Обсудили с певцом Tsoy любовь к фитам, глупые траты и абсолютное счастье

VOICE
Нужно ли мариновать мясо для шашлыка с точки зрения науки Нужно ли мариновать мясо для шашлыка с точки зрения науки

Правильный выбор мяса для шашлыка позволяет обойтись без маринада

Maxim
Ген памяти Ген памяти

Какие альтернативные накопители предлагают на рынке хранения данных

РБК
«Кладбище самолетов»: какой у лайнеров срок годности и что с ними происходит, когда они больше не могут летать «Кладбище самолетов»: какой у лайнеров срок годности и что с ними происходит, когда они больше не могут летать

У всего в этом мире есть срок годности, даже у самолетов. Но где их «кладбища»?

ТехИнсайдер
«Когда у тебя много детей, остается сильно меньше времени, чтобы думать о смерти». Интервью с режиссером Николаем Хомерики «Когда у тебя много детей, остается сильно меньше времени, чтобы думать о смерти». Интервью с режиссером Николаем Хомерики

Режиссер Николай Хомерики о сериале «Чистые», Петербурге, кино и смерти

СНОБ
Его Высокопреосвященство Его Высокопреосвященство

Арест и суд над венгерским кардиналом Йожефом Миндсенти

Дилетант
Как сон смягчает наши страдания, почему он в этом незаменим Как сон смягчает наши страдания, почему он в этом незаменим

Почему хороший ночной сон является идеальным средством от эмоционального стресса

ТехИнсайдер
Позолоти перчатку: как зарабатывает и на что тратит состояние Тайсон Фьюри Позолоти перчатку: как зарабатывает и на что тратит состояние Тайсон Фьюри

Forbes Sport рассказывает о сумасшедших заработках Тайсона и его инвестициях

Forbes
Если в отношениях есть секреты, что-то не так? Если в отношениях есть секреты, что-то не так?

Обязаны ли мы рассказывать партнеру абсолютно обо всем, если он нам дорог?

Psychologies
Андрей Журавлев: Динозавры — это ведь нечто среднее между медициной и паровозами Андрей Журавлев: Динозавры — это ведь нечто среднее между медициной и паровозами

Андрей Журавлев: чем питались мегалодоны и возможно ли сегодня оживить мамонта

СНОБ
Ученым удалось воссоздать лицо неандертальской женщины возрастом 75 тыс. лет. Ее нашли в братской пещерной могиле Ученым удалось воссоздать лицо неандертальской женщины возрастом 75 тыс. лет. Ее нашли в братской пещерной могиле

Внешность людей и неандертальцев отличалась не так сильно, как думали ученые

Inc.
Осторожно, у вас гений. Как помочь ребенку, опережающему в развитии Осторожно, у вас гений. Как помочь ребенку, опережающему в развитии

Как воспитывать ребенка, если он вундеркинд?

СНОБ
OpenAI представила мультимодальную генеративную модель GPT-4o OpenAI представила мультимодальную генеративную модель GPT-4o

Компания OpenAI представила мультимодальную генеративную модель GPT-4o

N+1
РФ в БРИКС: «Мы нацелены на плотную работу с партнерами» РФ в БРИКС: «Мы нацелены на плотную работу с партнерами»

Ключевые аспекты работы БРИКС и участие РФ в этом объединении

ФедералПресс
Танцы и панические атаки: как звучит новый альбом Билли Айлиш Hit Me Hard And Soft Танцы и панические атаки: как звучит новый альбом Билли Айлиш Hit Me Hard And Soft

Как Билли Айлиш удалось собрать в одно целое поп, баллады и песни-триллеры

Forbes
Что такое «Пифагоровы штаны» и как египтяне строили пирамиды: 6 вопросов о геометрии, которые мучили вас со школы Что такое «Пифагоровы штаны» и как египтяне строили пирамиды: 6 вопросов о геометрии, которые мучили вас со школы

Об удивительных примерах использования геометрических знаний

ТехИнсайдер
Радикальная оптимистка: как Дуа Липа заставила весь мир танцевать под свой бит Радикальная оптимистка: как Дуа Липа заставила весь мир танцевать под свой бит

Кто такая Дуа Липа и чем примечателен её альбом Radical Optimism?

Правила жизни
Идеи для девичника: как провести время с подругами Идеи для девичника: как провести время с подругами

Как организовать девичник так, чтобы он запомнился и понравился всем участникам?

Здоровье
Все альбомы «Сектора Газа» — от худшего к лучшему Все альбомы «Сектора Газа» — от худшего к лучшему

У группы «Сектор Газа» нет плохих альбомов

Maxim
Российские физики объединили флаксониумы и трансмон в трехкубитный вентиль Российские физики объединили флаксониумы и трансмон в трехкубитный вентиль

Ученые предложили новый способ реализации быстрой трехкубитной операции

N+1
Сибирь, XXI век: что будет, если в России построят больше железных дорог Сибирь, XXI век: что будет, если в России построят больше железных дорог

Драйвером роста современной России снова станут железные дороги

ТехИнсайдер
Разработан новый метод борьбы с галлюцинациями больших лингвистических моделей Разработан новый метод борьбы с галлюцинациями больших лингвистических моделей

Как система KnowHalu помогает бороться с галлюцинацими

ТехИнсайдер
Крошки мои: зачем нужна текстурирующая пудра для волос? Крошки мои: зачем нужна текстурирующая пудра для волос?

Пудра для волос: придание объема, небрежная укладка или эффект сухого шампуня

Правила жизни
Цена прохлады: как выбрать кондиционер для дома Цена прохлады: как выбрать кондиционер для дома

На что обратить внимание при выборе кондиционера?

CHIP
Ключ к гармонии: 4 потребности и как их закрыть Ключ к гармонии: 4 потребности и как их закрыть

Как потребности более высокого уровня влияют на нашу жизнь?

Psychologies
Запах старости: почему пожилые люди странно пахнут Запах старости: почему пожилые люди странно пахнут

«Запах старости»: что его вызывает? Это связано с гигиеной или болезнями?

ТехИнсайдер
Рынок в $33 млрд: как киберспорт перестал быть нишевым и начал завоевывать Россию Рынок в $33 млрд: как киберспорт перестал быть нишевым и начал завоевывать Россию

К 2024 году киберспорт стал бизнесом стоимостью в миллиарды долларов.

Forbes
Еще по одной: 10 мини-сериалов, которые можно посмотреть за вечер Еще по одной: 10 мини-сериалов, которые можно посмотреть за вечер

Необычные мини-сериалы, которые вы могли пропустить

Правила жизни
«Ставить дружбу выше истины»: каково это — быть настоящим другом «Ставить дружбу выше истины»: каково это — быть настоящим другом

Дружба складывается не из схожестей людей, а из моментов, в которых они разнятся

Psychologies
The Doors для сглаживания танинов и Дебюсси для усиления свежести. Как музыка меняет вкус вина The Doors для сглаживания танинов и Дебюсси для усиления свежести. Как музыка меняет вкус вина

Почему сомелье предпочитают проводить дегустации в тишине?

СНОБ
Открыть в приложении