Имеет ли значение доминирование английского языка для ИИ-моделей?

ТехИнсайдерHi-Tech

Оказалось, что у ИИ-моделей есть родной язык: чаще всего это английский

Владимир Губайловский

Исследователи Федеральной политехнической школы Лозанны (EPFL) показали, что большие языковые модели, первоначально обученные на английских текстах, похоже, сами используют английский для внутренних задач, даже когда получают подсказки (промпты) на другом языке. Поскольку ИИ все сильнее вмешивается в нашу жизнь, такое превалирование английского может иметь самые серьезные последствия в отношении языковых и культурных предубеждений.

Большие языковые модели, такие как ChatGPT, покорили мир, удивив нас своей способностью понимать наши слова и отвечать на нашем родном языке — гладко и связанно. Но есть нюанс: оказывается у них есть родной язык, и этот язык — английский.

Хотя с большими языковые моделями (LLM), такими как ChatGPT от Open AI и Gemini от Google, можно взаимодействовать на любом языке, первоначально они обучены работе с сотнями миллиардов текстовых параметров, в основном, на английском. Некоторые исследователи выдвинули гипотезу, что большую часть внутренней обработки LLM выполняют на английском языке и переводят полученный текст на целевой язык в самый последний момент. Однако доказательств этому до сих пор было мало.

Тестирование Llama

Исследователи Федеральной политехнической школы Лозанны (EPFL) изучили LLM с открытым исходным кодом Llama-2 (Large Language Model Meta (признана экстремистской организацией на территории РФ) AI), чтобы определить, какие языки использовались на каких этапах вычислительной цепочки.

«Большие языковые модели обучены предсказывать следующее слово. Они делают это, сопоставляя каждое слово с вектором чисел, по сути, с точкой в многомерном пространстве данных. Например, слово "the" всегда будет находиться в одной и той же фиксированной точке координат», — пояснил профессор Роберт Уэст, возглавивший исследование.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Большая тяга и много топлива? Почему нельзя отправить весь мусор в космос на огромной ракете Большая тяга и много топлива? Почему нельзя отправить весь мусор в космос на огромной ракете

Почему бы не собрать весь мусор и не отправить его на огромной ракете в космос?

ТехИнсайдер
Патологическое накопительство животных: 4 симптома «зоологического плюшкинизма» Патологическое накопительство животных: 4 симптома «зоологического плюшкинизма»

Зачем люди заводят огромное количество кошек и собак?

Psychologies
Чем больше контента вы смотрите, тем хуже для психического здоровья Чем больше контента вы смотрите, тем хуже для психического здоровья

Чем больше времени вы проводите в сети, тем хуже становится психическое здоровье

ТехИнсайдер
Что такое свап двигателя и нужно ли его регистрировать Что такое свап двигателя и нужно ли его регистрировать

Альтернативой капитальному ремонту ДВС может стать свап

РБК
Эмоциональный интеллект Эмоциональный интеллект

Новое представление о том, что значит быть «умным»

kiozk originals
Кто еще в квартире живёт? Кто еще в квартире живёт?

Насекомые и пауки, которые живут в наших квартирах

Наука и жизнь
Аккуратисты и бардачники: как выжить в одном доме с мужчиной, если у вас разные взгляды на быт? Аккуратисты и бардачники: как выжить в одном доме с мужчиной, если у вас разные взгляды на быт?

Как ужиться в одном доме, если вы по-разному относитесь к порядку?

VOICE
Путь героя Путь героя

Пять героев, которые в один день решились и изменили свой привычный мир

Seasons of life
Сохрани в тайне свою женитьбу… Сохрани в тайне свою женитьбу…

Александра Иосифовна умоляла императора подождать с публичностью в новом браке

Дилетант
2 техники, которые помогут паре договориться о планах на отдых 2 техники, которые помогут паре договориться о планах на отдых

Он хочет на рыбалку, а она — к маме. Как найти общий язык, планируя отдых?

Psychologies
Сексизм в большом городе: как женщины борются с дискриминацией и домогательствами на рабочем месте Сексизм в большом городе: как женщины борются с дискриминацией и домогательствами на рабочем месте

Несмотря на внимание сексизм все еще не удается полностью искоренить

Inc.
Тана Френч: «В лесу». Роман из «Дублинского цикла» Тана Френч: «В лесу». Роман из «Дублинского цикла»

Фрагмент из дебютного детективного романа Таны Френч «В лесу»

СНОБ
Премиальный полуприцеп заезжает в свободную нишу Премиальный полуприцеп заезжает в свободную нишу

«Вагнермайер Руссланд» намерен взять лучшее от своего зарубежного партнера

Монокль
Женщины-амазонки, возможно, действительно существовали! Узнайте аргументы эксперта Женщины-амазонки, возможно, действительно существовали! Узнайте аргументы эксперта

При раскопках могил бронзового века обнаружили останки женщин-лучниц

ТехИнсайдер
Игры_с_разумом Игры_с_разумом

Как нейросети меняют гейм-индустрию

ТехИнсайдер
Инструмент для землемеров и топографов Павла Бибикова Инструмент для землемеров и топографов Павла Бибикова

Как Павел Бибиков облегчил жизнь землемерам и топографам

Наука и жизнь
Подделки, санкции, новые марки: как создают духи в России и можно ли доверять их качеству Подделки, санкции, новые марки: как создают духи в России и можно ли доверять их качеству

Как обстоят дела на российском рынке парфюмерии на самом деле

VOICE
Что может взойти на российско-китайском огороде Что может взойти на российско-китайском огороде

Потенциал сотрудничества России и Китая в сегменте овощей и картофеля

Агроинвестор
Медленно, но верно Медленно, но верно

Если хотите изменить набор пищевых привычек, действуйте постепенно

Добрые советы
Почему мы верим в паранормальные явления Почему мы верим в паранормальные явления

Почему люди верят в паранормальное

ТехИнсайдер
Нервные тики у ребенка: почему они возникают и как лечатся Нервные тики у ребенка: почему они возникают и как лечатся

Какие нервные тики встречаются чаще всего и почему? И всегда ли нужно их лечить?

Psychologies
Фарфоровый камин и китайский кабинет: как реставраторы работают на деньги меценатов Фарфоровый камин и китайский кабинет: как реставраторы работают на деньги меценатов

О сложных реставрациях-реконструкциях, выполненных на деньги меценатов

Forbes
Россия «в состоянии крайней слабости» Россия «в состоянии крайней слабости»

Положение «белой России» в 1919 году выглядело крайне уязвимым

Дилетант
От «Мастера и Маргариты» до «Онегина»: удачные и провальные экранизации классики От «Мастера и Маргариты» до «Онегина»: удачные и провальные экранизации классики

Успешные и провальные случаи киноадаптаций больших книг

Правила жизни
Хортифутуризм Хортифутуризм

Превращаем сад в научно-фантастический рай

Караван историй
Высокодоходный максимум Высокодоходный максимум

Небольшие компании воспользовались шансом занять у частников

Деньги
Концерты, которые вызывают землетрясение: рейтинг самый громких и «трясущихся» Концерты, которые вызывают землетрясение: рейтинг самый громких и «трясущихся»

Какие концерты когда-либо сотрясали землю?

ТехИнсайдер
Елочные игрушки Елочные игрушки

Елочные игрушки – не только радость для детей, но и роскошь для взрослых

Правила жизни
Только вперед Только вперед

Детские и недетские вопросы — от важности побыть одному до индульгенции границ

Psychologies
Как понять, что доставляет вам удовольствие: 4 простых шага Как понять, что доставляет вам удовольствие: 4 простых шага

Как разобраться что именно приносит нам удовольствие?

Psychologies
Открыть в приложении