Имеет ли значение доминирование английского языка для ИИ-моделей?

ТехИнсайдерHi-Tech

Оказалось, что у ИИ-моделей есть родной язык: чаще всего это английский

Владимир Губайловский

Исследователи Федеральной политехнической школы Лозанны (EPFL) показали, что большие языковые модели, первоначально обученные на английских текстах, похоже, сами используют английский для внутренних задач, даже когда получают подсказки (промпты) на другом языке. Поскольку ИИ все сильнее вмешивается в нашу жизнь, такое превалирование английского может иметь самые серьезные последствия в отношении языковых и культурных предубеждений.

Большие языковые модели, такие как ChatGPT, покорили мир, удивив нас своей способностью понимать наши слова и отвечать на нашем родном языке — гладко и связанно. Но есть нюанс: оказывается у них есть родной язык, и этот язык — английский.

Хотя с большими языковые моделями (LLM), такими как ChatGPT от Open AI и Gemini от Google, можно взаимодействовать на любом языке, первоначально они обучены работе с сотнями миллиардов текстовых параметров, в основном, на английском. Некоторые исследователи выдвинули гипотезу, что большую часть внутренней обработки LLM выполняют на английском языке и переводят полученный текст на целевой язык в самый последний момент. Однако доказательств этому до сих пор было мало.

Тестирование Llama

Исследователи Федеральной политехнической школы Лозанны (EPFL) изучили LLM с открытым исходным кодом Llama-2 (Large Language Model Meta (признана экстремистской организацией на территории РФ) AI), чтобы определить, какие языки использовались на каких этапах вычислительной цепочки.

«Большие языковые модели обучены предсказывать следующее слово. Они делают это, сопоставляя каждое слово с вектором чисел, по сути, с точкой в многомерном пространстве данных. Например, слово "the" всегда будет находиться в одной и той же фиксированной точке координат», — пояснил профессор Роберт Уэст, возглавивший исследование.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Кладбища кораблей: три самых опасных моря на планете Кладбища кораблей: три самых опасных моря на планете

Штормы и смертельные течения — воды каких морей особенно коварны

ТехИнсайдер
В поясе богатых черноземов В поясе богатых черноземов

Обзор АПК Тамбовской области

Агроинвестор
От бронирования переговорной до входа в бизнес-зал: где используется биометрия в России От бронирования переговорной до входа в бизнес-зал: где используется биометрия в России

Зачем нужна биометрия и как ее использовать в России

ТехИнсайдер
Павианы анубисы переночевали на опорах ЛЭП Павианы анубисы переночевали на опорах ЛЭП

Ученые заметили несколько групп павианов анубисов, ночующих на опорах ЛЭП

N+1
Интроверты​​​​ Интроверты​​​​

Как использовать особенности своего характера

kiozk originals
«Любая эмоция – это важно. Потому что искусство – всегда про эмоцию» «Любая эмоция – это важно. Потому что искусство – всегда про эмоцию»

Как собрать выставку-блокбастер в эпоху победивших нейросетей?

Правила жизни
Две стороны советской науки: почему Капицу не пускали в Кембридж, а Ландау арестовали Две стороны советской науки: почему Капицу не пускали в Кембридж, а Ландау арестовали

Как формировалась политика по отношению к науке и ученым в сталинские времена?

Forbes
2 препятствия, которые мешают отделиться от токсичных родителей 2 препятствия, которые мешают отделиться от токсичных родителей

Что мешает жить своей жизнью? Какие шаги помогут выпутаться из токсичной семьи?

Psychologies
Клуб добряков Клуб добряков

История женщины, которая справилась с потерями и теперь вдохновляет других

Новый очаг
5 ярких мистификаций в истории русской литературы 5 ярких мистификаций в истории русской литературы

В мире русской литературы мистификация занимает особое место

Maxim
Анфиса Чехова: «Я не тот человек, который верит во все подряд» Анфиса Чехова: «Я не тот человек, который верит во все подряд»

Любимые блюда Анфисы Чеховой. Каких принципов питания она придерживается?

Лиза
Какой же вы интеллектуал с чувством юмора, если не знаете эти 14 цитат советского гения смешного Аркадия Аверченко! Какой же вы интеллектуал с чувством юмора, если не знаете эти 14 цитат советского гения смешного Аркадия Аверченко!

Каждый интеллектуал с чувством юмора обязан знать эти цитаты Аркадия Аверченко

Maxim
Почти как Бекхэмы: 10 успешных союзов звезд футбола, тенниса, хоккея и гимнастики Почти как Бекхэмы: 10 успешных союзов звезд футбола, тенниса, хоккея и гимнастики

Спортивные браки, которые оказались и прочными, и финансово успешными

Forbes
Кому точно нельзя делать тату и перманентный макияж: твоя главная памятка перед процедурой Кому точно нельзя делать тату и перманентный макияж: твоя главная памятка перед процедурой

Как не допустить, чтобы бьюти-процедура обернулась для тебя серьезными рисками.

VOICE
11 вещей, которые никогда нельзя чистить содой: мнение профессиональных клинеров 11 вещей, которые никогда нельзя чистить содой: мнение профессиональных клинеров

Рассказываем, какие поверхности не стоит чистить содой!

VOICE
Модный разговор с Владимиром Славским. Глафира Тарханова: «Улыбка — лучший аксессуар женщины» Модный разговор с Владимиром Славским. Глафира Тарханова: «Улыбка — лучший аксессуар женщины»

Стоит ли слепо следовать трендам? Как выбирать одежду для выхода?

Караван историй
Команда «На взлёт» Команда «На взлёт»

Эксперты назвали художников, чьи работы имеют шанс вырасти в цене

RR Люкс.Личности.Бизнес.
Куда глаза глядят Куда глаза глядят

В линейке Jetour появилась модель для путешествий по бездорожью

Автопилот
Проще простого: самый быстрый способ почистить садовые инструменты Проще простого: самый быстрый способ почистить садовые инструменты

Хочешь знать, как быстро почистить садовые инструменты?

VOICE
15 фильмов для тех, кому понравилась «Дюна» 15 фильмов для тех, кому понравилась «Дюна»

Что еще посмотреть, если двух кинолент «Дюна» Дени Вильнева вам не хватило

Maxim
Пой, ласточка, пой Пой, ласточка, пой

Какими умениями нужно обладать, чтобы стать оперным певцом

Лиза
В маршрут все включено В маршрут все включено

«Я — капитан»: очень предсказуемый фильм Маттео Гарроне об африканских мигрантах

Weekend
Древние жители Иберии разделали мамонта около 1,2 миллиона лет назад Древние жители Иберии разделали мамонта около 1,2 миллиона лет назад

Следы от орудий нашли на костях из местонахождения Фуэнте-Нуэва-3

N+1
5 книг о спорте, которые понравятся даже тем, кто ненавидит спорт 5 книг о спорте, которые понравятся даже тем, кто ненавидит спорт

Книги о спорте, которые тронут душу даже самого неспортивного человека

Maxim
Не пора ли подумать о протекционизме? Не пора ли подумать о протекционизме?

Протекционизма как системы защиты в России пока нет

Монокль
Мама может Мама может

Преимущества, которые дает женщинам российский закон

Лиза
Усилие к жизни Усилие к жизни

Что происходит с нашим мышлением и чувствами в условиях цифровой реальности?

Psychologies
Лариса Лужина: «Я не встречала вечной любви» Лариса Лужина: «Я не встречала вечной любви»

У меня спрашивают: «Что же ты, не могла замуж выйти?» Почему не могла? Могла!

Коллекция. Караван историй
Тесты на деменцию Тесты на деменцию

Как самостоятельно обнаружить деменцию на ранней стадии

Лиза
Хороший тон Хороший тон

Как добиться эффекта идеально гладкой сияющей кожи с помощью тональных средств

Лиза
Открыть в приложении