Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Редкоземельные металлы: что такое, почему редкие и зачем нужны людям Редкоземельные металлы: что такое, почему редкие и зачем нужны людям

Какие металлы считаются редкоземельными и почему получили такое название

ТехИнсайдер
«Над отношениями не надо работать»: 6 токсичных представлений о любви «Над отношениями не надо работать»: 6 токсичных представлений о любви

К чему приводят нереалистичные ожидания в отношениях

Psychologies
Как найти музыку из видео: 7 рабочих способов на все случаи жизни Как найти музыку из видео: 7 рабочих способов на все случаи жизни

Простые способы, как найти музыку из видео на телефоне

CHIP
Вызов самой себе Вызов самой себе

Леонела Мантурова — о выборе профессии и умении не сдаваться перед сложностями

OK!
7 самых распространенных способов обмана на шиномонтаже 7 самых распространенных способов обмана на шиномонтаже

Как не попасться на крючок мошенников в шиномонтаже

Maxim
Знаковое место Знаковое место

Стильный, функциональный, авторский интерьер в духе timeless

SALON-Interior
Секс в положении Секс в положении

Как будущей маме получать удовольствие в постели и не навредить малышу

Лиза
Зерновые не стали доходнее Зерновые не стали доходнее

Итоги зерновой отрасли первой половины сезона 2024/25

Агроинвестор
Бородатый анекдот Бородатый анекдот

«Почему, чёрт возьми, развалился Советский Союз?»

Дилетант
Открытие памятника Сталину Открытие памятника Сталину

Идея поставить памятник советскому вождю в Праге возникла в 1949 году

Дилетант
Как привить себе новые привычки: советы ученых Как привить себе новые привычки: советы ученых

Освоение нового режима может быть пугающим, но это проще, чем многим кажется

ТехИнсайдер
Репортаж из томографа Репортаж из томографа

Как наш мозг принимает решения?

Ведомости
Утомленные школой Утомленные школой

Как облегчить жизнь ребенку в тяжелое для него время?

Лиза
МХАТ и война: отрывок из книги Софьи Пилявской МХАТ и война: отрывок из книги Софьи Пилявской

Отрывок из переиздания книги Софьи Пилявской — «Грустная книга»

СНОБ
Фридрих Шиллер Фридрих Шиллер

Почему Шиллера боялись трогать — не только же из-за трудностей перевода?

Дилетант
Нейронаука в фотографии! Как психология внимания формирует ваше мнение о снимках: факты и лайфхаки Нейронаука в фотографии! Как психология внимания формирует ваше мнение о снимках: факты и лайфхаки

Почему одни фотографии мгновенно привлекают внимание, а другие не замечаются?

ТехИнсайдер
Горох Горох

В Нью-Йоркском ботаническом саду распускаются необычные цветы от Яёи Кусамы

Afternoon Seasons of life
Нет вайба Нет вайба

Что делать, если пропало желание работать

Лиза
Алексей Олейников: Хочу расследовать «Смерть чиновника» Чехова Алексей Олейников: Хочу расследовать «Смерть чиновника» Чехова

Писатель Алексей Олейников — об историческом детективе и антропологии

СНОБ
5 признаков, указывающих на то, что вы по-настоящему зрелая личность 5 признаков, указывающих на то, что вы по-настоящему зрелая личность

Можете ли вы похвастаться тем, что достигли психологической зрелости?

Maxim
20 привычек, которые помогут прокачать себя 20 привычек, которые помогут прокачать себя

Почему так важно, чтобы привычки были здоровыми и полезными?

Psychologies
Решиться стать родителями Решиться стать родителями

Радмила Хакова о том, как она пять лет готовилась к рождению дочери

Afternoon Seasons of life
Национальный домен: какие приемы мировой практики в сети может применять российский бизнес Национальный домен: какие приемы мировой практики в сети может применять российский бизнес

Почему бизнес в России еще только в начале своего пути в онлайне

Inc.
Мама-вертолет и папа-тигр: как стиль воспитания влияет на развитие ребенка Мама-вертолет и папа-тигр: как стиль воспитания влияет на развитие ребенка

Что лучше: ставить ребенку высокие планки или пустить все на самотек?

ТехИнсайдер
Как перестать беспокоиться о том, что думают другие: 11 советов Как перестать беспокоиться о том, что думают другие: 11 советов

Как перестать волноваться из-за мнений окружающих по поводу вашей персоны

Psychologies
Евгений Леонов боялся только одного: потерять жену Евгений Леонов боялся только одного: потерять жену

О Евгении Леонове вспоминали люди, знавшие его по гастролям, съемкам, театру...

Караван историй
Архипанки Архипанки

Представители архитектурной молодежной сцены, устраивающие реновацию смыслов

Собака.ru
Почему собаки тоже страдают от январской хандры Почему собаки тоже страдают от январской хандры

Собаки тоже могут чувствовать себя подавленными, ощущая январскую хандру

ТехИнсайдер
Буллинг от А до Я: причины и виды травли, опасности и как ей противостоять Буллинг от А до Я: причины и виды травли, опасности и как ей противостоять

Травля: что раскручивает маховик агрессии и как его затормозить?

Psychologies
Разгруженные железные дороги Разгруженные железные дороги

С 2022 г. в России начался процесс активного перестроения логистических цепочек

Ведомости
Открыть в приложении