Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как мужчины с Ближнего Востока используют подводку для глаз из сурьмы и портят себе глаза Как мужчины с Ближнего Востока используют подводку для глаз из сурьмы и портят себе глаза

Кохль — не просто косметическое средство, а символ культурной идентичности

ТехИнсайдер
12 привычек, которые стоит в себе воспитать, чтобы нравиться людям 12 привычек, которые стоит в себе воспитать, чтобы нравиться людям

Привычки, которые подойдут вам, если вы хотите слыть приятным человеком

Maxim
Чем гиперзвук отличается от суперзвука: то, что вы давно хотели знать, но стеснялись спросить Чем гиперзвук отличается от суперзвука: то, что вы давно хотели знать, но стеснялись спросить

Есть ли скорость еще более высокая, чем гиперзвуковая?

ТехИнсайдер
7 фильмов про близнецов, которые стоит увидеть хотя бы единожды 7 фильмов про близнецов, которые стоит увидеть хотя бы единожды

Фильмы, которые показывают невероятную химию между близнецами

Maxim
Обратная перемотка: 20 лучших зарубежных фильмов 2024 года Обратная перемотка: 20 лучших зарубежных фильмов 2024 года

Какие фильмы, вышедшие в 2024 году, стоит обязательно посмотреть?

Правила жизни
Франшиза без труда: может ли франчайзи получать пассивный доход Франшиза без труда: может ли франчайзи получать пассивный доход

Что такое франшиза с пассивным доходом и можно ли на ней заработать?

Forbes
Почему фильм «Крейвен-охотник» о супергерое с русскими корнями провалился в прокате Почему фильм «Крейвен-охотник» о супергерое с русскими корнями провалился в прокате

Почему экранизация комикса с саундтреком-колыбельной провалился в прокате

Forbes
Англия накануне нормандского завоевания. Основные игроки Англия накануне нормандского завоевания. Основные игроки

Нормандское завоевание Англии – одно из переломных моментов английской истории

Наука и техника
3 самые популярные пластические операции в России: рассказывает хирург 3 самые популярные пластические операции в России: рассказывает хирург

Какие пластические операции делают в России чаще всего?

VOICE
«Грозы сии пойдут во славу России» «Грозы сии пойдут во славу России»

Ушаков не потерял в боях ни одного корабля, не потерпел ни одного поражения

Зеркало Мира
О науках естественных и не очень О науках естественных и не очень

Как выбраться из болота экономической неопределенности

Деньги
Перелет–2020. От Санкт-Петербурга до Владивостока на мотопараплане Перелет–2020. От Санкт-Петербурга до Владивостока на мотопараплане

Перелет через 23 региона России за 69 дней на мотопараплане

Наука и техника
Путешествие в Сибирь Путешествие в Сибирь

Атмосферные апартаменты, не имеющие аналогов в Тобольске

Идеи Вашего Дома
$117 000 из бассейна: сколько принесло россиянам возвращение на ЧМ по плаванию $117 000 из бассейна: сколько принесло россиянам возвращение на ЧМ по плаванию

Сколько заработали россияне, и кто из пловцов стал самым богатым в сезоне

Forbes
Ананас Ананас

Польза ананаса, ананасовая диета и рецепты с этим фруктом

Здоровье
Сказка, ставшая реальностью Сказка, ставшая реальностью

Константин Маркелов о «дофамин-банкинге» и новой продуктовой культуре корпораций

Правила жизни
Призрак технооптимизма Призрак технооптимизма

Годовая статистика роста технологичных отраслей в РФ снова будет рекордной

Монокль
Принцесса Диана обнимает взрослых сыновей: кто «воскрешает» знаменитостей и почему многих это пугает? Принцесса Диана обнимает взрослых сыновей: кто «воскрешает» знаменитостей и почему многих это пугает?

Мин Чой опубликовал несколько постов с ожившими звездами. Почему это страшно?

Psychologies
«Девочке скучно»: новый рассказ Евгении Некрасовой «Девочке скучно»: новый рассказ Евгении Некрасовой

Рассказ Евгении Некрасовой из сборника «Верю / не верю»

РБК
Водная палитра Водная палитра

Квартира с высокими потолками, огромными окнами и стилеобразующей панорамой

Идеи Вашего Дома
«Тупому и еще тупее» с Джимом Керри 30 лет. Как эта дурацкая комедия на грани стала знаковой и любимой «Тупому и еще тупее» с Джимом Керри 30 лет. Как эта дурацкая комедия на грани стала знаковой и любимой

«Тупому и еще тупее»: история создания фильма и его значимость для жанра

Правила жизни
9 признаков того, что вы едите излишне много соли 9 признаков того, что вы едите излишне много соли

Что указывает на большое количество соли в организме, и как это исправить

ТехИнсайдер
Дмитрий Чеботарев: «Мой персонаж не пыльный» Дмитрий Чеботарев: «Мой персонаж не пыльный»

Дмитрий Чеботарев рассказал о погружении в физику и секретных объектах

Grazia
Сказочный разворот Сказочный разворот

Как мы все сегодня живем в сказке, почему это легитимно и какой в этом урок

СНОБ
Как найти общие ценности в отношениях: советы психолога Как найти общие ценности в отношениях: советы психолога

Как сделать так, чтобы собственные принципы не помешали гармонии в паре?

Psychologies
Идеальная мама — это миф: 3 способа избавиться от чувства вины перед ребенком Идеальная мама — это миф: 3 способа избавиться от чувства вины перед ребенком

Почему женщины после рождения ребенка никогда не чувствуют себя счастливыми?

Psychologies
«В русской литературе финалом по большей части является тоска» «В русской литературе финалом по большей части является тоска»

Любовь Аркус о том, что делает финалы великими

Weekend
Границы ключ Границы ключ

Как далеко можно пускать к себе мужчину на разных этапах отношений?

VOICE
Время управлять собой: почему self-skills становятся решающими для карьеры и бизнеса Время управлять собой: почему self-skills становятся решающими для карьеры и бизнеса

Что такое self-skills и зачем они нужны в работе?

Forbes
Прикосновение дома Прикосновение дома

Из каких деталей складывается характер дома?

СНОБ
Открыть в приложении