Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

9 причин есть авокадо постоянно 9 причин есть авокадо постоянно

Преимущества регулярного употребления авокадо для здоровья

ТехИнсайдер
Дикие павианы не прошли зеркальный тест Дикие павианы не прошли зеркальный тест

Исследователи провели зеркальный тест на диких медвежьих павианах

N+1
Код руды: как оптимизировать измельчение руды с помощью искусственного интеллекта Код руды: как оптимизировать измельчение руды с помощью искусственного интеллекта

Какие цифровые инструменты используются при измельчении руд

ТехИнсайдер
«Тупой телефон» — зачем люди меняют смартфоны на кнопочные устройства «Тупой телефон» — зачем люди меняют смартфоны на кнопочные устройства

Почему цифровой детокс становится трендом и как он меняет жизнь

СНОБ
5 ключей к разумному оптимизму 5 ключей к разумному оптимизму

Как видеть в жизни хорошее, не вступая в противоречие со здравым смыслом

Psychologies
Под покровительством Ньёрда Под покровительством Ньёрда

Какой Njörd 30 Cabin во время теста? Об этом бренде пока знают немногие

Y Magazine
Как не попасть на «развод» в автосалоне. 6 уловок продавцов Как не попасть на «развод» в автосалоне. 6 уловок продавцов

Названы 6 самых хитрых приемов дилеров при продаже машин

РБК
Как снять защиту записи флешки: избавляемся от ошибки «диск защищен» Как снять защиту записи флешки: избавляемся от ошибки «диск защищен»

Как снять защиту записи с флешки usb, если диск защищен?

CHIP
Ниша серийного аддитивного производства свободна Ниша серийного аддитивного производства свободна

Как неверное представление об аддитивных технологиях тормозит их внедрение

Монокль
Как искусственный интеллект меняет бьюти-индустрию Как искусственный интеллект меняет бьюти-индустрию

Как технологии ИИ ежедневно помогают бьюти-мастерам в работе?

Inc.
Плюшеголовые сойки не сумели воспользоваться инструментом Плюшеголовые сойки не сумели воспользоваться инструментом

Плюшеголовые разноцветные сойки не могут решить задачу с инструментами

N+1
Komatsu показала лунный экскаватор и подводный бульдозер Komatsu показала лунный экскаватор и подводный бульдозер

Подводный электрический робобульдозер и макет лунного беспилотного экскаватора

N+1
Микроагрессия может приводить к смерти: как она проявляется и почему так опасна? Микроагрессия может приводить к смерти: как она проявляется и почему так опасна?

Как распознать акты микроагрессии?

Psychologies
Как зарабатывать больше: 5 лайфхаков и 3 задания Как зарабатывать больше: 5 лайфхаков и 3 задания

Непросто найти человека, которого не волнует вопрос «Где взять больше денег?»

Psychologies
Иллюминаты или провокаторы? 10 загадок необычного брака Бейонсе и Джея Зи Иллюминаты или провокаторы? 10 загадок необычного брака Бейонсе и Джея Зи

О браке Бейонсе и Джей Зи ходило множество разных мистических слухов...

VOICE
Что делать, если вы стали жертвой гостинга: 5 подсказок от психолога Что делать, если вы стали жертвой гостинга: 5 подсказок от психолога

Почему люди могут внезапно пропадать из круга нашего общения?

Psychologies
Как ускорить копушу Как ускорить копушу

Как ускорить вашего копушу, не доводя до нервоза?

Лиза
Вторая жизнь Вторая жизнь

Супермодные вещи для дома, которые лучше приобретать в секонд-хенде

Лиза
Помнить все: действительно ли есть люди, которые никогда ничего не забывают? Помнить все: действительно ли есть люди, которые никогда ничего не забывают?

Способен ли человеческий мозг хранить мельчайшие подробности всей своей жизни

ТехИнсайдер
Царство янтаря: Самые удивительные находки из бирмита Царство янтаря: Самые удивительные находки из бирмита

О нескольких удивительных находках, обнаруженных в бирмитах

Наука и техника
«История России языком дворянских гербов» «История России языком дворянских гербов»

Какое изображение можно считать гербом?

N+1
Как понять, что у человека высокий интеллект Как понять, что у человека высокий интеллект

Высокий интеллект: что скрывается за этим термином?

Inc.
Хитрости, помогающие страховщикам не возмещать убытки по ОСАГО. Топ-3 Хитрости, помогающие страховщикам не возмещать убытки по ОСАГО. Топ-3

Починить автомобиль по страховке часто невозможно из-за самих страховщиков

РБК
Алиса, привет! Алиса, привет!

Бесплатные сервисы с использованием нейросетей на все случаи жизни

Лиза
Третье дыхание Третье дыхание

Уникальная профессия на стыке агронауки и арт-театра – садовая археология

Afternoon Seasons of life
«Я верю в молочку» «Я верю в молочку»

Владислав Чебурашкин о своем подходе к бизнесу и потреблении молочных продуктов

Агроинвестор
Валерий Фокин: Театр вписан в контекст времени Валерий Фокин: Театр вписан в контекст времени

Режиссер Валерий Фокин — о библейских текстах и вкусах современного зрителя

Ведомости
Полина — единственная дочь Сергея Супонева из «Зова джунглей»: как сложилась ее жизнь Полина — единственная дочь Сергея Супонева из «Зова джунглей»: как сложилась ее жизнь

Чем занимается дочь Сергея Супонева и почему она не стала заменой отцу

Maxim
Первый резидент Кима Филби Первый резидент Кима Филби

Человек по имени Хиель Рейф сыграл немалую роль в истории разведки

Дилетант
Что такое тест СМИЛ (MMPI) и для чего он нужен Что такое тест СМИЛ (MMPI) и для чего он нужен

Что такое тест СМИЛ и как его проходить правильно

РБК
Открыть в приложении