Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему оливковое масло считается полезным Почему оливковое масло считается полезным

8 главных преимуществ оливкового масла для здоровья

ТехИнсайдер
Почему вино традиционно продается в бутылках объемом 750 мл, а не ровно литр? Почему вино традиционно продается в бутылках объемом 750 мл, а не ровно литр?

Почему винные бутылки объемом 0.75 литра стали мировым стандартом?

ТехИнсайдер
Книга на выходные: как ChatGPT стал самым эффективным копирайтером «Зерокодера» Книга на выходные: как ChatGPT стал самым эффективным копирайтером «Зерокодера»

Отрывок из книги «Искусственный интеллект: путь к новому миру»

Inc.
Новая жизнь Новая жизнь

Как прийти в себя после праздников за несколько дней

Лиза
Эмоциональный интеллект Эмоциональный интеллект

Новое представление о том, что значит быть «умным»

kiozk originals
5 популярных крещенских гаданий: польза, вред и психологический смысл 5 популярных крещенских гаданий: польза, вред и психологический смысл

Разбираем психологический смысл популярных гаданий

Psychologies
Иван Краско Иван Краско

Когда началась война, патриарху сцены Ивану Краско было 11...

Собака.ru
Право на волос Право на волос

Итак, давайте признаем: волосы для нас важны

Afternoon Seasons of life
Найдены жировые клетки, которые являются «пузырьковой защитой» организма Найдены жировые клетки, которые являются «пузырьковой защитой» организма

Группа исследователей обнаружила новый тип клеток в организме млекопитающих

ТехИнсайдер
Как забыть мужчину, который загостил вас и исчез из вашей жизни Как забыть мужчину, который загостил вас и исчез из вашей жизни

Почему резкое исчезновение партнера может стать испытанием для психики?

Psychologies
Секрет безупречного внешнего вида: 3 устройства, которые избавят вещи от складок Секрет безупречного внешнего вида: 3 устройства, которые избавят вещи от складок

Есть три прибора, которые позволяют убрать складки на одежде без усилий

CHIP
Миллионы за штопку дырок Миллионы за штопку дырок

За год белые хакеры обнаружили более 6000 уязвимостей в российских IТ-системах

Ведомости
Как Наталья Кремнева потеряла слух и зрение и создала журнал для слепоглухих людей Как Наталья Кремнева потеряла слух и зрение и создала журнал для слепоглухих людей

Как Наталья Кремнева, несмотря на инвалидность, запустила свое медиа

Forbes
Женственность и сексуальность: чем они отличаются и как их развить Женственность и сексуальность: чем они отличаются и как их развить

Психолог рассказывает о природе женственности и сексуальности

Psychologies
6 способов понять, что у вас высокий уровень кортизола 6 способов понять, что у вас высокий уровень кортизола

Неужели высокий уровень гормона стресса — распространенная проблема?

ТехИнсайдер
Санкция на «церковную революцию» Санкция на «церковную революцию»

Как Ленину предлагали включить церковное движение в переустройство России

Дилетант
Время для себя: 5 объемных романов Время для себя: 5 объемных романов

Хана, Руссо, Медведев: 5 масштабных романов

СНОБ
От мегалодона до мамонта: что, если бы животные эпохи плейстоцена дожили до наших дней От мегалодона до мамонта: что, если бы животные эпохи плейстоцена дожили до наших дней

Каким бы был мир, если бы гигантские грызуны и акулы дожили до наших дней?

ТехИнсайдер
Правда земная и правда небесная Правда земная и правда небесная

«Дочка священника не может изучать это евангелие от дьявола. Вы не возражаете?»

Дилетант
Руфь Гринько «Комната утешения». Сказка как терапия Руфь Гринько «Комната утешения». Сказка как терапия

Отрывок из повести-сказки, которая поможет пережить страшные времена

СНОБ
К гадалке не ходи: за последние четыре года продажи карт таро выросли в семь раз К гадалке не ходи: за последние четыре года продажи карт таро выросли в семь раз

Как и почему растет «гадательный» сегмент в тиражах издательств?

Forbes
No Buy 2025: что это за тренд и почему блогеры призывают отказаться от покупок на год No Buy 2025: что это за тренд и почему блогеры призывают отказаться от покупок на год

Кто и почему хочет ничего не покупать в течение всего года

Правила жизни
Тип привязанности и секс: есть ли связь? Тип привязанности и секс: есть ли связь?

Отсутствие надежной привязанности напрямую влияют на отношения с сексом

Psychologies
Точно пригодятся: 12 неожиданных способов использования фена Точно пригодятся: 12 неожиданных способов использования фена

Феном можно не только сушить волосы. Но что еще он умеет?

VOICE
Постельные сцены Постельные сцены

14 фактов о сне, которые сделают твои ночи комфортнее

Лиза
Слишком причудливая внешность: 6 животных, при виде которых, бегут мурашки Слишком причудливая внешность: 6 животных, при виде которых, бегут мурашки

Виды животных, которые природа точно не наградила красотой

ТехИнсайдер
Он же памятник! Он же памятник!

Как петербургские девелоперы проводят ревитализацию промышленных территорий

Собака.ru
Без единого шурупа Без единого шурупа

Механики СПбГУ на первой космической стройке

Санкт-Петербургский университет
Сразу две частные компании стартовали к Луне на одной ракете Сразу две частные компании стартовали к Луне на одной ракете

Две частные фирмы запустили аппараты на Луну в ракете SpaceX Falcon 9

ТехИнсайдер
«Происхождение вкусов: Как любовь к еде сделала нас людьми» «Происхождение вкусов: Как любовь к еде сделала нас людьми»

Как мозг запоминает и классифицирует запахи

N+1
Открыть в приложении