Как устроено компьютерное зрение и насколько велики его возможности

N+1Hi-Tech

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Жажда успеха: как выжить на пути к поставленным целям Жажда успеха: как выжить на пути к поставленным целям

Как достигнуть цели и при этом не выгореть?

Psychologies
Тося Чайкина Тося Чайкина

Почему Тося Чайкина не стремится к популярности?

ЖАРА Magazine
Как начать действовать, когда нет ни сил, ни желания Как начать действовать, когда нет ни сил, ни желания

Время от времени понимаем, что в жизни нужно что-то менять, но… ничего не делаем

Psychologies
Психологи объяснили, почему после интернет-серфинга люди чувствуют себя умнее (хотя это не так) Психологи объяснили, почему после интернет-серфинга люди чувствуют себя умнее (хотя это не так)

Почему ищет Google, но умнее всех вы?

Inc.
«Что я оплакиваю»: как перестать горевать о прошлом, вырвавшись на свободу «Что я оплакиваю»: как перестать горевать о прошлом, вырвавшись на свободу

Отрывок из книги «Так можно» — о том, как позволить себе ощущение свободы

Forbes
Два по пятьдесят: истории любви длиною в жизнь Два по пятьдесят: истории любви длиною в жизнь

Фотограф Лорен Флейшман встретилась с нью-йоркскими семейными парами

Правила жизни
9 токсичных привычек, из-за которых слабеют тело и дух 9 токсичных привычек, из-за которых слабеют тело и дух

Как справиться с вредными привычками

Maxim
Сандвичи, блокчейн и боты: новые схемы бизнеса криптотрейдеров Сандвичи, блокчейн и боты: новые схемы бизнеса криптотрейдеров

Прозрачность криптовалют позволяет трейдерам наживаться на простых людях

Forbes
Испуг, страх, тревога и тревожность: чем они отличаются? Испуг, страх, тревога и тревожность: чем они отличаются?

Что отличает испуг и страх? Как отличить здоровую тревогу от нездоровой?

Psychologies
Изгой из франшизы Изгой из франшизы

«Андор»: человечный космический нуар

Weekend
Телескоп Уэбба сфотографировал, как свет звезд двигает огромные облака пыли Телескоп Уэбба сфотографировал, как свет звезд двигает огромные облака пыли

Астрономы изучили нежное прикосновение света к их пыльным юбкам редких звезд

ТехИнсайдер
Как запустить безопасный режим Windows 10 и чем это может помочь Как запустить безопасный режим Windows 10 и чем это может помочь

Все возможности запуска безопасного режима на Windows 10

CHIP
Большие перемены, разбитые мечты и отречение короля: какие предсказания сделал Нострадамус на 2023 год Большие перемены, разбитые мечты и отречение короля: какие предсказания сделал Нострадамус на 2023 год

Ряд пророчеств Нострадамуса относят к 2023 году. Чего же нам ждать?

VOICE
Пелевин, Перес-Реверте и Фаулз. 5 книг с неожиданным финалом Пелевин, Перес-Реверте и Фаулз. 5 книг с неожиданным финалом

Романы с закрученными сюжетами, объемными персонажами и неожиданными финалами

СНОБ
Когда появилась строевая подготовка и почему ею до сих пор занимаются в современной армии Когда появилась строевая подготовка и почему ею до сих пор занимаются в современной армии

«Если вы такие умные, то почему строем не ходите?»

VOICE
Где найти раритеты музейного уровня? Где найти раритеты музейного уровня?

Где продают по-настоящему редкий и актуальный винтаж?

Собака.ru
Как легко начать заниматься спортом, чтобы потом это стало рутиной? Как легко начать заниматься спортом, чтобы потом это стало рутиной?

Несколько советов, как преодолеть себя и начать заниматься спортом

ТехИнсайдер
Он облил ее кислотой, она вышла за него замуж: очень странная история любви Он облил ее кислотой, она вышла за него замуж: очень странная история любви

«Если ты не будешь моей, то и другому не достанешься»

VOICE
«Его прогнали, но он России еще понадобится!» «Его прогнали, но он России еще понадобится!»

О судьбе русского реформатора Александра Васильевича Кривошеина

Наука
Денежный вертолет: взлет и посадка Денежный вертолет: взлет и посадка

Как погасить глобальный всплеск инфляции?

Эксперт
«Мы сейчас все время в контексте окупаемости»: как меняется ресторанная индустрия «Мы сейчас все время в контексте окупаемости»: как меняется ресторанная индустрия

Светлана Дробот — о тренде на ближневосточную кухню и ведении бизнеса с мужем

Forbes
«У нас хватило ума…» «У нас хватило ума…»

Как завершалась холодная война между СССР и США?

Дилетант
Как бросить курить: подробная инструкция. Часть 2 Как бросить курить: подробная инструкция. Часть 2

Какую роль играют эмоции в никотиновой зависимости?

Psychologies
Большая перемена: зачем девелоперская группа «А101» занялась педагогическим дизайном Большая перемена: зачем девелоперская группа «А101» занялась педагогическим дизайном

Любой новый район Москвы должен быть обеспечен социальной инфраструктурой

Forbes
Очень страшные истории: Очень страшные истории:

Проникновенный и страшный рассказ о сверхопеке от Анастасии Шалунковой

VOICE
«Чувствую полную гармонию…» История болезни Достоевского «Чувствую полную гармонию…» История болезни Достоевского

Почему тайну личности Достоевского способен постичь только врач?

Наука и жизнь
Очень страшные истории: Очень страшные истории:

Страшная деревенская история от Марьяны Романовой

VOICE
Как стоицизм помогает справляться с любыми трудностями. 4 совета от древнегреческого философа Как стоицизм помогает справляться с любыми трудностями. 4 совета от древнегреческого философа

Куда же идти, когда нужна помощь прямо сейчас? Возможно, к стоикам

Inc.
«Одолеть дементора»: можно ли вылечиться от депрессии раз и навсегда? «Одолеть дементора»: можно ли вылечиться от депрессии раз и навсегда?

Реально ли полностью вылечиться от депрессии и избежать обострений в будущем?

Psychologies
Что такое FPS и пинг в играх Что такое FPS и пинг в играх

Что такое ФПС, от чего он зависит и как влияет на игровой процесс

CHIP
Открыть в приложении