Как устроено компьютерное зрение и насколько велики его возможности

N+1Hi-Tech

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Коучинг-лидерство Коучинг-лидерство

Говори меньше, спрашивай больше и навсегда измени свой стиль управления

kiozk originals
На свою голову: правда и мифы о пересадке волос На свою голову: правда и мифы о пересадке волос

Самая достоверная информация о трансплантации волос

Правила жизни
96% руководителей больше замечают и ценят работу сотрудников в офисе, а не на удаленке 96% руководителей больше замечают и ценят работу сотрудников в офисе, а не на удаленке

Насколько важно на самом деле находиться в одном офисе с командой?

Inc.
Сандвичи, блокчейн и боты: новые схемы бизнеса криптотрейдеров Сандвичи, блокчейн и боты: новые схемы бизнеса криптотрейдеров

Прозрачность криптовалют позволяет трейдерам наживаться на простых людях

Forbes
На грани срыва: почему женщинам не прощают гнев На грани срыва: почему женщинам не прощают гнев

Как неумение сердиться приводит к плохим последствиям

Forbes
Декоративное ничтожество? Декоративное ничтожество?

Казимир Валишевский — «ничтожество», обладающее умом и ловкостью

Дилетант
Очень страшные истории: Очень страшные истории:

Отрывок из рассказа "Пустая колыбель" о страшной эпидемии

VOICE
Герман Эль Классико о клубе «Амкал», медийном футболе и будущем российского спорта Герман Эль Классико о клубе «Амкал», медийном футболе и будущем российского спорта

Почему аудитория профессиональных футбольных клубов переходит к блогерам?

Forbes
Больнее, чем удары плетью: как жилось женщинам в Иране после Исламской революции Больнее, чем удары плетью: как жилось женщинам в Иране после Исламской революции

Отрывок из книги Азара Нафиси «Читая «Лолиту» в Тегеране»

Forbes
«Жить — можно»: что делать, если вы страдаете биполярным расстройством «Жить — можно»: что делать, если вы страдаете биполярным расстройством

Что такое «биполярка» и почему шизофрения больше не приговор?

Psychologies
«Госсмех: сталинизм и комическое» «Госсмех: сталинизм и комическое»

«Госсмех: сталинизм и комическое»: какими были юмор и сатира в сталинскую эпоху

N+1
Неделя над пропастью Неделя над пропастью

Карибский кризис удивительным образом продлился ровно одну календарную неделю

Наука
Ученые доказали, что телепортация реальна Ученые доказали, что телепортация реальна

Эйнштейн, ты был не прав!

Maxim
Как вести частную практику в кризис: рекомендации супервизора для психологов и не только Как вести частную практику в кризис: рекомендации супервизора для психологов и не только

Как оставаться эмоционально устойчивым и сохранять баланс работы и отдыха?

Psychologies
Как удалить приложение с айфона: 3 способа Как удалить приложение с айфона: 3 способа

Как удалить приложение с айфона, если оно скрыто в библиотеке

CHIP
Ложь, на место Ложь, на место

Мы живем в мире, отравленном ложью

Men Today
И голова не болит И голова не болит

Иногда, чтобы выздороветь, нужно... развестись

Лиза
Пережить черную полосу: что происходит с психикой при затяжном стрессе Пережить черную полосу: что происходит с психикой при затяжном стрессе

Что происходит с психикой, когда стресс и неопределенность становятся затяжными?

Forbes
«Ты ведьма, высосала мои творческие силы»: история одного абьюзивного союза «Ты ведьма, высосала мои творческие силы»: история одного абьюзивного союза

Отрывок из книги «Но человека человек» — четыре повести с несчастливым концом

Forbes
«Его прогнали, но он России еще понадобится!» «Его прогнали, но он России еще понадобится!»

О судьбе русского реформатора Александра Васильевича Кривошеина

Наука
7 фильмов, на съемках которых издевались над массовкой 7 фильмов, на съемках которых издевались над массовкой

Иногда статистам приходится проходить буквально через огонь и воду

Maxim
Рассказ Ромы Зверя о том, как музыка объединила и трагически разлучила его с одним человеком и что дала взамен Рассказ Ромы Зверя о том, как музыка объединила и трагически разлучила его с одним человеком и что дала взамен

Рома Зверь — о том, как он впервые соприкоснулся с музыкой и куда она его повела

Правила жизни
15 фактов о котах, которые ты, скорее всего, не знал 15 фактов о котах, которые ты, скорее всего, не знал

Котофактные данные, которые пушистые животные сами ни за что тебе не расскажут

Maxim
Как управлять стрессом — своим и ребенка: советы родителям Как управлять стрессом — своим и ребенка: советы родителям

Как не позволить стрессу разрушить ваши отношения с ребенком?

Psychologies
Между свободой и концлагерем: зачем нацисты создавали гетто и что в них происходило Между свободой и концлагерем: зачем нацисты создавали гетто и что в них происходило

Нацисты стремились не только уничтожить евреев, но сделать процесс «эффективным»

Forbes
Как узнать авангардиста. Чек-лист Как узнать авангардиста. Чек-лист

Чем авангард и авангардисты отличаются от других направлений в искусстве

СНОБ
Может ли солнечная буря оставить всю Землю без интернета? Может ли солнечная буря оставить всю Землю без интернета?

Какой мощности нужна солнечная буря, чтобы вырубить всю Сеть на Земле

ТехИнсайдер
Секреты Терракотовой армии: 5 удивительных фактов о величайшей археологической находке Секреты Терракотовой армии: 5 удивительных фактов о величайшей археологической находке

Ученые исследуют глиняных воинов императора Цинь Шихуанди уже почти полвека

Maxim
«У китайцев есть ощущение, что западному миру их не понять» «У китайцев есть ощущение, что западному миру их не понять»

Китаист Бронислав Виногородский — на каких условиях возможен разворот на Восток?

Правила жизни
Как инвестировать в современное искусство — от классического до NFT Как инвестировать в современное искусство — от классического до NFT

Делимся знаниями, без которых в мире коллекционирования не обойтись

РБК
Открыть в приложении