Алгоритмы распознавания лиц понемногу превращаются во всевидящее око

Популярная механикаHi-Tech

На лице написано

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Текст: Александр Ершов, Роман Фишман

0:00 /
786.027

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

Алгоритмы распознают образы

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ»). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Шаг 1. Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Межпланетная картография Межпланетная картография

Как реконструировать ключевые детали на поверхности далекой планеты

Популярная механика
Новые аккумуляторы для автомобилей Новые аккумуляторы для автомобилей

Инновационные технологии в мире автомобильных аккумуляторов и источников питания

CHIP
Лыжники с небес Лыжники с небес

Самолеты на лыжах, пожалуй, еще большая экзотика, чем гидросамолеты

Популярная механика
Читаем в ноябре: выбор Psychologies Читаем в ноябре: выбор Psychologies

Хотите разобраться в своих чувствах, наладить отношения с близкими и просто получить удовольствие? Начните с лучших книжных новинок месяца по версии Psychologies.

Psychologies
Летающий автомобиль Атаманова Летающий автомобиль Атаманова

Пятиместный автомобиль, первый полет которого планируется уже в сентябре

Популярная механика
Секрет фирмы Секрет фирмы

Решаем проблемы на работе

Psychologies
1990: Лихие и крутые 1990: Лихие и крутые

В январе 1991 года на Пушкинской площади открылся первый «Макдоналдс»

Esquire
Цирк одного актера Цирк одного актера

Хью Джекман о том, что понял на разных этапах жизни (спойлер: ничего не понял)

Cosmopolitan
Ураганная энергия Ураганная энергия

Как направить в мирное русло энергию ураганов

Популярная механика
Украина ТВ Украина ТВ

Как украинские студии превратились в поставщиков шоу для российского телевидения

РБК
Обманные пункты Обманные пункты

Как в России зарабатывают по-черному

Esquire
Это частная территория Это частная территория

Чем не стоит делиться с партнером

Cosmopolitan
Пока не было света Пока не было света

Предыстория солнца и солнечной системы

Популярная механика
Принц на белом коне Принц на белом коне

Алексей Фролов построил посреди донской степи курорт

Tatler
Коллективное хозяйство Коллективное хозяйство

У «Куйбышевазот» нет контролирующего акционера, но есть главный

Forbes
«Раньше был более легким на подъем» «Раньше был более легким на подъем»

Интервью с Сергеем Пускепалисом

Добрые советы
5 биографий успешных мужчин, у которых есть чему поучиться 5 биографий успешных мужчин, у которых есть чему поучиться

Это не сборники советов «Как заработать миллион» или «Стань счастливым за 21 день». Магии и готовых бизнес-рецептов на страницах этих книг тоже нет. Зато есть откровенные жизненные истории мужчин, не побоявшихся трудностей и осуществивших мечты вопреки обстоятельствам. Возможно, однажды и вам придется написать мемуары о своей выдающейся жизни. А пока читайте и берите пример.

Psychologies
И вот она нарядная И вот она нарядная

Наташа Давыдова: идеальное тело, безупречный и разнообразный стиль

Glamour
Мифы о простудных заболеваниях Мифы о простудных заболеваниях

Разбираемся с самыми распространенными заблуждениями о простуде

9 месяцев
Бросок к славе Бросок к славе

Иван Колесников сыграл легенду баскетбола Александра Белова в новой драме

Vogue
Маргарита Наскинова. Войти в клетку Маргарита Наскинова. Войти в клетку

Сумасшедшей дрессировщица Маргарита Назарова никогда не была

Караван историй
Движение в радость: почему спорт дарит позитив Движение в радость: почему спорт дарит позитив

Вы замечали, что те, кто занимается спортом, энергичнее и бодрее тех, кто предпочитает ленивые вечера на диване? По идее, все должно быть наоборот: тренировки отнимают много сил, а блаженное ничегонеделание их восстанавливает. Но все не так просто. Что происходит с мозгом, когда мы тренируемся, и что делать, если спорт не в радость?

Psychologies
Слово королевы Слово королевы

Хелен Миррен — о своей русской крови, феминизме и стиле Мелании Трамп

Vogue
Чемоданное настроение Чемоданное настроение

Куда поехать на зимние каникулы?

Psychologies
Subaru XV Subaru XV

Сдобрен ли крепкий коктейль субариста банальным качеством

АвтоМир
Громче, чем бомбы Громче, чем бомбы

Светлана Лобода рассказала нам о планах, которые надо осуществить

Glamour
Где мои подарки? Где мои подарки?

Праздник – это подарки, но что делать, если их становится слишком много?

Домашний Очаг
Смешная девчонка Смешная девчонка

Сверхновая голливудская звезда Екатерина Самсонова

Vogue
Как меня слышно? Как меня слышно?

Качество звучания автомобильных аудиосистем становится лучше, чем у домашних

Quattroruote
Хотела летать Хотела летать

Ирина Иерусалимская всегда хотела быть только стюардессой

Домашний Очаг
Открыть в приложении