Алгоритмы распознавания лиц понемногу превращаются во всевидящее око

Популярная механикаHi-Tech

На лице написано

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Текст: Александр Ершов, Роман Фишман

0:00 /
786.027

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

Алгоритмы распознают образы

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ»). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Шаг 1. Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Слайд-шоу Слайд-шоу

Самолет будущего, экологичный электрокар и другие новые разработки

Популярная механика
Skoda Karoq Skoda Karoq

Karoq отлично подошел бы для нашей страны

АвтоМир
Довести промышленность до автоматизма Довести промышленность до автоматизма

Каким образом будет формироваться внутренний спрос на роботизацию в России

Монокль
Давай поговорим! Давай поговорим!

Объясни мастеру салона, что ты хочешь

Cosmopolitan
Нижний Новгород: без лишних слов Нижний Новгород: без лишних слов

Нижний Новгород – место, где «заезженные эпитеты» имеют право на жизнь

Вокруг света
Украина ТВ Украина ТВ

Как украинские студии превратились в поставщиков шоу для российского телевидения

РБК
Когда работа в радость Когда работа в радость

Кто получает больше удовольствия от работы – секретарь или топ-менеджер?

Cosmopolitan
Больше двух говорят вслух Больше двух говорят вслух

Матвей (он же рэпер Мот) и Мария Мельниковы

Glamour
Мифы о простудных заболеваниях Мифы о простудных заболеваниях

Разбираемся с самыми распространенными заблуждениями о простуде

9 месяцев
Впадаю я в экстаз Впадаю я в экстаз

Стоит ли симулировать оргазм и как без этого обойтись?

Glamour
Зачем сегодня нужна школа? Зачем сегодня нужна школа?

Задавшись этим странным вопросом, журналист Александр Мурашев отправился путешествовать по миру в поисках интересных и необычных школ. Он побывал в Грузии, Дании, Финляндии, Швеции и Франции, а впереди – знакомство с образовательными системами стран других континентов. О каждой поездке Александр рассказывает в своей онлайн-книге «Другая школа», а в интервью Psychologies автор обобщил впечатления.

Psychologies
Тор с нами Тор с нами

Бьюти-секреты и семейные ценности Криса Хемсворта

Glamour
Большая энциклопедия джентльмена. Том XVII Большая энциклопедия джентльмена. Том XVII

Гид для тех, кто не зарекается от тюрьмы, но все же не намерен туда попадать

GQ
Алла Горбунова: Вещи и ущи Алла Горбунова: Вещи и ущи

Фрагмент книги Аллы Горбуновой «Вещи и ущи»

СНОБ
Уйди, позитивный! Уйди, позитивный!

Почему пессимистом быть выгоднее

Maxim
Путь любви Путь любви

Виды, этапы и цели медитации

Yoga Journal
Сон из избы Сон из избы

Что делать, если жить с мужчиной нравится, а спать в одной кровати — неудобно?

Добрые советы
Скетч борд Скетч борд

Ирина Горбачева о мечтах и плохих сериалах, тусовках, стрессе и рабстве лампы

СНОБ
Правила жизни Райана Гослинга Правила жизни Райана Гослинга

Правила жизни Райана Гослинга

Esquire
Моя вторая мама Моя вторая мама

По количеству ролей в анекдотах свекровь, конечно, никогда не сравнится с тещей

Cosmopolitan
Тайная связь Тайная связь

Как решали проблему сохранения важных сообщений в тайне от посторонних глаз

Дилетант
4 правила разумного питания 4 правила разумного питания

В издательстве «Эксмо» вышла книга актрисы Кейт Хадсон «Просто быть счастливой. Измени себя, не изменяя себе». Одним из секретов хорошего самочувствия актриса называет здоровое питание. По ее мнению, оно базируется на четырех правилах.

Psychologies
Марина Разбежкина: Камера помогает вылечиться и выйти в другой мир Марина Разбежкина: Камера помогает вылечиться и выйти в другой мир

Марина Разбежкина — о том, как никогда не плакать

СНОБ
В надежных руках В надежных руках

Театральную программу фестиваль «Дягилев PS» открывает спектаклем «Коко Шанель»

Vogue
Письмами и светом, звуками и дымом Письмами и светом, звуками и дымом

Человечество давно решает проблему оперативной и надежной передачи информации

Дилетант
Жизнь кубанских виноделов, часть 2. Родина слонов, родина вина Жизнь кубанских виноделов, часть 2. Родина слонов, родина вина

Что запрещено виноделу и сколько бутылок красного дают за один Крымский мост

СНОБ
Ваби-саби: простенько и со вкусом Ваби-саби: простенько и со вкусом

Три упражнения, чтобы поверить в собственную уникальность

Psychologies
Сексуальная утечка Сексуальная утечка

О, средний русский мужчина, как я восхищаюсь тобой!

СНОБ
«Сначала ты молодой неуч, а через 10 лет — списанный материал». Три истории про эйджизм «Сначала ты молодой неуч, а через 10 лет — списанный материал». Три истории про эйджизм

Как пережить насмешки, хамство начальства и что делать, если тебе за сорок

СНОБ
Карьера менеджера Карьера менеджера

Как Владислав Мартынов стал предпринимателем, инвестором и блокчейн-энтузиастом

РБК
Открыть в приложении