Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Россия: страна, которая хочет быть другой. Двадцать пять лет — взгляд изнутри» «Россия: страна, которая хочет быть другой. Двадцать пять лет — взгляд изнутри»

Приватизация и либерализация цен изменила жизнь россиян

N+1
15-минутный город будущего или как будут жить наши потомки 15-минутный город будущего или как будут жить наши потомки

По мнению ученых и экоактивистов, будущее за компактными локациями

Playboy
Капуцины острова Хикарон обзавелись традицией похищать и носить на себе детенышей ревунов Капуцины острова Хикарон обзавелись традицией похищать и носить на себе детенышей ревунов

У капуцинов появилась традиция похищать и носить детенышей ревунов

N+1
В Германии раскопали средневековый некрополь для прокаженных В Германии раскопали средневековый некрополь для прокаженных

Археологи нашли некрополь для тяжелобольных

N+1
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Повесть о Настоящем Адвокате Повесть о Настоящем Адвокате

Адвокат Семён Ария и дело об убийстве супруг Раскиных

Дилетант
Все об антифризе: как выбрать, когда менять, от чего зависит цвет Все об антифризе: как выбрать, когда менять, от чего зависит цвет

Как правильно подобрать охлаждающую жидкость и чем опасен старый антифриз?

РБК
6 способов взбодриться, если после обеда вас клонит ко сну 6 способов взбодриться, если после обеда вас клонит ко сну

Что делать, если после еды хочется спать

Psychologies
Как выбрать косметику онлайн в «черную пятницу» и купить то, что точно подойдет Как выбрать косметику онлайн в «черную пятницу» и купить то, что точно подойдет

Онлайн-покупка косметики. На что обратить внимание

Cosmopolitan
«История одного супружества» — роман пулитцеровского лауреата о том, что мы плохо знаем тех, кого любим. Публикуем его фрагмент «История одного супружества» — роман пулитцеровского лауреата о том, что мы плохо знаем тех, кого любим. Публикуем его фрагмент

Фрагмент романа «История одного супружества» — о любви, верности и расставании

Esquire
Смена работы: как подготовиться психологически Смена работы: как подготовиться психологически

Разбираемся, как безболезненно сменить род или место деятельности

Psychologies
Сбавить обороты: 8 способов справиться со своей раздражительностью без вреда для себя и партнера Сбавить обороты: 8 способов справиться со своей раздражительностью без вреда для себя и партнера

Даже в счастливых браках супругам бывает непросто сдержать свое негодование

Лиза
Физики экспериментально обнаружили паулевскую блокировку светорассеяния Физики экспериментально обнаружили паулевскую блокировку светорассеяния

Эффект паулевской блокировки светорассеяния искали 30 лет

N+1
Диетолог из Гарварда назвала 5 продуктов, которые стоит исключить из рациона Диетолог из Гарварда назвала 5 продуктов, которые стоит исключить из рациона

Диетолог Ума Найду: продукты, которые стоит избегать

Inc.
Правила проезда перекрестков: нюансы, о которых водители забыли (+штрафы) Правила проезда перекрестков: нюансы, о которых водители забыли (+штрафы)

В таких местах водители нарушают ПДД чаще всего

РБК
«Много тех, кто обучает качественно, но не ставит высокую цену»: сколько может зарабатывать преподаватель английского «Много тех, кто обучает качественно, но не ставит высокую цену»: сколько может зарабатывать преподаватель английского

Валерия Климова создаёт курсы и зарабатывает от 500 тысяч рублей в месяц

VC.RU
Покорить вершину: такие разные истории успеха в спорте Покорить вершину: такие разные истории успеха в спорте

Подборка книг о победах и поражениях в спорте

Популярная механика
Живой детектор лжи: агент секретной службы США о мышлении пуленепробиваемых людей Живой детектор лжи: агент секретной службы США о мышлении пуленепробиваемых людей

Отрывок из книги «Стань неуязвимым» о том, как научиться распознавать ложь

Forbes
Мир моды плачет! Дизайнер Вирджил Абло умер в 41 год: каким мы его запомним Мир моды плачет! Дизайнер Вирджил Абло умер в 41 год: каким мы его запомним

История Вирджила Абло: как парень из семьи эмигрантов стал известным дизайнером?

Cosmopolitan
Ее попытка номер 5: почему из всех женихов Пэрис Хилтон мужем стал только один Ее попытка номер 5: почему из всех женихов Пэрис Хилтон мужем стал только один

Кто пытался, но так и не смог довести светскую львицу до алтаря

Cosmopolitan
Время пилингов: что важно знать об этой процедуре? Время пилингов: что важно знать об этой процедуре?

Пилинг — любимая многими процедура. Лучшее время для нее — поздняя осень и зима

Psychologies
Храм Хатшепсут оказался школой мастерства для древнеегипетских художников Храм Хатшепсут оказался школой мастерства для древнеегипетских художников

Создатели рельефов передавали свой опыт ученикам во время работ по отделке храма

N+1
YouTube-шоу, мерч и квесты: кто заработал на хайпе вокруг «Игры в кальмара» YouTube-шоу, мерч и квесты: кто заработал на хайпе вокруг «Игры в кальмара»

Сколько предприниматели и блогеры заработали на «Игре в кальмара»

Forbes
Джентльмен удачи Джентльмен удачи

Александр Цыпкин – писатель, сценарист, а с недавних пор и актер дает советы

Playboy
Как отключить быструю зарядку и зачем это нужно Как отключить быструю зарядку и зачем это нужно

Функция быстрой зарядки нужна не всегда и зачастую она лишь вредит аккумулятору

CHIP
Повелители стиля: история архитектора Евгения Коблова Повелители стиля: история архитектора Евгения Коблова

Почему сейчас дизайн квартир больше, чем просто смена обстановки

Cosmopolitan
Поехали за зимой Поехали за зимой

Куда можно отправиться за волшебным настроением по просторам России

Домашний Очаг
Теория обмана: 10 способов определить, что человек тебе врет Теория обмана: 10 способов определить, что человек тебе врет

Обманщик рассекретит себя сам, нужно только быть внимательным

Playboy
«Отсутствие силы воли помогло мне чего-то добиться в жизни». Интервью с ресторатором и телеведущим Дмитрием Левицким «Отсутствие силы воли помогло мне чего-то добиться в жизни». Интервью с ресторатором и телеведущим Дмитрием Левицким

Предприниматель и телеведущий рассказал о пользе лени

СНОБ
“Мы пытаемся, но не слышим друг друга” “Мы пытаемся, но не слышим друг друга”

Конфликтолог Олег Иванов помогает Вике и Антону разобраться в своих отношениях

Psychologies
Открыть в приложении