Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Основу рациона палеоамериканки культуры Кловис составило мясо мамонтов Основу рациона палеоамериканки культуры Кловис составило мясо мамонтов

Биоархеологи проанализировали изотопный состав останков ребенка Anzick-1

N+1
Как менялась Анфиса Чехова: вес 100 кг, комплексы и фотошоп — в прошлом Как менялась Анфиса Чехова: вес 100 кг, комплексы и фотошоп — в прошлом

Снимки Анфисы Чеховой, сделанные в разные годы. Процесс преображения теледивы

VOICE
Повсеместное использование камер наблюдения меняет работу мозга Повсеместное использование камер наблюдения меняет работу мозга

Видеонаблюдение влияет на работу мозга, причем на бессознательном уровне

ТехИнсайдер
Конкуренция разработок: как новые мессенджеры завоевывают аудиторию Конкуренция разработок: как новые мессенджеры завоевывают аудиторию

Как конкурируют современные мессенджеры?

Популярная механика
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Безрассудство и отвага: история аэросаней в полярных экспедициях Безрассудство и отвага: история аэросаней в полярных экспедициях

Годы назад идея взять с собой в безлюдные места новую технику никого не смущала

Maxim
Спи в носках! Для этого есть 5 важных причин Спи в носках! Для этого есть 5 важных причин

Не вредно ли спать в носках?

Cosmopolitan
Эксперт рассказал, какие позы для сна выбирают пары с самыми крепкими отношениями Эксперт рассказал, какие позы для сна выбирают пары с самыми крепкими отношениями

А ты спишь кабанчиком или ложечками?

Playboy
«Мальчики открыли ротики». Как Оксимирон спровоцировал противостояние мужчин и разозлил женщин «Мальчики открыли ротики». Как Оксимирон спровоцировал противостояние мужчин и разозлил женщин

Оксимирон выпустил трек, который окрестили сеансом психотерапии

СНОБ
Скрежет зубовный. К чему приводит несвоевременная инициация Скрежет зубовный. К чему приводит несвоевременная инициация

Становиться «настоящими мужчинами» в 13 лет непросто, и не нужно

СНОБ
Не треснет! Почему звёзды мокпан-видео часами едят на камеру и не толстеют? Не треснет! Почему звёзды мокпан-видео часами едят на камеру и не толстеют?

В чем феномен мугбанга и почему ведущие едят и не толстеют

Cosmopolitan
Постоянство перемещения Постоянство перемещения

Елена Стафьева об объявлении темы года Hermes

Weekend
«Много тех, кто обучает качественно, но не ставит высокую цену»: сколько может зарабатывать преподаватель английского «Много тех, кто обучает качественно, но не ставит высокую цену»: сколько может зарабатывать преподаватель английского

Валерия Климова создаёт курсы и зарабатывает от 500 тысяч рублей в месяц

VC.RU
Клубничный блонд снова в моде: красим волосы как Эмма Стоун и Эми Адамс Клубничный блонд снова в моде: красим волосы как Эмма Стоун и Эми Адамс

Что такое клубничный блонд и кому он подойдет?

Cosmopolitan
Куда пропали 10 ярких звезд КВН, веселивших страну в нулевых Куда пропали 10 ярких звезд КВН, веселивших страну в нулевых

Но где сегодня Ляля из «Утомленных солнцем» или Жанка из «Пармы»?

Cosmopolitan
Как согреться: 10 способов перестать мерзнуть Как согреться: 10 способов перестать мерзнуть

Как согреться с помощью дыхания, массажа, еды и много чего еще

Cosmopolitan
Андрей Лобанов — об извилистом пути к успеху и международной школе программирования «Алгоритмика» Андрей Лобанов — об извилистом пути к успеху и международной школе программирования «Алгоритмика»

Как Андрей Лобанов основал крупнейшую в России школу программирования для детей

Esquire
Франция — Россия: бег с препятствиями Франция — Россия: бег с препятствиями

Несмотря на санкции, французский бизнес в России продолжает набирать обороты

Эксперт
Сможет ли человек жить с половиной мозга Сможет ли человек жить с половиной мозга

Возможна ли жизнь с половиной мозга и как долго она продлится?

Популярная механика
«Любимый бросил меня, когда я была беременна»: как пережить предательство? «Любимый бросил меня, когда я была беременна»: как пережить предательство?

Чем после разрыва помогут внутренний «адвокат», «прокурор» и «судья»

Psychologies
Как Чарльз Мэнсон повлиял на современную культуру: фильмы, сериалы, музыка о лидере смертоносного культа Как Чарльз Мэнсон повлиял на современную культуру: фильмы, сериалы, музыка о лидере смертоносного культа

Как Мэнсон повлиял на то, каким мы видим сегодняшний мир

Maxim
Межнациональный расчет Межнациональный расчет

Стоит ли безоглядно открывать страну для чужаков?

Эксперт
Как это вынести: кто хоронит Ленина в российском YouTube Как это вынести: кто хоронит Ленина в российском YouTube

На чьи деньги автор «Расстанного проезда 3» выносит вождя революции из мавзолея

Forbes
Химики получили соединение со связью калифорний-углерод Химики получили соединение со связью калифорний-углерод

Связь калифорний-углерод получили с помощью рентгеноструктурного анализа

N+1
Основатели сети автомоек Fast&Shine занялись IT и производством сыра, а потом стали строителями. Теперь они планируют заработать миллиарды на элитной недвижимости Основатели сети автомоек Fast&Shine занялись IT и производством сыра, а потом стали строителями. Теперь они планируют заработать миллиарды на элитной недвижимости

Аркадий Хохлов и его партнеры рассказали, как вести стройку по Scrum

Inc.
Действительно ли темная тема на компьютере экономит заряд батареи Действительно ли темная тема на компьютере экономит заряд батареи

Поможет ли переход на темную тему продлить работу ПК?

Популярная механика
Часто ходите в тренажерный зал, но не можете похудеть? Избыточные тренировки тут не при чем Часто ходите в тренажерный зал, но не можете похудеть? Избыточные тренировки тут не при чем

Частые тренировки слишком сильно стрессуют организм?

Популярная механика
Виртуальная примерочная: зачем «Яндекс» запустил продажу одежды на маркетплейсе Виртуальная примерочная: зачем «Яндекс» запустил продажу одежды на маркетплейсе

Зачем сейчас инвестировать в моду и когда люкс бренды появятся на маркетплейсах

Forbes
Стесняюсь спросить: 20 важных вопросов подологу — специалисту, который занимается лечением стоп и ногтей Стесняюсь спросить: 20 важных вопросов подологу — специалисту, который занимается лечением стоп и ногтей

20 наивных, неудобных и важных вопросов эксперту в области подологии

Esquire
Рестораторы Решетниковы: Во французской кухне очень много привычных нам блюд Рестораторы Решетниковы: Во французской кухне очень много привычных нам блюд

В центре Петербурга — на Караванной улице — открылся портал во Францию

СНОБ
Открыть в приложении