Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Оцелоты подружились с опоссумами Оцелоты подружились с опоссумами

На чем держится межвидовая дружба между опоссумами и оцелотами?

N+1
Дела сердечные: какой пульс считается нормой и когда обращаться к врачу Дела сердечные: какой пульс считается нормой и когда обращаться к врачу

Разбираемся какая частота сердечных сокращений считается нормой

РБК
«Музей языков: Конрад Гесснер и книги-полиглоты XVI века» «Музей языков: Конрад Гесснер и книги-полиглоты XVI века»

Как иезуиты помогли изучению неевропейских языков

N+1
Может ли зимой начаться гроза Может ли зимой начаться гроза

Почему гроза может начаться в любое время года, даже зимой?

Популярная механика
5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов 5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов

Какие «суперспособности» станут реальностью уже к 2030 году — и какой ценой?

Maxim
Стрижка «веник»: что мы знаем о горячем hair-тренде этой зимы Стрижка «веник»: что мы знаем о горячем hair-тренде этой зимы

Чем прическа «веник» отличается от классического боба

Cosmopolitan
Самки калифорнийских кондоров принесли потомство без участия самцов Самки калифорнийских кондоров принесли потомство без участия самцов

Первый известный случай партеногенеза у калифорнийских кондоров

N+1
Будем в тонусе Будем в тонусе

Эта короткая тренировка даст нагрузку на основные группы мышц

Домашний Очаг
Стрелки котенка: легкий макияж, который идет всем и всегда получается Стрелки котенка: легкий макияж, который идет всем и всегда получается

Макияж должен быть одинаково уместен и в дневное, и в вечернее время

Cosmopolitan
Археологи раскопали в Крыму кенотаф с клинковым оружием эпохи великого переселения народов Археологи раскопали в Крыму кенотаф с клинковым оружием эпохи великого переселения народов

Символическую могилу обнаружили на памятнике Джурга-Оба

N+1
Генная терапия: как лечат генетические заболевания Генная терапия: как лечат генетические заболевания

Современная наука упорно ищет возможность «отремонтировать» мутировавшие гены

Популярная механика
Flying Phantom: невероятные яхты, которые летят по волнам Flying Phantom: невероятные яхты, которые летят по волнам

Катамараны Flying Phantom стремительно ворвались в парусный спорт

Популярная механика
Диетолог из Гарварда назвала 5 продуктов, которые стоит исключить из рациона Диетолог из Гарварда назвала 5 продуктов, которые стоит исключить из рациона

Диетолог Ума Найду: продукты, которые стоит избегать

Inc.
10 захватывающих фильмов и сериалов о  женщинах, перевернувших мир 10 захватывающих фильмов и сериалов о  женщинах, перевернувших мир

Фильмы и сериалы, которые лучше всего показывают женщин-лидеров

Cosmopolitan
Владимир Кехман — Forbes: «МХАТ им. Горького станет музыкально-драматическим театром» Владимир Кехман — Forbes: «МХАТ им. Горького станет музыкально-драматическим театром»

Владимир Кехман — о том, что будет происходить в МХАТе

Forbes
С видом на горы: 5 лучших мест для фотографирования на курорте Роза Хутор С видом на горы: 5 лучших мест для фотографирования на курорте Роза Хутор

Где сфотографироваться на Розе Хутор, чтобы гарантированно собрать урожай лайков

Cosmopolitan
Настоящая фея-крестная: главная спасительница по знаку зодиака - кто она? Настоящая фея-крестная: главная спасительница по знаку зодиака - кто она?

Кто из знаков зодиака готов всю себя положить, чтобы помочь другим

Cosmopolitan
Роалд Хоффманн: Как пережить нобелевскую премию Роалд Хоффманн: Как пережить нобелевскую премию

Роалда Хоффманна мы знаем не только как химика-теоретика

Наука и жизнь
Почему анализировать детство бывает опасно Почему анализировать детство бывает опасно

Когда стоит перестать копаться в прошлом и двигаться дальше

Psychologies
Искусство лени Искусство лени

О личной эффективности говорят все, но мало кто вспоминает о пользе безделья

Psychologies
Настасья Самбурская: «Мечтаю сыграть барби» Настасья Самбурская: «Мечтаю сыграть барби»

Настасья Самбурская — о роли мечты, кино и музыке

Лиза
Как перестать беспокоиться о том, что думают другие Как перестать беспокоиться о том, что думают другие

Как перестать волноваться из-за мнений окружающих по поводу вашей персоны

Psychologies
Монетный сор: что не так с созданной последователями Дурова криптовалютой Toncoin Монетный сор: что не так с созданной последователями Дурова криптовалютой Toncoin

Что такое Toncoin и что с ней не так?

Forbes
Истина в жене Истина в жене

«Последняя дуэль»: язвительно современный Ридли Скотт в декорациях Средневековья

Weekend
Как это будет по‑русски? Как это будет по‑русски?

В этой квартире заигрываем с традиционным русским стилем

AD
Собственными руками: как Карл-Фридрих Шойфеле изменил судьбу мануфактуру Chopard Собственными руками: как Карл-Фридрих Шойфеле изменил судьбу мануфактуру Chopard

Как Карл-Фридрих Шойфеле решился самостоятельно создавать часовые калибры

Forbes
Открытки и плакаты из советского детства к празднику 7 Ноября Открытки и плакаты из советского детства к празднику 7 Ноября

Подборка советских открыток и плакатов к 7 Ноября. Возможны приступы ностальгии

Maxim
«Последняя дуэль» Ридли Скотта: эпик о феминизме в средневековом обществе «Последняя дуэль» Ридли Скотта: эпик о феминизме в средневековом обществе

«Последняя дуэль» Ридли Скотта: исторический эпик об изнасилованной женщине

Forbes
Профессиональные «болезни» предпринимателей: что это и как с ними бороться Профессиональные «болезни» предпринимателей: что это и как с ними бороться

Чего ждать от типичных «болезней предпринимателя» и можно ли от них уберечься

Inc.
Как менялась Елена Летучая: бьюти-эволюция телеведущей Как менялась Елена Летучая: бьюти-эволюция телеведущей

Бьюти-эволюция Елены Летучей

Cosmopolitan
Открыть в приложении