Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Музей языков: Конрад Гесснер и книги-полиглоты XVI века» «Музей языков: Конрад Гесснер и книги-полиглоты XVI века»

Как иезуиты помогли изучению неевропейских языков

N+1
Скрежет зубовный. К чему приводит несвоевременная инициация Скрежет зубовный. К чему приводит несвоевременная инициация

Становиться «настоящими мужчинами» в 13 лет непросто, и не нужно

СНОБ
Найден способ омолодить стареющие клетки мозга Найден способ омолодить стареющие клетки мозга

Обратить старость вспять реально, причем на это понадобится всего один день

ТехИнсайдер
Лучшие квесты на ПК: топ-5 легендарных игр Лучшие квесты на ПК: топ-5 легендарных игр

5 игр-квестов, прохождение которых надолго отпечатается у вас в голове

CHIP
Как нас обманывает Disney: чем на самом деле заканчиваются популярные детские сказки Как нас обманывает Disney: чем на самом деле заканчиваются популярные детские сказки

Почти у каждой сказки, которую вы читали в детстве, есть версия 18+...

ТехИнсайдер
Осенние заготовки: копим в теле энергию, чтобы пережить зиму Осенние заготовки: копим в теле энергию, чтобы пережить зиму

Для чего нужна энергия Ци и почему зимой она становится на вес золота

Psychologies
Как менялась Елена Летучая: бьюти-эволюция телеведущей Как менялась Елена Летучая: бьюти-эволюция телеведущей

Бьюти-эволюция Елены Летучей

Cosmopolitan
«Муж отказывается вставать ночью к ребенку, и я пошла на хитрость» «Муж отказывается вставать ночью к ребенку, и я пошла на хитрость»

История героини, на которую обиделся её муж из-за ребенка

Psychologies
10 легальных антидепрессантов 10 легальных антидепрессантов

Мы собрали средства от вселенской тоски, на которые не нужен рецепт врача

Maxim
Диабет, болезни сердца и еще 2 проблемы со здоровьем, которые возникнут, если часто есть пиццу (но вред можно снизить) Диабет, болезни сердца и еще 2 проблемы со здоровьем, которые возникнут, если часто есть пиццу (но вред можно снизить)

Увлечение фастфудом опасно, но это не значит, что нужно от него отказаться

Playboy
Как голуби находят дорогу домой Как голуби находят дорогу домой

Как голуби ориентируются в сложных и меняющихся ландшафтах?

Популярная механика
Как менялась Анфиса Чехова: вес 100 кг, комплексы и фотошоп — в прошлом Как менялась Анфиса Чехова: вес 100 кг, комплексы и фотошоп — в прошлом

Снимки Анфисы Чеховой, сделанные в разные годы. Процесс преображения теледивы

VOICE
«Я не должна была рождаться». Девушка подала иск против гинеколога своей матери «Я не должна была рождаться». Девушка подала иск против гинеколога своей матери

Иви Тумбс из Скегнесса, Линкольншир, подала в суд на гинеколога своей матери

Cosmopolitan
Какие куртки сделают тебя стильной этой зимой — 8 главных моделей Какие куртки сделают тебя стильной этой зимой — 8 главных моделей

Зима близко, самое время начать готовить свой гардероб к наступлению морозов

Cosmopolitan
Максим Никулин. Под счастливой звездой Юрия Никулина Максим Никулин. Под счастливой звездой Юрия Никулина

Максим Никулин — о своем отце Юрии Никулине и судьбе, переплетенной с цирком

Коллекция. Караван историй
Кислый вулканизм охладил планету перед пермским вымиранием Кислый вулканизм охладил планету перед пермским вымиранием

Выбросы диоксида серы вызвали вулканическую зиму

N+1
Порошковое покрытие как альтернатива гель-лаку: честный отзыв редакции Cosmо Порошковое покрытие как альтернатива гель-лаку: честный отзыв редакции Cosmо

Протестировали модную технику порошкового маникюра

Cosmopolitan
Ученые нашли в изумруде новое состояние воды Ученые нашли в изумруде новое состояние воды

Физики обнаружили в каналах кристаллов берилла новое состояние воды

Популярная механика
Лыжи, природные арки и икра морских ежей: 20 вещей, которые нужно сделать на Сахалине Лыжи, природные арки и икра морских ежей: 20 вещей, которые нужно сделать на Сахалине

Сценариев покорения Сахалина миллион, но мы продегустировали его на свой лад

Playboy
Физики разобрались в стабильности стоячей молекулы Физики разобрались в стабильности стоячей молекулы

Физики выяснили причину необычного поведения молекулы кислоты

N+1
Обязательно ли завтракать? Вот что говорят исследования Обязательно ли завтракать? Вот что говорят исследования

Вокруг питания и завтрака, в частности, существует множество предубеждений

РБК
40 тонн пива и 20 тонн лимонада в месяц: основатель пивоварни из Челябинска рассказывает о своём производстве 40 тонн пива и 20 тонн лимонада в месяц: основатель пивоварни из Челябинска рассказывает о своём производстве

Антон Балыклов открыл пивоварню в 2014 году, сейчас у него два бренда напитков

VC.RU
«Не хочу тусоваться, хочу сажать цветочки» «Не хочу тусоваться, хочу сажать цветочки»

Героини статьи рассказали, как в их жизни появились «бабушкины радости»

Лиза
Как и зачем нужно регулировать новые экосистемы: советы Банку России Как и зачем нужно регулировать новые экосистемы: советы Банку России

Цифровые экосистемы играют все большую роль в новой экономике

Forbes
Не убивай кожу! Почему массаж гуаша на самом деле опасен Не убивай кожу! Почему массаж гуаша на самом деле опасен

Массаж гуаша так уж он и прост!

Cosmopolitan
Почему курага не хуже абрикоса и чем она полезна Почему курага не хуже абрикоса и чем она полезна

Курага отлично дополняет разные блюда и подходит для полезного перекуса

РБК
Задать жару Задать жару

Хого – горячее блюдо, которое подают на праздники для большой компании

Вокруг света
От «зеленого» винта: к чему приведет обсуждение экологической повестки в авиации От «зеленого» винта: к чему приведет обсуждение экологической повестки в авиации

Почему авиация почти не задействована в экологической повестке?

Forbes
Лингвисты назвали Северо-Восточный Китай прародиной трансевразийских языков Лингвисты назвали Северо-Восточный Китай прародиной трансевразийских языков

Ученые исследовали происхождение трансевразийских языков

N+1
Быстрее, выше, сильнее, беспилотнее. В каком спорте соревнуются беспилотные автомобили Быстрее, выше, сильнее, беспилотнее. В каком спорте соревнуются беспилотные автомобили

Какие у беспилотников есть состязания и как выбирают победителя?

Популярная механика
Открыть в приложении