Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что действительно влияет на уровень холестерина? Что действительно влияет на уровень холестерина?

Как снизить уровень холестерина в крови, пока не стало слишком поздно?

ТехИнсайдер
Чем полезен чай каркаде: 3 свойства Чем полезен чай каркаде: 3 свойства

Что такое чай каркаде и чем он полезен?

РБК
Как приручить маркетинг и использовать его на все 100: объясняет эксперт Дмитрий Бескромный Как приручить маркетинг и использовать его на все 100: объясняет эксперт Дмитрий Бескромный

Как развить свой продукт с помощью digital-маркетинга

VOICE
Капитан Южного океана Капитан Южного океана

История великого путешественника и первооткрывателя Джеймса Кука

Знание – сила
Планета нервных Планета нервных

Как жить в мире процветающей паники

kiozk originals
Сахарские странники – аддаксы Сахарские странники – аддаксы

Аддаксы – одно из наиболее редких млекопитающих в мире

Знание – сила
«Я показываю ту страшную жизнь, которая связана с этим дряхлым телом» «Я показываю ту страшную жизнь, которая связана с этим дряхлым телом»

Резо Гигинеишвили о своем фильме «Пациент №1»

Weekend
Очевидная премия за очевидные открытия: Клаудиа Голдин Очевидная премия за очевидные открытия: Клаудиа Голдин

Клаудиа Голдин объяснила, почему женщины зарабатывают меньше мужчин

Наука
От охотничьих пиджаков до добротного винтажа: краткая история твида От охотничьих пиджаков до добротного винтажа: краткая история твида

Самая благородная ткань — это вовсе не бархат, а традиционный британский твид

Правила жизни
Посмотрите, это же Nissan. Первый тест-драйв Oting Paladin Посмотрите, это же Nissan. Первый тест-драйв Oting Paladin

Эксперт сравнил Oting Paladin с Nissan Terra и назвал различия

РБК
Викинг в мохнатых штанах Викинг в мохнатых штанах

Рагнар Лодброк — легендарный датский конунг

Дилетант
Археолог изготовила минеральные краски палеолитическими методами Археолог изготовила минеральные краски палеолитическими методами

Археолог Ксения Степанова провела несколько полезных экспериментов

N+1
Бесстрашное величие Бесстрашное величие

Как возвышенное научилось быть смешным

Weekend
Нудный голос человека Нудный голос человека

«Убийца»: Дэвид Финчер экранизирует комикс

Weekend
Считавшегося вымершим златокрота переоткрыли спустя 80 лет Считавшегося вымершим златокрота переоткрыли спустя 80 лет

Зоологи переоткрыли златокрота Де Винтона — редкое млекопитающее

N+1
2 главные причины, почему люди занимаются «прощальным сексом» 2 главные причины, почему люди занимаются «прощальным сексом»

Почему нам кажется, что «секс на прощание» может стать подходящим финалом романа

Psychologies
Идущие за лучом Идущие за лучом

Управление мозгом с помощью света порождает много надежд и столько же опасений

Вокруг света
«Лучше один раз увидеть, чем сто раз услышать»: 100 лучших пословиц и поговорок «Лучше один раз увидеть, чем сто раз услышать»: 100 лучших пословиц и поговорок

Пословицы и поговорки — не просто красивые фразы. В них отражен опыт народа

ТехИнсайдер
Можно ли сделать квашеную капусту без соли: гипертоникам это будет интересно Можно ли сделать квашеную капусту без соли: гипертоникам это будет интересно

Одно из изысканнейших лакомств русской кухни и кладезь витаминов

ТехИнсайдер
Полина Лазарева: «Найду любой повод, чтобы пострадать» Полина Лазарева: «Найду любой повод, чтобы пострадать»

Я стою на ногах только благодаря тому, что у меня есть на кого опереться

Караван историй
Остановите передачу: комплекс жертвы, полученный по наследству Остановите передачу: комплекс жертвы, полученный по наследству

Почему большинство из нас является носителем комплекса жертвы

Psychologies
Как приготовить идеальный стейк: научный советы Как приготовить идеальный стейк: научный советы

Как превратить простой кусок мяса в шедевр

ТехИнсайдер
Только я! Только я!

Что такое эгоцентризм и как его распознать

Лиза
Высокая певческая форманта в голосах мальчиков понравилась женской аудитории Высокая певческая форманта в голосах мальчиков понравилась женской аудитории

И мужчины, и женщины распознают высокую певческую форманту в голосах

N+1
Железная проблема Железная проблема

Беспокоят слабость, выпадение волос, ломкие ногти?

Лиза
Канцерогенный фактор: можно ли заболеть раком, если работать по ночам Канцерогенный фактор: можно ли заболеть раком, если работать по ночам

Как нарушения сна связаны с онкогенными факторами?

Psychologies
«Я не видел, но лампочку поменяйте». Как пройти техосмотр — личный опыт «Я не видел, но лампочку поменяйте». Как пройти техосмотр — личный опыт

Насколько сложно пройти техосмотр?

РБК
Доступность термитов для шимпанзе долины Исса связали с сезонностью и расселением Доступность термитов для шимпанзе долины Исса связали с сезонностью и расселением

Антропологи несколько лет пробовали ловить термитов в долине Исса

N+1
«Тренировка волос»: что надо делать, чтобы мыть голову реже «Тренировка волос»: что надо делать, чтобы мыть голову реже

С какой частотой правильно мыть голову?

VOICE
Расплата за ошибки: что будет с Binance и криптоиндустрией после рекордного штрафа Расплата за ошибки: что будет с Binance и криптоиндустрией после рекордного штрафа

Подход криптобирж к клиентам может стать более жестким

Forbes
Открыть в приложении