Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Из слоновой кости и дерева: как выглядели первые зубные протезы Из слоновой кости и дерева: как выглядели первые зубные протезы

Из чего были созданы первые зубные протезы и как их носили

ТехИнсайдер
У нас есть план! У нас есть план!

Как питаться зимой, чтобы не набрать вес

Лиза
«Осторожно, в небе металлолом» — Что делают со старыми авиалайнерами «Осторожно, в небе металлолом» — Что делают со старыми авиалайнерами

Почему пассажирские авиалайнеры так рано списывают?

ТехИнсайдер
Генетики прочитали 1526 геномов бантуговорящих африканцев Генетики прочитали 1526 геномов бантуговорящих африканцев

Палеогенетики исследовали ДНК 1763 африканцев

N+1
Почему у нас нет воспоминаний из младенчества? Вот что говорит наука: интересные факты! Почему у нас нет воспоминаний из младенчества? Вот что говорит наука: интересные факты!

Почему большинство людей не помнит событий до их 2-3-летнего возраста?

ТехИнсайдер
Низкоуглеводная диета: плюсы, минусы, продукты и интересные рецепты Низкоуглеводная диета: плюсы, минусы, продукты и интересные рецепты

Низкоуглеводная диета: разбираемся в плюсах и минусах такого типа питания

РБК
Вспомнить все: 5 частых ситуаций, которые станут проще с Google Lens Вспомнить все: 5 частых ситуаций, которые станут проще с Google Lens

Сервис умного поиска по фотографиям пригодится на улице, в магазинах и в лесу

ТехИнсайдер
Африканские пингвины отличают друг друга по черным точкам на белой груди Африканские пингвины отличают друг друга по черным точкам на белой груди

Уникальный набор черных точек на тельце помогает пингвинам различать друг друга

ТехИнсайдер
Канцерогенный фактор: можно ли заболеть раком, если работать по ночам Канцерогенный фактор: можно ли заболеть раком, если работать по ночам

Как нарушения сна связаны с онкогенными факторами?

Psychologies
«Бензин самотеком не подавать»: о чем предупреждали водителей советских автобусов «Бензин самотеком не подавать»: о чем предупреждали водителей советских автобусов

Что значит надпись «бензин самотеком не подавать» и в чем минусы самотека

ТехИнсайдер
Вау-эффект Вау-эффект

Джеймс Стюарт о пользе восторга, который мы испытываем, странствуя по миру

Robb Report
5 технологий, которые появятся к 2100 году 5 технологий, которые появятся к 2100 году

В 2100 году наша жизнь будет не просто переплетена с технологиями

ТехИнсайдер
Увидеть Эверест и не умереть Увидеть Эверест и не умереть

Комфорт, отличная еда и суперсервис в Гималаях

Robb Report
«Принесшую сюрприз» ночную бабочку из Хорватии отнесли к новому роду и виду «Принесшую сюрприз» ночную бабочку из Хорватии отнесли к новому роду и виду

Энтомологи обнаружили новый род и вид ночных бабочек из Хорватии

N+1
Наше благородие Наше благородие

Попробуем найти универсальные черты «воспитанного человека»?

VOICE
Зима близко Зима близко

Чем раньше мы готовимся к горнолыжному сезону, тем лучше он пройдет!

Лиза
Как искусственный интеллект изменит школу в ближайшем будущем: проверять тетради будет не учитель Как искусственный интеллект изменит школу в ближайшем будущем: проверять тетради будет не учитель

В МГПУ разрешили использовать ИИ при подготовке квалификационных работ

ТехИнсайдер
Стеклянный небосвод вместо стеклянного потолка. Отрывок из книги о женщинах-астрономах Стеклянный небосвод вместо стеклянного потолка. Отрывок из книги о женщинах-астрономах

История первых женщин-астрономов

СНОБ
Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA

Скандалы вокруг серии игр Grand Theft Auto

СНОБ
Город с характером: куда сходить и что попробовать в столице Сибири Город с характером: куда сходить и что попробовать в столице Сибири

Достопримечательности, которые демонстрируют, как развивается Новосибирск

СНОБ
Нудный голос человека Нудный голос человека

«Убийца»: Дэвид Финчер экранизирует комикс

Weekend
Отставить панику! Что делать, если белые вещи покрасилась при стирке Отставить панику! Что делать, если белые вещи покрасилась при стирке

Можно ли спасти покрасившиеся при стирке вещи?

ТехИнсайдер
10 красивых пород кошек черно-белого окраса 10 красивых пород кошек черно-белого окраса

Хотите себе «смокинговую» кошку? Обратите внимание на эти породы

VOICE
В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp

О чем писали люди XVIII века в любовных письмах?

Правила жизни
Всем ли полезны Омега-3 Всем ли полезны Омега-3

Врачи ссылаются на то, что Омега-3 кислоты необходимы и безопасны. Так ли это?

Лиза
Гнать волну Гнать волну

Серфинг — самый романтичный и один из самых сложных видов экстремального спорта

ТехИнсайдер
Пережить шторм: 12 вопросов, чтобы понять, можно ли спасти отношения Пережить шторм: 12 вопросов, чтобы понять, можно ли спасти отношения

Как узнать, утонет ли любовь в море спокойствия?

Psychologies
Пацаны и чушпаны: как сериал «Слово пацана» исследует подростковую преступность 80-х Пацаны и чушпаны: как сериал «Слово пацана» исследует подростковую преступность 80-х

«Слово пацана»: очевидные недостатки и неочевидные достоинства сериала

Forbes
Новогодняя революция Новогодняя революция

Кубинская революция произошла в очень удобное время для последующих торжеств

Дилетант
Как работает обет на исполнение желаний: сложный, но верный способ воплотить свои мечты в 2024 году Как работает обет на исполнение желаний: сложный, но верный способ воплотить свои мечты в 2024 году

Есть ли у тебя желание, претворения которого в жизнь ты особенно жаждешь?

VOICE
Открыть в приложении