Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ожидаемое вознаграждение управляет вниманием и решением человека Как ожидаемое вознаграждение управляет вниманием и решением человека

Концентрация внимания и выбор решения контролируются разными областями мозга

ТехИнсайдер
Аспирин в тарелке Аспирин в тарелке

Оказывается, многие продукты содержат аспирин. И добавляет его туда сама природа

Здоровье
Физическая сим-карта или eSIM: что лучше? Физическая сим-карта или eSIM: что лучше?

Разбираемся в плюсах и минусах пластиковых сим-карт и eSIM

CHIP
Вот как в Хеттской империи сохраняли языковое богатство! Археологи установили ранее неизвестный язык Вот как в Хеттской империи сохраняли языковое богатство! Археологи установили ранее неизвестный язык

Хетты использовали мультикультурализм для достижения политической стабильности

ТехИнсайдер
От Чувака до Гарфилда: 13 киногероев, которые сделали лень культовой От Чувака до Гарфилда: 13 киногероев, которые сделали лень культовой

Киногерои, чье бездействие стало зеркалом тревог и надежд целых поколений

Правила жизни
Компактное застолье Компактное застолье

Даже на небольшой кухне должно быть место, где можно уютно позавтракать

Лиза
Африка и мир: музыка нас связала Африка и мир: музыка нас связала

Банджо, маримба, сенсерро и другие инструменты, без которых невозможно обойтись

Наука
На «Титанике» и трэпе: почему Лолита Милявская свежее всех свежих На «Титанике» и трэпе: почему Лолита Милявская свежее всех свежих

Как Лолита Милявская дарит новую жизнь своим старым хитам

Правила жизни
«Женщину хотят и презирают одновременно»: почему мужчины не переносят отказ в сексе «Женщину хотят и презирают одновременно»: почему мужчины не переносят отказ в сексе

Отрывок из книги «Секс в эпоху согласия»

Psychologies
От охотничьих пиджаков до добротного винтажа: краткая история твида От охотничьих пиджаков до добротного винтажа: краткая история твида

Самая благородная ткань — это вовсе не бархат, а традиционный британский твид

Правила жизни
IPS или VA: какая матрица монитора лучше? IPS или VA: какая матрица монитора лучше?

Что лучше: IPS или VA матрица?

CHIP
«Сейчас нам предстоит битва»: зачем японские женщины становились самураями «Сейчас нам предстоит битва»: зачем японские женщины становились самураями

Японист Ольга Лебедева рассказывает о трех самых знаменитых воительницах Японии

Forbes
Выйти из тени Выйти из тени

В некоторых местах планеты бороться с нехваткой света приходится уже сейчас

Вокруг света
Утопления в Нанте Утопления в Нанте

Мрачное полотно Жозефа Обера, запечатлевшее нантские утопления

Дилетант
Бесконечная шутка: как анекдот Ридли Скотта про Наполеона затянулся на два с половиной часа Бесконечная шутка: как анекдот Ридли Скотта про Наполеона затянулся на два с половиной часа

Каким получился новый исторический эпос Ридли Скотта про Наполеона?

Правила жизни
Американка убила своего мужа, отравив его пиво, — а дочь помогла ей! Американка убила своего мужа, отравив его пиво, — а дочь помогла ей!

Как в ноябре 2022 года Эшли Джонс и Марша Аллен решились на преступление

ТехИнсайдер
Как избавиться от головной боли без лекарств: 10 рабочих способов Как избавиться от головной боли без лекарств: 10 рабочих способов

На работе застала головная боль, а таблетки нет ни у вас, ни у коллег?

ТехИнсайдер
Сервер научных статей bioRxiv поручил ИИ писать резюме. Пока не все хорошо Сервер научных статей bioRxiv поручил ИИ писать резюме. Пока не все хорошо

В bioRxiv стартовала в пилотном режиме ИИ-модель, которая может писать резюме

ТехИнсайдер
Железная Голда Железная Голда

Экранизация биографии неповторимой Голды Меир

Дилетант
Раз прошла такая пьянка Раз прошла такая пьянка

Выпивка на фоне автомобиля как жанр советской фотографии

Автопилот
«Я работаю — ты воспитываешь»: 6 фраз, которые выдают токсичного мужа и отца «Я работаю — ты воспитываешь»: 6 фраз, которые выдают токсичного мужа и отца

Какие фразы можно услышать от токсичного отца?

Psychologies
«Если бы не жена, я был бы другим человеком» «Если бы не жена, я был бы другим человеком»

Александр Степанов – о метаморфозах рэпа и песнях для Бузовой

VOICE
Правила игры на кухне Правила игры на кухне

Как родителям познакомить маленьких детей с миром большой кулинарии

Новый очаг
Свобода в союзе с гильотиной Свобода в союзе с гильотиной

Начиналась революция во Франции красиво — с Декларации прав человека

Дилетант
Как запланировать успех: 5 полезных инструментов Как запланировать успех: 5 полезных инструментов

Коуч делится инструментами достижения целей

Psychologies
Как художник Даши Намдаков стал талисманом для чиновников и бизнесменов Как художник Даши Намдаков стал талисманом для чиновников и бизнесменов

Как художник Даши Намдаков стал главным скульптором России

Forbes
Анатомия Жар-птицы Анатомия Жар-птицы

Кем могла бы быть волшебная Жар-птица с точки зрения науки?

Вокруг света
Тайная жизнь академизма Тайная жизнь академизма

Леонид Цхэ: рисование как перформанс

Weekend
7 шагов, чтобы безболезненно вернуться к бывшему партнеру 7 шагов, чтобы безболезненно вернуться к бывшему партнеру

Стоит ли дать прошлым отношениям второй шанс?

Psychologies
Горбатов Александр Горбатов Александр

Александр Горбатов — о саспенсе «Цербера» и профессии актера

Собака.ru
Открыть в приложении