Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«История России языком дворянских гербов» «История России языком дворянских гербов»

Какое изображение можно считать гербом?

N+1
Лесные соседи Лесные соседи

Едва только март начинает прогревать поля, как в воздухе начинаются брожения

Наука и жизнь
Ученые наконец-то поняли, почему от красного вина болит голова Ученые наконец-то поняли, почему от красного вина болит голова

Какие компоненты красного вина вызывают у нас головную боль?

ТехИнсайдер
Магазин приложений Aptoide: безопасна ли эта альтернатива Google Play? Магазин приложений Aptoide: безопасна ли эта альтернатива Google Play?

Безопасен ли Aptoide?

ТехИнсайдер
История мира в шести стаканах История мира в шести стаканах

Как ваши любимые напитки изменили мир

kiozk originals
След тигра След тигра

Как складывается судьба проекта «Амурский тигр»

Вокруг света
Гречка, виноград и проклятие инсулина: 10 самых распространенных мифов о диабете Гречка, виноград и проклятие инсулина: 10 самых распространенных мифов о диабете

Вы уверены, что диабет — болезнь сладкоежек?

Psychologies
Перфекционизм, равнодушие, тревога: 9 признаков скрытой депрессии — чек-лист Перфекционизм, равнодушие, тревога: 9 признаков скрытой депрессии — чек-лист

Несколько признаков депрессии, о которых нужно знать

Psychologies
Курс на юго-восток: как переехать в тропическую страну и можно ли там жить долго Курс на юго-восток: как переехать в тропическую страну и можно ли там жить долго

Разбираемся в тонкостях жизни в разных странах Юго-Восточной Азии

Forbes
«Я понял, каково потерять все деньги» «Я понял, каково потерять все деньги»

Андрей Дороничев — о том, как его стартап пережил крах Silicon Valley Bank

Inc.
7 книг о будущем 7 книг о будущем

Семь книг ученых и социологов, которые приоткроют дверь в будущее

СНОБ
Под колпаком: как травмирует материнская любовь Под колпаком: как травмирует материнская любовь

Отрывок из книги «Переживание чувств» Сьюзан Кейн

Psychologies
10 самых ядовитых змей на планете 10 самых ядовитых змей на планете

Мы инстинктивно боимся змей, и это не зря!

ТехИнсайдер
Пример страсти и воинственности: история первой леди Аргентины Эвы Перон Пример страсти и воинственности: история первой леди Аргентины Эвы Перон

Эва Перон могла жить как светская львица, но посвятила себя борьбе с бедностью

Forbes
Балаяж: 9 вариантов окрашивания волос и советы экспертов по уходу Балаяж: 9 вариантов окрашивания волос и советы экспертов по уходу

Одна из самых популярных техник осветления

РБК
Заметки натуралиста Заметки натуралиста

Какие растительные ингредиенты заменяют химические аналоги

Лиза
Бывший военный. Dodge WC26 1941 года – чудо инженерной мысли Бывший военный. Dodge WC26 1941 года – чудо инженерной мысли

Чего только не выпускал Dodge, но модель Dodge WC26 1941 года — особенная

4x4 Club
Интерьер Интерьер

Курс светотерапии в гостях у медиахудожников Евгении Годуновой и Юрия Пелина

Собака.ru
Миротворческий работник Миротворческий работник

Марина Алексеева: метаморфозы реальности

Weekend
4 типа вещей, которые нельзя носить женщинам с животиком 4 типа вещей, которые нельзя носить женщинам с животиком

Какие вещи лучше отложить подальше, если хочешь замаскировать проблемные зоны

VOICE
7 привычек, которые сохранят здоровье глаз 7 привычек, которые сохранят здоровье глаз

Повседневные привычки влияют на наши глаза гораздо сильнее, чем вы думаете

Новый очаг
Первая встреча Первая встреча

Если мы получим сигнал от братьев по разуму, то что будем делать дальше?

ТехИнсайдер
Крылатая дюжина Крылатая дюжина

У бабочек найдется чем удивить нас, кроме их знаменитой красоты!

Вокруг света
«Пора остепениться»: правда ли мы становимся интровертами с возрастом — новые доказательства «Пора остепениться»: правда ли мы становимся интровертами с возрастом — новые доказательства

Многие замечают, что со временем все больше погружаются в себя. Почему так?

Psychologies
«Кувшин здоровья»: как питаться, чтобы сохранить молодость, — план врача «Кувшин здоровья»: как питаться, чтобы сохранить молодость, — план врача

Что подразумевает план питания «Кувшин здоровья»?

Psychologies
Дмитрий Свиргунов из Cream Soda и другие звезды, жизнь которых унесла вода Дмитрий Свиргунов из Cream Soda и другие звезды, жизнь которых унесла вода

Звездные истории о том, что утонуть можно даже в собственной ванне

VOICE
Почему люди моргают? Почему люди моргают?

Для чего человеческому организму нужен механизм моргания?

ТехИнсайдер
Шедевр разночтений: в чем феномен «Черного квадрата» Шедевр разночтений: в чем феномен «Черного квадрата»

«Черный квадрат» — одна из самых загадочных картин в истории

Правила жизни
Владелец Regent — о пяти слагаемых ресторанного бизнеса и винной карте Владелец Regent — о пяти слагаемых ресторанного бизнеса и винной карте

Ресторатор Алексей Пинский — о балансе меню и нюансах составления винной карты

РБК
Недостающая деталь пазла: как ChatGPT может улучшить экономику брокеров Недостающая деталь пазла: как ChatGPT может улучшить экономику брокеров

Как ChatGPT помогает создавать дешевый контент

Forbes
Открыть в приложении