Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Из кожуры арбуза сделали ион-селективные мембраны Из кожуры арбуза сделали ион-селективные мембраны

Китайские материаловеды изготовили ион-селективные мембраны из кожуры арбуза

N+1
Как Хелен Миррен снималась в сериале «Главный подозреваемый» Как Хелен Миррен снималась в сериале «Главный подозреваемый»

Отрывок из книги Лилии Шитенбург «Хелен Миррен: Не называйте меня “мэм”»

СНОБ
Что произойдет, если бросить пакет с мусором в вулкан? Что произойдет, если бросить пакет с мусором в вулкан?

Смогут ли вулканы «переварить» весь человеческий мусор?

ТехИнсайдер
3 вида мужских манипуляций: женские истории комментируют мужчины и психолог 3 вида мужских манипуляций: женские истории комментируют мужчины и психолог

Зачем мужчины манипулируют в отношениях и как можно противостоять их приемам

Psychologies
Лисички: почему самый хитрый гриб никогда не бывает червивым Лисички: почему самый хитрый гриб никогда не бывает червивым

Что такого опасного содержится в лисичках, что червяки отказываются их есть?

ТехИнсайдер
Наталья Варлей: «Что меня держит на этой земле? Любовь» Наталья Варлей: «Что меня держит на этой земле? Любовь»

«Из этой девочки может получиться новая Любовь Орлова»

Коллекция. Караван историй
Где прячутся скрытые эмоции: 7 точек напряжения в теле — проверьте себя Где прячутся скрытые эмоции: 7 точек напряжения в теле — проверьте себя

Как различные эмоции влияют на напряжение мышц?

Psychologies
История Миры Мурати, которая работает в OpenAI и участвовала в создании ChatGPT История Миры Мурати, которая работает в OpenAI и участвовала в создании ChatGPT

Карьера Миры Мурати в мире высоких технологий

Forbes
Красная пустыня Красная пустыня

Каракумский пробег как орудие советской пропаганды

Автопилот
Как сочинить ребенку сказку за пару минут: советы родителям Как сочинить ребенку сказку за пару минут: советы родителям

Глава из книги Литы Ли «Мам, расскажи сказку! Как сочинить сказку для ребенка»

Psychologies
Как встречаться с женщиной, которая выросла без матери? Как встречаться с женщиной, которая выросла без матери?

Как выстроить отношения с женщиной, выросшей без матери

Psychologies
30 лет спустя Mercedes-Benz вспоминает свой первый G-класс с двигателем V8 30 лет спустя Mercedes-Benz вспоминает свой первый G-класс с двигателем V8

Именно он заложил основу последующего триумфа знакового внедорожника

4x4 Club
Навстречу новой жизни Навстречу новой жизни

Как разлюбить человека, если отношения зашли в тупик

Лиза
Искусственная кожа, выдерживающая экстремальный холод и убивающая микробов: теперь покров кальмаров могут носить и люди Искусственная кожа, выдерживающая экстремальный холод и убивающая микробов: теперь покров кальмаров могут носить и люди

Искусственная кожа сможет убивать бактерии и грибки

ТехИнсайдер
Как устроен гибридный автомобиль и какие виды гибридов представлены на рынке Как устроен гибридный автомобиль и какие виды гибридов представлены на рынке

Гибридный автомобиль – вещь очень модная, а для многих – еще и загадочная

ТехИнсайдер
Осторожно, женщины! Осторожно, женщины!

Коллеги, которые создают доброжелательную атмосферу, — большая удача и редкость

Лиза
Как снизить риск аллергии на орехи у ребенка? Кормите арахисом с младенчества! Как снизить риск аллергии на орехи у ребенка? Кормите арахисом с младенчества!

Распространенность аллергии на арахис в Великобритании может снизиться на 77%

ТехИнсайдер
Сколько цветов принято дарить девушке и как сделать это правильно Сколько цветов принято дарить девушке и как сделать это правильно

Изучаем нормы цветочного этикета

Maxim
Магазин приложений Aptoide: безопасна ли эта альтернатива Google Play? Магазин приложений Aptoide: безопасна ли эта альтернатива Google Play?

Безопасен ли Aptoide?

ТехИнсайдер
Не только перевал Дятлова: загадочные экспедиции, которые закончились пропажей людей Не только перевал Дятлова: загадочные экспедиции, которые закончились пропажей людей

Истории исследователей, которые пропали без вести в ходе научных экспедиций

ТехИнсайдер
Комары-самцы потянулись к людям ради знакомства с самками Комары-самцы потянулись к людям ради знакомства с самками

Почему комары, которые не пьют кровь, все равно собираются около людей?

N+1
Одержимый любовью: что зашифровал Тициан в своей картине «Любовь земная и небесная» Одержимый любовью: что зашифровал Тициан в своей картине «Любовь земная и небесная»

Отрывок из книги «Любовь и страсть в искусстве Возрождения. Ренессанс в Италии»

Forbes
Кирилл Гребенщиков: «За пять минут до начала иногда думаю: «Вот бы все отменили и не пришлось выходить на сцену!» Но потом это отступает...» Кирилл Гребенщиков: «За пять минут до начала иногда думаю: «Вот бы все отменили и не пришлось выходить на сцену!» Но потом это отступает...»

Популярность — это результат, а для меня всегда важен процесс

Караван историй
Актеры и главные герои сериала Актеры и главные герои сериала

Рассказываем о ролях и актерах турецкого сериала "Истерзанная"

VOICE
Как в мире борются с незаконным выловом кальмара Как в мире борются с незаконным выловом кальмара

Чем незаконный вылов грозит кальмарам?

СНОБ
Не верю: почему уровень религиозности снижается во всем мире и в России Не верю: почему уровень религиозности снижается во всем мире и в России

Как религия связана с благополучием?

Forbes
12 шпионов из сериалов 12 шпионов из сериалов

Дюжина самых необычных шпионов на ТВ

Weekend
Как брать, давать и не давать в долг: мужской кодекс Как брать, давать и не давать в долг: мужской кодекс

Нет ничего хуже для дружбы, чем долги. Но ситуации бывают разные

Maxim
Полина Бондарева Полина Бондарева

Полина Бондарева открывает культурный центр в здании Левашовского хлебозавода

Собака.ru
«Жизнь, которую мы создали» «Жизнь, которую мы создали»

Как 50 тысяч лет рукотворных инноваций преобразили природ

N+1
Открыть в приложении