Можливості застосування технологій OCR від Google для розпізнавання та цифровізації архівних документів

Автор(и)

DOI:

https://doi.org/10.31516/2410-5333.065.16

Ключові слова:

НТШ

Анотація

Стаття аналізує потенціал використання технологій оптичного розпізнавання символів (OCR) від Google для ефективної цифровізації архівних документів. Автор описує, як інтеграція Google Cloud Vision API може пришвидшити перетворення фізичних документів у цифровий формат, знижуючи вартість і підвищуючи доступність оцифрування для архівних установ різного масштабу. Також розглядаються переваги збільшення точності та якості оцифрованих даних, що сприяє їх подальшому науковому та освітньому використанню.

Аналіз включає огляд потенційних технічних та організаційних проблем, які можуть виникати під час упровадження OCR-технологій, зокрема сумісність систем та вимоги до безпеки даних. Пропонується розробка вебзастосунку для кінцевих користувачів, який зробить передові можливості OCR доступнішими та зручнішими для використання.

Метою дослідження є підвищення ефективності збереження інформації та забезпечення швидкого доступу до неї, зважаючи на актуальні потреби управління архівними ресурсами. Стаття також надає огляд останніх досліджень і публікацій, що демонструють ефективність Google OCR порівняно до інших продуктів і підкреслює можливості подальшого розвитку цих технологій для оптимізації процесів оцифрування в архівах.

Біографії авторів

О. Д. Красинський, Національний університет «Львівська політехніка», м. Львів

аспірант спеціальності «Інформаційна, бібліотечна та архівна справа»

О. В. Марковець, Національний університет «Львівська політехніка», м. Львів

кандидат технічних наук, доцент, завідувач кафедри соціальних комунікацій та інформаційної діяльності

Посилання

Kravets, R. B., Boiko, P. O., & Markovets, O. V. (2023). Electronic archive as a means of quick access to management information. Bibliotekoznavstvo. Dokumentoznavstvo. Informolohiia, 4, 14–21. [In Ukrainian].

“Cloud Vision API” (2024, April 15). https://cloud.google.com/vision?hl=en

“Cloud Vision pricing” (2024, April 15). https://cloud.google.com/vision/pricing#prices. [In English].

Geewax, John J. (2018). Google Cloud Platform in Action. Manning Publications. [In English].

Hegghammer, T. (2021). “OCR with Tesseract, Amazon Textract, and Google Document AI: a benchmarking experiment”. Journal of Computational Social Science (2022), 23, June 2021. [In English].

Saavedra, S. V., & Uribe, A. L. (2022). “Google Cloud Vision and Its Application in Image Processing Using a Raspberry Pi”. Communications in Computer and Information Science, 17, October 2022. [In English].

##submission.downloads##

Опубліковано

2024-06-26

Номер

Розділ

Прикладні соціокомунікаційні технології