Можливості застосування технологій OCR від Google для розпізнавання та цифровізації архівних документів

О. Д. Красинський; О. В. Марковець

doi:10.31516/2410-5333.065.16

Можливості застосування технологій OCR від Google для розпізнавання та цифровізації архівних документів

Автор(и)

О. Д. Красинський Національний університет «Львівська політехніка», м. Львів, Україна https://orcid.org/0000-0002-5993-8496
О. В. Марковець Національний університет «Львівська політехніка», м. Львів, Україна https://orcid.org/0000-0001-8737-5929

DOI:

https://doi.org/10.31516/2410-5333.065.16

Ключові слова:

НТШ

Анотація

Стаття аналізує потенціал використання технологій оптичного розпізнавання символів (OCR) від Google для ефективної цифровізації архівних документів. Автор описує, як інтеграція Google Cloud Vision API може пришвидшити перетворення фізичних документів у цифровий формат, знижуючи вартість і підвищуючи доступність оцифрування для архівних установ різного масштабу. Також розглядаються переваги збільшення точності та якості оцифрованих даних, що сприяє їх подальшому науковому та освітньому використанню.

Аналіз включає огляд потенційних технічних та організаційних проблем, які можуть виникати під час упровадження OCR-технологій, зокрема сумісність систем та вимоги до безпеки даних. Пропонується розробка вебзастосунку для кінцевих користувачів, який зробить передові можливості OCR доступнішими та зручнішими для використання.

Метою дослідження є підвищення ефективності збереження інформації та забезпечення швидкого доступу до неї, зважаючи на актуальні потреби управління архівними ресурсами. Стаття також надає огляд останніх досліджень і публікацій, що демонструють ефективність Google OCR порівняно до інших продуктів і підкреслює можливості подальшого розвитку цих технологій для оптимізації процесів оцифрування в архівах.

Біографії авторів

О. Д. Красинський, Національний університет «Львівська політехніка», м. Львів

аспірант спеціальності «Інформаційна, бібліотечна та архівна справа»

О. В. Марковець, Національний університет «Львівська політехніка», м. Львів

кандидат технічних наук, доцент, завідувач кафедри соціальних комунікацій та інформаційної діяльності

Посилання

Kravets, R. B., Boiko, P. O., & Markovets, O. V. (2023). Electronic archive as a means of quick access to management information. Bibliotekoznavstvo. Dokumentoznavstvo. Informolohiia, 4, 14–21. [In Ukrainian].

“Cloud Vision API” (2024, April 15). https://cloud.google.com/vision?hl=en

“Cloud Vision pricing” (2024, April 15). https://cloud.google.com/vision/pricing#prices. [In English].

Geewax, John J. (2018). Google Cloud Platform in Action. Manning Publications. [In English].

Hegghammer, T. (2021). “OCR with Tesseract, Amazon Textract, and Google Document AI: a benchmarking experiment”. Journal of Computational Social Science (2022), 23, June 2021. [In English].

Saavedra, S. V., & Uribe, A. L. (2022). “Google Cloud Vision and Its Application in Image Processing Using a Raspberry Pi”. Communications in Computer and Information Science, 17, October 2022. [In English].

##submission.downloads##

Опубліковано

2024-06-26

Номер

№ 65 (2024)

Розділ

Прикладні соціокомунікаційні технології

Ліцензія

Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:

У разі публікації статті в збірнику «Вісник Харківської державної академії культури», автори зберігають авторське право, а також надають право журналу публікувати оригінальні наукові статті, що містять результати експериментальних і теоретичних досліджень і не знаходяться на розгляді для опублікування в інших віданнях. Всі матеріали поширюється на умовах ліцензії Creative Commons Attribution-NonCommercial-ShareAlike (BY-NC-SA), яка дозволяє першу публікацію в цьому журналі, а також розповсюдження роботи з визнанням авторства цієї роботи, на тих самих умовах, з некомерційною метою.

Автори мають підписати заяву, яка є угодою про надання прав редакції на публікацію статті в друкованому та електронному вигляді. Заява надсилається на поштову (оригінал) або електронну адресу (сканована копія) Редакції журналу.

Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.

Під час подачі рукопису статті для опублікування у збірнику «Вісник Харківської державної академії культури» автори погоджуються з тим, що, у разі прийняття статті до публікації, її можна буде розмістити в електронних архівах та базах даних з обов'язковим зазначенням авторства і збереженням авторських прав у повному обсязі за авторами. У тексті самої роботи мають бути в повному обсязі представлені джерела зовнішньої інформації – у вигляді списків джерел літератури (у т.ч. особисті раніше опубліковані роботи авторів). Автори рукопису статті зобов'язані належно оформляти запозичення у вигляді цитат або посилань. Будь-які форми плагіату неприпустимі.

Можливості застосування технологій OCR від Google для розпізнавання та цифровізації архівних документів

Автор(и)

DOI:

Ключові слова:

Анотація

Біографії авторів

О. Д. Красинський, Національний університет «Львівська політехніка», м. Львів

О. В. Марковець, Національний університет «Львівська політехніка», м. Львів

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Інформація

##plugins.block.developedBy.blockTitle##

Мова