Preview

Научные и технические библиотеки

Расширенный поиск

Разработка алгоритма автоматизации ретроконверсии для создания электронного каталога

https://doi.org/10.33186/1027-3689-2025-2-144-161

Аннотация

При создании электронных каталогов, значительно упрощающих читателям доступ к нужной информации, возникают определённые сложности. Проблемы, связанные с созданием современного цифрового фонда, особенно актуальны для библиотек, имеющих длительную историю и большие фонды хранения. В статье рассматривается вопрос расширения возможностей библиографического поиска по фондам российских библиотек на основе пополнения электронных каталогов информацией со сканов каталожных бумажных карточек. Описаны существующие способы перевода бумажных карточек в электронный каталог.

В рамках исследования были проанализированы преимущества и недостатки различных методов создания электронного каталога, а также проведён обзор различных технических средств, которые могли бы подойти для решения задачи автоматизации создания или пополнения электронного каталога. C помощью «дообучения» и применения нейронных сетей был реализован алгоритм на языке программирования Python, позволяющий выполнять задачи предобработки, локализации необходимых областей, распознавания текста и, что самое главное, конвертирование считанного текста на поля и подполя формата RUSMARC. С его помощью решение задач ретроконверсии библиографических данных происходит значительно быстрее по сравнению с ручным вводом.

Об авторах

В. А. Коробковский
Национальный исследовательский университет информационных технологий, механики и оптики
Россия

Коробковский Вадим Андреевич – студент, магистрант

Санкт-Петербург



Н. Н. Горлушкина
Национальный исследовательский университет информационных технологий, механики и оптики
Россия

Горлушкина Наталия Николаевна – канд. техн. наук, доцент

Санкт-Петербург



М. А. Белинская
Библиотека Российской академии наук
Россия

Белинская Мария Александровна – заведующая научно-исследовательским отделом информатики и
автоматизации

Санкт-Петербург



Список литературы

1. Стукалова А. А. Основные направления развития электронных каталогов ГПНТБ СО РАН // Труды ГПНТБ СО РАН. 2018. № 13–2. С. 185–192. DOI 10.20913/2618-7515-2018-2-185-192.

2. Скарук Г. А. Электронные каталоги библиотек в борьбе за пользователя: «старые» и новые подходы // Библиосфера. 2016. № 2. C. 7–15. DOI 10.20913/1815-3186-2016-2-7-15.

3. Довбня Е. В. Проблемы тематического поиска в электронном каталоге научной библиотеки: обзор исследований // Библиотековедение. 2020. № 69 (4). C. 367–374. DOI 10.25281/0869-608X-2020-69-4-367-374.

4. Белинская М. А., Елкина Н. Н. Основные задачи Библиотеки Российской академии наук в направлении от «буквы к цифре» // Буква и цифра: библиотеки на пути к цифровизации: сборник докладов Третьей научно-практической конференции «Библио Питер2022» (г. Санкт-Петербург, 6–8 апреля 2022 г.). С. 12–17. DOI 10.33186/978-5-85638-249-4-12-17.

5. Степанов В. К. Манифест библиотек цифровой эпохи. 2014. URL: http://www.calameo.com/read/0034547383b7da70af379 (дата обращения: 28.08.2024).

6. Бродовский А. И., Сбойчаков К. О., Соколовский В. В. Перспективы развития системы ИРБИС: новый продукт ИРБИС64+ // Научные и технические библиотеки. 2017. № 11. C. 65–74. DOI 10.33186/1027-3689-2017-11-65-74.

7. Российский коммуникативный формат представления библиографических записей в машиночитаемой форме (российская версия UNIMARC). URL: http://www.rusmarc.ru/rusmarc/format.html (дата обращения: 28.08.2024).

8. Скворцов В. В. Форматы MARC21, UNIMARC, RUSMARC, их настоящее и будущее. URL: http://www.rusmarc.ru/publish/mar.htm (дата обращения: 30.08.2024).

9. Вакал Т. С. Электронные библиотеки: проблемы создания и перспективы развития // Молодой учёный. 2022. № 9 (404). С. 226–228. URL: https://moluch.ru/archive/404/89221/ (дата обращения: 28.07.2024).

10. Сергеева О. В. Ретроконверсия каталогов: современный опыт и проблемы применения // Теория и практика общественно-научной информации. 2004. № 19. URL: https://cyberleninka.ru/article/n/retrokonversiya-katalogov-sovremennyy-opyt-iproblemy-primeneniya (дата обращения: 10.08.2024)

11. Ретроконверсия карточных каталогов: основные методы : методические рекомендации / Архангельская областная научная библиотека имени Н. А. Добролюбова; Отдел формирования документ. фонда и организации каталогов; [сост.: М. Ф. Зотова, К. С. Петрова]. Архангельск, 2020. 17 с. URL: https://biblioteka29.ru/upload/medialibrary/928/retrokonversiya_katalogov.pdf (дата обращения: 08.06.2024).

12. Воройский Ф. С. Организация и технология переработки карточных каталогов в машиночитаемую форму для создания электронных каталогов. URL: https://www.gpntb.ru/win/ntb/ntb99/1/f0114.html (дата обращения: 06.08.2024).

13. ЭЛАР. Сводный электронный каталог. URL: https://elar.ru/resheniya/biblioteki/elektronnyekatalogiikollektsii/svodnyyelektronnyykatalog/ (дата обращения: 15.08.2024).

14. Стукалова А. А. Ретроспективная конверсия карточных каталогов: опыт российских библиотек // Библиосфера. 2012. № 3. URL: https://cyberleninka.ru/article/n/retrospektivnaya-konversiya-kartochnyh-katalogovopyt-rossiyskih-bibliotek (дата обращения: 05.07.2024).

15. Гауссова фильтрация. URL: https://russianblogs.com/article/7930400611/ (дата обращения: 01.07.2024).

16. OpenCV Python Tutorials. Image Thresholding. URL: https://docs.opencv.org/4.x/d7/d4d/tutorialpythresholding.html (In Eng.). (дата обращения 10.07.2024).

17. Обнаружение объектов методом Оцу. URL: https://habr.com/ru/articles/112079/ (дата обращения: 10.07.2024).

18. Марцинкевич В. И., Ларионова Г. С., Терещенко В. В., Ситникова К. А., Горлушкина Н. Н. Анализ возможностей парсинга электронных текстовых документов для автоматизации нормоконтроля // Экономика. Право. Инновации. 2022. № 3. С. 39–49. DOI 10.17586/2713-1874-2022-3-39-49.

19. Ultralytics YOLOv8 Docs. URL: https://docs.ultralytics.com/ (In Eng.) (дата обращения: 18.06.2024).

20. EfficientNet PyTorch. URL: https://github.com/lukemelas/EfficientNet-PyTorch (In Eng.) (дата обращения: 18.06.2024).

21. CVAT. URL: https://www.cvat.ai/ (In Eng.) (дата обращения: 18.06.2024).

22. Shiftlab OCR. URL: https://github.com/konverner/shiftlabocr (In Eng.) (дата обращения: 25.07.2024).

23. ResNet (34, 50, 101): «остаточные» CNN для классификации изображений. URL: https://neurohive.io/ru/vidy-nejrosetej/resnet-34-50-101/#pllswitcher (дата обращения: 28.07.2024).


Рецензия

Для цитирования:


Коробковский В.А., Горлушкина Н.Н., Белинская М.А. Разработка алгоритма автоматизации ретроконверсии для создания электронного каталога. Научные и технические библиотеки. 2025;(2):144-161. https://doi.org/10.33186/1027-3689-2025-2-144-161

For citation:


Korobkovsky V.A., Gorlushkina N.N., Belinskaya M.A. Development of an algorithm for automating retroconversion for creating an electronic catalog. Scientific and Technical Libraries. 2025;(2):144-161. (In Russ.) https://doi.org/10.33186/1027-3689-2025-2-144-161

Просмотров: 190


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1027-3689 (Print)
ISSN 2686-8601 (Online)