Preview

Научные и технические библиотеки

Расширенный поиск

Современные методы хранения данных в библиотеках: ключевые аспекты и решения

https://doi.org/10.33186/1027-3689-2024-8-78-97

Аннотация

В публикации рассмотрен круг вопросов, возникших перед библиотеками в связи с переводом традиционных фондов в цифровой формат, перечислены технологии для их успешного решения. Хранение научной информации в библиотеках является сложной задачей, требующей учёта множества факторов, таких как устаревание носителей и программного обеспечения, изменение конструкций устройств, совместимость форматов, безопасность данных и доступ к информации.

Подняты вопросы выбора документов для оцифровки в соответствии со спецификой библиотек и потребностями пользователей, предложены варианты подготовки данных, отобранных на хранение. Одна из основных проблем, затронутых в статье, связана с трудностями миграции данных, их потерей или повреждением в процессе переноса, неправильной конфигурации или недостаточной проверки данных перед миграцией. Сделаны выводы о перспективности поиска технологий с элементами машинного анализа и алгоритмами машинного обучения, направленными на различные сферы библиотечной деятельности, в том числе на хранение данных. Указана необходимость интеграции различных служб и ведомств в процессе перевода данных в цифровой формат.

Об авторах

Е. В. Бескаравайная
Библиотека по естественным наукам РАН
Россия

Бескаравайная Елена Вячеславовна – старший научный сотрудник

Москва



И. А. Митрошин
Библиотека по естественным наукам РАН
Россия

Митрошин Иван Андреевич – старший научный сотрудник

Москва



Список литературы

1. Zhan M., & Widén G. Understanding big data in librarianship // Journal of Librarianship and Information Science. 2019. V. 51. № 2. Pp. 561–576. DOI 10.1177/0961000617742451.

2. Bellinger G., Castro D., Mills A. Data, Information, Knowledge, and Wisdom. 2004. URL: http://courseweb.ischool.illinois.edu/~katewill/spring2011-502/502andotherreadings/bellingeronackoffdatainfoknowwisdom.pdf.

3. Frizzo-Barker J., Chow-White P. A., Mozafari M. An empirical study of the rise of big data in business scholarship // International Journal of Information Management. 2006. V. 36. № 3. Pp. 403–413.

4. Briner R. B., Denyer D., Rousseau D. M. Evidence-based management: concept cleanup time? // Academy of management perspectives. 2009. V. 23. № 4. P. 19–32.

5. Martone M. E. FORCE11: Building the Future for Research Communications and e-Scholarship // BioScience. 2015. V. 65. i. 7. P. 635. DOI 10.1093/biosci/biv095.

6. Г. М. Вихрева, О. П. Федотова. Отбор периодических изданий в фонды крупной универсальной научной библиотеки: конспект лекций для слушателей учреждений дополнительного профессионального образования (специальность 071201 «Библиотечноинформационная деятельность») / Сибирское отделение Российской академии наук, Государственная публичная научно-техническая библиотека СО РАН. Новосибирск : Государственная публичная научно-техническая библиотека СО РАН, 2010. 103 с. ISBN 978-5-94560-192-5.

7. Гуреев В. Н., Мазов Н. А. Модели и критерии отбора изданий в фонд научной библиотеки // Научные и технические библиотеки. 2015. № 7. С. 31–50.

8. Bocharova E. N., Kochukova E. V. The modern concept of selecting publications for the research library collections. Scientific and Technical Libraries. 2019. 4. С. 3–16. (In Russ.) DOI 10.33186/1027-3689-2019-4-3-16.

9. Харыбина Т. Н., Бескаравайная Е. В., Митрошин И. А. Модель исследования информационной значимости иностранных журналов // Наукометрия: методология, инструменты, практическое применение: сб. научных статей / под ред. А. И. Груши. Минск, 2018. С. 257–276.

10. Whyte A., Wilson A. How to Appraise and Select Research Data for Curation. DCC How-to Guides. Edinburgh: Digital Curation Centre. 2010. URL: dcc.ac.uk/resources/how-guides/appraise-select-data.

11. Data management costing tool and checklist, version 3, UK Data Service. UK Data Service (UKDS). 2015. URL: ukdataservice.ac.uk/manage-data/plan/costing.

12. DCC. Five steps to decide what data to keep: checklist for appraising research data // Edinburgh: Digital Curation Centre. 2014. V. 1. URL: dcc.ac.uk/resources/how-guides.

13. Tenopir C., Rice N. M., Allard S., Baird L., Borycz J., Christian L. et al. Data sharing, management, use, and reuse: Practices and perceptions of scientists worldwide // PLoS ONE. 2020. V. 15. № 3. e0229003. DOI 10.1371/journal.pone.0229003.

14. Beagrie N. What to Keep: A Jisc research data study. 2019. URL: https://apo.org.au/node/227001.

15. Залаев Г. З., Цветкова В. А. Некоторые вопросы хранения цифровой информации // НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-й научной конференции с международным участием, посвящённой 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 г. Москва : Всероссийский институт научной и технической информации РАН, 2022. С. 73–75. DOI 10.36535/2022-9785945770829-14.

16. Залаев Г. З., Каленов Н. Е., Цветкова В. А. Оцифровка документов в научных архивах и библиотеках: вопросы и ответы // НТИ. Сер. 1: Организация и методика информационной работы. 2016. № 2. С. 14–21.

17. Soohyung J., Hofman D., Youngseek K. Investigation of challenges in academic institutional repositories: A survey of academic librarians // Library Hi Tech. 2019. V. 37. № 3. Pp. 525–548.

18. Tait E. Libraries for the future: the role of IT utilities in the transformation of academic libraries // Palgrave Communications. 2016. V. 2. 16070. DOI 10.1057/palcomms.2016.70.

19. Roche D. G., Lanfear R., Binning S. A., Haff T. M., Schwanz L. E., Cain K. E. Troubleshooting Public Data Archiving: Suggestions to Increase Participation // PLoS Biology. 2014. V. 12. № 1. e1001779. DOI 10.1371/journal.pbio.1001779.

20. Salomon J. A. Stanford University School of Medicine, Stanford, CA, and accepted by the Editorial Board October 18 // PNAS. 2021. V. 118. e2111454118.

21. Xueqin Guo, Fengzhen Chen, Fei Gao, Ling Li, Ke Liu, Lijin You, Cong Hua, Fan Yang, Wanliang Liu, Chunhua Peng, Lina Wang, Xiaoxia Yang, Feiyu Zhou, Jiawei Tong, Jia Cai, Zhiyong Li, Bo Wan, Lei Zhang, Tao Yang, Minwen Zhang, Linlin Yang, Yawen Yang, Wenjun Zeng, Bo Wang, Xiaofeng Wei, Xun Xu. CNSA: a data repository for archiving omics data, Database. 2020, 2020:baaa055. DOI 10.1093/database/baaa055.

22. Fevola C., Görgen C. The mathematical research-data repository MathRepo // arXiv preprint arXiv:2202.04022. 2022. URL: https://arxiv.org/abs/2202.04022.

23. Рождественская М. Ю. Репозиторий как реализация идей открытого доступа к научным публикациям: подходы к классификации // Библиосфера. № 2. 2015. Pp. 86–94.

24. Kouper I. Professional participation in digital curation // Library & Information Science Research. 2016. Т. 38. № 3. С. 212–223.

25. Kowalczyk S. T. Digital curation for libraries and archives // Bloomsbury Publishing USA. 2018. ISBN 978-1610696319.

26. Jørn Nielsen H., Hjørland B. Curating research data: the potential roles of libraries and information professionals //Journal of documentation. 2014. Т. 70. № 2. С. 221–240.

27. Tiwari Amit. Data analytics in libraries and information centres. 2018. URL: https://www.researchgate.net/publication/327389981_data_analytics_in_libraries_and_information_centres.

28. Tercan H., Meisen T. Machine learning and deep learning based predictive quality in manufacturing: a systematic review // Journal of Intelligent Manufacturing. 2022. V. 33. Pp. 1879–1905 (2022). DOI 10.1007/s10845-022-01963-8.

29. Biswas А. Application of Data Analytics for Mapping of Library System and Services of Oxford University Library. 2023. URL: https://www.researchgate.net/publication/375447227_Application_of_Data_Analytics_for_Mapping_of_Library_System_and_Services_of_Oxford_University_Library.

30. Hsin-liang Chen, Philip Doty, Carol Mollman, Xi Niu, Jen-chien Yu, Tao Zhang. Library assessment and data analytics in the big data era: Practice and policies // Proceedings of the Association for Information Science and Technology. 2020. V. 52. I. 1. Pp. 1–4. DOI 10.1002/pra2.2015.14505201002.

31. Preza Díaz J. L. Data Science and Analytics in Libraries // Mitteilungen der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare. 2017. V. 70. P. 244. DOI 10.31263/voebm.v70i2.1796.

32. Редькина Н. С. Векторы развития научных библиотек: обзор ключевых докладов Всемирного конгресса ИФЛА 2019 г. // Библиосфера. 2020. № 2. С. 71–81. DOI 10.20913/1815-3186-2020-2-71-81.

33. Кветкина Е. А. Личный кабинет пользователя как виртуальный сервис информационного сопровождения библиотекой научно-исследовательской деятельности. Репозиторий ЦНБ НАН Беларуси. 2023. С. 136–143.

34. Горбич Л. Г. Информационная система «Web-кабинет учёного» как интерактивная электронная библиотека // Библиотеки вузов Урала: проблемы и опыт работы. 2015. В. 14. № 14. С. 70–72.

35. Митрошин И. А. Основные принципы развития сайта научной библиотеки // Научные и технические библиотеки. 2020. № 11. С. 165–184. DOI 10.33186/1027-3689-2020-11-165-184.

36. Нуриев В. А., Егорова А. Ю. Методы оценки качества машинного перевода: современное состояние, Информатика и её применение. 2021. Т. 15. В. 2. С. 104–111. DOI 10.14357/19922264210215.

37. Конев К. А. Использование методов машинного обучения в задачах принятия решений при обеспечении качества в приборостроении // Экономика. Информатика. 2022. V. 49. № 4. Pp. 820–832.

38. Веретенников И. С., Карташев Е. А., Царегородцев А. Л. Оценка качества классификации текстовых материалов с использованием алгоритма машинного обучения «Случайный лес» // Известия Алтайского государственного университета. 2017. № 4 (96). Pp. 78–83.

39. Kleijnen Jack & van Groenendaal Willem. Measuring The Quality Of Publications: New Methodology And Case Study // Inf. Process. Manage. 2000. V. 36. Pp. 551–570. DOI 10.2139/ssrn.247676.

40. Mike Thelwall. Can the quality of published academic journal articles be assessed with machine learning? Quantitative Science Studies. 2022. V 3. № 1. Pp. 208–226. DOI 10.1162/qss_a_00185.

41. Zhou J., Gandomi A. H., Chen F., Holzinger A. Evaluating the Quality of Machine Learning Explanations: A Survey on Methods and Metrics // Electronics. 2021. V. 10. P. 593. DOI 10.3390/electronics10050593.

42. Becker C., Kulovits H., Guttenbrunner M. et al. Systematic planning for digital preservation: evaluating potential strategies and building preservation plans // International Journal on Digital Libraries. 2009. V.10. Pp. 133–157 DOI:10.1007/s00799-009-0057-1.

43. Van der Hoeven J., van Wijngaarden H. Modular emulation as a long-term preservation strategy for digital objects // In: 5th International Web Archiving Workshop (IWAW05). Vienna, Austria. 2005. URL: https://api.semanticscholar.org/CorpusID:9066566.

44. Бегишев И. Р. Правовые средства обеспечения безопасности цифровых архивов в условиях внедрения технологий искусственного интеллекта // Вестник Юридического института МИИТ. 2021. № 2 (34). С. 108–116.

45. El Kafhali S., El Mir I., Hanini M. Security Threats, Defense Mechanisms, Challenges, and Future Directions in Cloud Computing // Archives of Computational Methods in Engineering. 2022. V. 29. 223–246. DOI 10.1007/s11831-021-09573-y.

46. Alcaraz C., Lopez J. Digital Twin: A Comprehensive Survey of Security Threats // IEEE Communications Surveys & Tutorials. 2022. Vol. 24. DOI 10.1109/COMST.2022.3171465.

47. Yeh P. S., Moury G. A., Armbruster P. CCSDS data compression recommendations: development and status // Applications of Digital Image Processing XXV // SPIE. 2002. V. 4790. Pp. 302–313.

48. Zierau E., Schultz M. Creating a framework for applying OAIS to distributed digital preservation // Proceedings of the 10th International Conference on Preservation of Digital Objects. 2013. Pp. 78–83.

49. Hodge G. Archiving and Preservation in Electronic Libraries // Electronic Information Management for PfP Nations. 2002. URL: https://www.researchgate.net/publication/235146965_Archiving_and_Preservation_in_Electronic_Libraries.

50. Ledoux T. Long-term preservation at the National Library of France (BnF): Scalable Preservation and Archiving Repository (SPAR) // International Preservation. 2012. Pp. 2. URL: https://irods.org/uploads/2014/06/BnF_2014_06_19_iRodsUG_BnF-ADM-2014-061850-01-p2.pdf.

51. Lounamaa K. EVA – The Acquisition and Archiving of Electronic Network Publications In Finland. 1999. URL: https://www.ercim.eu/publication/ws-proceedings/DELOS6/eva.pdf.

52. Al Noamany Y., Borghi J. A. Towards computational reproducibility: researcher perspectives on the use and sharing of software // PeerJ Computer Science. 2018. № 4. e163 DOI 10.7717/peerj-cs.163.

53. Housewright R., Schonfeld R. C., Wulfson K. US faculty survey 2012 // Ithaka S + R. 2013. Pp. 45–80. DOI 10.18665/sr.22502.


Рецензия

Для цитирования:


Бескаравайная Е.В., Митрошин И.А. Современные методы хранения данных в библиотеках: ключевые аспекты и решения. Научные и технические библиотеки. 2024;(8):78-97. https://doi.org/10.33186/1027-3689-2024-8-78-97

For citation:


Beskaravainaya E.V., Mitroshin I.A. The modern methods of data preservation in libraries. The key aspects and solutions. Scientific and Technical Libraries. 2024;(8):78-97. (In Russ.) https://doi.org/10.33186/1027-3689-2024-8-78-97

Просмотров: 544


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1027-3689 (Print)
ISSN 2686-8601 (Online)