Preview

Научные и технические библиотеки

Расширенный поиск

Формирование связанных данных в модели Единого открытого архива информации ГПНТБ России (ЕОАИ) с использованием многоязычного тезауруса GEMET

https://doi.org/10.33186/1027-3689-2024-11-103-120

Аннотация

Практическое применение связанных данных в библиотечных проектах означает, с одной стороны, представление их в формате RDF для последующего использования и обработки информационными системами, а с другой – обогащение информации, выдаваемой пользователям поисковых порталов. В данном исследовании мы рассматривали вопросы, относящиеся ко второму направлению, то есть обогащению информации, формируемой при выводе результатов поиска. В качестве базового набора данных для построения связей нами использовался многоязычный тезаурус GEMET. Портал Единого открытого архива информации ГПНТБ России (ЕОАИ) разрабатывается с учётом современных технологий и тенденций в области использования связанных данных, обзор которых приводится в начале статьи. Отмечается, что, несмотря на обилие наборов данных, доступных на ресурсе облака связанных открытых данных (Linked Open Data Cloud), порталы библиотечных проектов, применяющие технологию связанных данных, используют лишь отдельные пересекающиеся между собой наборы данных.

Авторами статьи был проведён анализ записей в электронном каталоге ЕОАИ и электронном каталоге базы данных «Экология: наука и технология» с целью автоматизированного формирования связей между индексами УДК и предметными рубриками библиографических записей с концептами тезауруса GEMET. Полученные результаты показывают, что в обеих рассмотренных базах данных около 20% записей содержат предметные рубрики и индексы УДК, которые могут быть связаны с концептами тезауруса GEMET.

Наибольший интерес для практического использования на пользовательском портале представляют связи концептов тезауруса GEMET со страницами DBpedia в сети Интернет. Авторы предлагают дополнить эти связи ссылками на страницы российской онлайн-энциклопедии РУВИКИ. Эти дополнительные связи были сделаны в рабочей базе данных для верхних уровней УДК и в дальнейшем будут прописаны для всех используемых концептов тезауруса GEMET.

Об авторах

М. В. Гончаров
ГПНТБ России; Московский государственный лингвистический университет
Россия

Гончаров Михаил Владимирович – канд. техн. наук, доцент, ведущий научный сотрудник, руководитель группы перспективных исследований и аналитического прогнозирования; доцент

Москва



К. А. Колосов
ГПНТБ России; Московский государственный лингвистический университет
Россия

Колосов Кирилл Анатольевич – канд. техн. наук, ведущий научный сотрудник; доцент

Москва



Список литературы

1. Hallo M. et al. Current state of Linked Data in digital libraries // Journal of Information Science. 2016. Т. 42. № 2. С. 117–127.

2. Alvite-Diez M. L. Linked open data portals: functionalities and user experience in semantic catalogues // Online Information Review. 2021. Т. 45. № 5. С. 946–963.

3. Wang Y., Yang S. Q. Linked data technologies and what libraries have accomplished so far // International Journal of Librarianship. 2018. Т. 3. № 1. С. 3–20.

4. Zapounidou S., Sfakakis M., Papatheodorou C. Representing and integrating bibliographic information into the Semantic Web: A comparison of four conceptual models // Journal of information science. 2017. Т. 43. № 4. С. 525–553.

5. The Linked Open Data Cloud. URL: https://lod-cloud.net/ (дата обращения: 12.09.2024).

6. Grimaldi E. The evolution of Data. bnf. fr: past, present and future of the BnF linked open data project // JLIS. it. 2024. Т. 15. № 2. С. 119–133.

7. General Multilingual Environmental Thesaurus (GEMET). URL: https://www.eionet.europa.eu/gemet/en/themes/ (дата обращения: 12.09.2024).

8. Гончаров М. В., Колосов К. А. Формирование расширенных метаданных в информационной системе ЕОАИ ГПНТБ // Научные и технические библиотеки. 2023. № 11. С. 84–98.

9. Зайцева Е. М. Развитие лингвистических средств тематического поиска в библиотечно-информационных системах // Научные и технические библиотеки. 2023. № 11. С. 66–83.

10. Бычкова Е. Ф., Колосов К. А. Анализ возможностей автоматического реферирования статей на примере источников базы данных «Экология: наука и технологии» ГПНТБ России // Научные и технические библиотеки. 2023. № 10. С. 99–120.


Рецензия

Для цитирования:


Гончаров М.В., Колосов К.А. Формирование связанных данных в модели Единого открытого архива информации ГПНТБ России (ЕОАИ) с использованием многоязычного тезауруса GEMET. Научные и технические библиотеки. 2024;(11):103-120. https://doi.org/10.33186/1027-3689-2024-11-103-120

For citation:


Goncharov M.V., Kolosov K.A. Generating linked data in the model of RNPLS&T Single Open Information Archive (SOIA) using GEMET multilingual thesaurus. Scientific and Technical Libraries. 2024;(11):103-120. (In Russ.) https://doi.org/10.33186/1027-3689-2024-11-103-120

Просмотров: 144


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1027-3689 (Print)
ISSN 2686-8601 (Online)