Preview

Научные и технические библиотеки

Расширенный поиск

Применение тезаурусов при обработке поисковых запросов: от локального использования – к связанным данным

https://doi.org/10.33186/1027-3689-2022-12-85-103

Полный текст:

Аннотация

Тематический поиск на естественном языке является самым сложным из-за фразеологической неоднозначности. Для решения этой проблемы информационные системы могут задействовать термины из контролируемых словарей, таких как тезаурусы. Классификации, тезаурусы, системы предметных рубрик, нормативные (авторитетные) файлы рассматриваются в открытом сетевом пространстве в среде связанных открытых данных (Linked Open Data, LOD) как LOD-словари. Связи между ними позволяют обогащать (дополнять) запросы пользователей словами из других словарей и программно переходить к поиску ресурсов в системах других библиотек. В статье рассматриваются возможности практического применения тезаурусов EUROVOC и GEMET с целью расширения поисковых запросов пользователей Единого открытого архива информации ГПНТБ России (ЕОАИ), Портала электронной библиотеки (ПЭБ) Парламентской библиотеки Федерального собрания Российской Федерации и тематической базы данных «Экология: наука и технологии», записи которых могут стать потенциально связанными. В настоящей работе приводятся результаты исследования и описан характер выявленных проблем.
Статья подготовлена в рамках Государственного задания «Информационное обеспечение научных исследований учёных и специалистов на базе Открытого архива ГПНТБ России как системы агрегации научных знаний (FNEG2022-003)» на 2022–2024 гг.

Об авторах

М. В. Гончаров
ГПНТБ России; Московский государственный лингвистический университет
Россия

Гончаров Михаил Владимирович – канд. техн. наук, доцент, ведущий научный сотрудник, руководитель группы перспективных исследований и аналитического прогнозирования ГПНТБ России; доцент Московского государственного лингвистического университета

Москва



К. А. Колосов
ГПНТБ России; Московский государственный лингвистический университет
Россия

Колосов Кирилл Анатольевич – канд. техн. наук, ведущий научный сотрудник ГПНТБ России; доцент Московского государственного лингвистического университета

Москва



Е. Ф. Бычкова
ГПНТБ России
Россия

Бычкова Елена Феликсовна – ведущий научный сотрудник, руководитель группы развития проектов в области экологии и устойчивого развития

Москва



Список литературы

1. Малахов Д. А., Серебряков В. А. Модель семантического поиска на базе тезауруса // CEUR Workshop Proceedings. 2017. Vol. 2022. P. 191–196.

2. Атаева О. М., Серебряков В. А., Тучкова Н. П. Расширение предметной области информационного запроса на основе онтологии знаний цифровой библиотеки LibMeta // Научный сервис в сети Интернет. Федеральное государственное учреждение «Федеральный исследовательский центр Институт прикладной математики им. М. В. Келдыша Российской академии наук», 2019. Т. 21. С. 63–75.

3. Kechagioglou X. et al. EcoPortal: An Environment for FAIR Semantic Resources in the Ecological Domain // Proceedings. 2021. Т. 1613. С. 0073. URL: http://ceur-ws.org.

4. Добров Б. В., Лукашевич Н. В. Тезаурус РуТез как ресурс для решения задач информационного поиска // Знания – Онтологии – Теории – 2009. URL: http://ns.math.nsc.ru/conference/zont09/reports/93Dobrov-Lukashevich.pdf (дата обращения: 01.12.2022).

5. Лаврёнова О. А., Винберг А. А. Современные пользователи библиотек и пространство связанных открытых данных // Библиотековедение. 2020. Т. 69. № 3. С. 243–260.

6. Ontology Alignment Evaluation Initiative. URL: http://oaei.ontologymatching.org (дата обращения: 12.11.2022).

7. SKOS Simple Knowledge Organization System Reference. URL: https://www.w3.org/TR/skos-reference (дата обращения: 12.11.2022).

8. Rodríguez-Enríquez C. A. et al. Supply chain knowledge management: A linked databased approach using SKOS // Dyna. 2015. Vol. 82. № 194. P. 27–35.

9. Morshed A., Caracciolo C., Johannsen G., Keizer J. Thesaurus alignment for Linked Data publishing. In: Proceedings of the International Conference on Dublin Core and Metadata Applications 2011. P. 37–46. Dublin Core Metadata Initiative.

10. Гончаров М. В., Колосов К. А. Проблемы релевантности при обработке поисковых запросов к библиографическим и полнотекстовым базам данных в современных моделях обеспечения научных исследований средствами открытых архивов // Научные и технические библиотеки. 2022. № 11. С. 120–134.

11. Шрайберг Я. Л., Гончаров М. В., Колосов К. А. О разработке концепции Открытого архива информации ГПНТБ России // Научные и технические библиотеки. 2020. № 12. С. 45–58.

12. EuroVoc: Википедия. Свободная энциклопедия. URL: https://en.wikipedia.org/wiki/EuroVoc (дата обращения: 12.11.2022).

13. Москаленко Т. А., Мякова Н. А. Информационно-поисковый тезаурус Парламентской библиотеки: этапы разработки, ведение, применение и дальнейшие перспективы // Научные и технические библиотеки. 2009. № 3. С. 18–22.

14. GEMET – GEneral Multilingual Environmental Thesaurus. URL: https://www.eionet.europa.eu/gemet/en/about (дата обращения: 12.11.2022).

15. Боргоякова К. С., Бычкова Е. Ф., Земсков А. И., Кондрашева И. Ю. Библиометрический анализ научных публикаций по экологии на основе реферативной базы данных «Экология: наука и технологии» ГПНТБ России // Научные и технические библиотеки. 2017. № 10. С. 54–68.

16. Ostländer N., Lutz M. INSPIRE-ing GEMET-Enhancing Metadata Creation and Discovery // EnviroInfo. 2008. P. 212–214. URL: http://enviroinfo.eu/sites/default/files/pdfs/vol119/0212.pdf (дата обращения: 05.12.2022).

17. Francesconi E. On the future of legal publishing services in the Semantic Web // Future Internet. 2018. Vol. 10. № 6. P. 48.


Рецензия

Для цитирования:


Гончаров М.В., Колосов К.А., Бычкова Е.Ф. Применение тезаурусов при обработке поисковых запросов: от локального использования – к связанным данным. Научные и технические библиотеки. 2022;(12):85-103. https://doi.org/10.33186/1027-3689-2022-12-85-103

For citation:


Goncharov M.V., Kolosov K.A., Bychkova E.F. Applying thesauruses in expanding user search queries: From local use to linked data. Scientific and Technical Libraries. 2022;(12):85-103. (In Russ.) https://doi.org/10.33186/1027-3689-2022-12-85-103

Просмотров: 182


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1027-3689 (Print)
ISSN 2686-8601 (Online)