Preview

Научные и технические библиотеки

Расширенный поиск

Оценка качества открытых данных Роспатента в контексте интеграции с отечественными информационными системами текущих исследований

https://doi.org/10.33186/1027-3689-2022-12-15-34

Полный текст:

Аннотация

Информационные системы текущих исследований (Current Research Information Systems, CRIS) агрегируют сведения о научно-исследовательских проектах организации и их финансировании, о публикациях сотрудников и объектах интеллектуальной собственности. На основе данных, представленных в CRIS, проводится наукометрический анализ, оцениваются результативность научной деятельности и инновационный потенциал организации, принимаются управленческие решения. Поэтому своевременная загрузка качественной и достоверной информации – важная задача для CRIS. Потенциальным источником сведений об объектах интеллектуальной собственности (патентах и свидетельствах о государственной регистрации) для отечественных CRIS являются открытые данные (ОД) Роспатента, которые, согласно концепции ОД, допускают автоматизированную обработку на условиях свободной лицензии (бесплатно). Исследования показывают, что, несмотря на публикацию ОД в машиночитаемых форматах, их практическое применение осложняется наличием некорректных, неполных и несогласованных записей. Поэтому перед загрузкой ОД Роспатента в CRIS требуются предварительная оценка качества данных и их улучшение, если это возможно. К настоящему времени качество ОД Роспатента исследовано по нескольким критериям: доступность, заполненность метаданных, наличие обратной связи. Оценка качества данных на уровне содержимого наборов не проводилась. Цель настоящей работы – оценить внутреннее качество наборов ОД Роспатента, включающих сведения об изобретениях, полезных моделях, промышленных образцах, программах для ЭВМ, базах данных, топологиях интегральных микросхем, в контексте интеграции этих данных с системами CRIS. Качество измерялось по следующим характеристикам: полнота, точность, согласованность, своевременность и актуальность. В результате исследования выявлены неполные, неточные и несогласованные записи.

Об авторе

В. А. Зелепухина
Астраханский государственный университет им. В. Н. Татищева
Россия

Зелепухина Виктория Андреевна – канд. техн. наук, старший научный сотрудник

Астрахань



Список литературы

1. Интеллектуальная Система Тематического Исследования Наукометрических данных. URL: https://istina.msu.ru (дата обращения: 18.03.2022).

2. SciAct – информационно-аналитическая система мониторинга и учёта научной деятельности. URL: https://sciact.ru (дата обращения: 18.03.2022).

3. Информационно-аналитическая система «Результаты научной деятельности». URL: https://science.asu.edu.ru (дата обращения: 18.03.2022).

4. Azeroual O., Saake G., Abuosba M., Schöpfel J. Quality of Research Information in RIS Databases: A Multidimensional Approach // Business Information Systems. BIS 2019. Lecture Notes in Business Information Processing. 2019. Vol. 353. P. 337–349. URL: https://doi.org/10.1007/978-3-030-20485-3_26.

5. Azeroual O., Schöpfel J. Quality Issues of CRIS Data: An Exploratory Investigation with Universities from Twelve Countries // Publications. 2019. URL: https://doi.org/10.3390/publications7010014 (дата обращения: 02.11.2022).

6. ГОСТ Р ИСО 8000-2-2019. Качество данных. Часть 2. Словарь. Москва : Стандартинформ, 2019. 12 с.

7. Васенин В. А., Афонин С. А., Зензинов А. А., Лунев К. В., Шачнев Д. А. Механизмы системы «ИСТИНА» для интеллектуального анализа состояния и стимулирования хода выполнения проектов в сфере науки и высшего образования // Научный сервис в сети Интернет. 2019. № 21. С. 210–221. URL: http://doi.org/10.20948/abrau-2019-48.

8. Открытые данные Роспатента. URL: https://rospatent.gov.ru/opendata (дата обращения: 18.03.2022).

9. Открытые реестры. URL: https://new.fips.ru/registers-web/ (дата обращения: 18.03.2022).

10. Условия использования открытых данных Роспатента / Открытая лицензия. URL: https://rospatent.gov.ru/content/uploadfiles/opendata-terms-of-use.docx (дата обращения: 18.03.2022).

11. Чесноков М. Ю. Поиск аномалий в задаче повышения качества открытых данных // Проблемы управления. 2019. № 3. С. 53–62. URL: https://doi.org/10.25728/pu.2019.3.6.

12. Sadiq S., Indulska M. Open data: Quality over quantity // International Journal of Information Management. 2017. Vol. 37 (3). P. 150–154. URL: https://doi.org/10.1016/j.ijinfomgt.2017.01.003.

13. Torchiano M., Vetrò A., Iuliano F. Preserving the benefits of Open Government Data by measuring and improving their quality: an empirical study // 2017 IEEE 41st Annual Computer Software and Applications Conference (COMPSAC). 2017. Vol. 1. P. 144–153. URL: https://doi.org/10.1109/COMPSAC.2017.192.

14. Vetrò A., Canova L., Torchiano M., Minotas C. O., Iemma R., Morando F. Open data quality measurement framework: Definition and application to Open Government Data // Government Information Quarterly. 2016. Vol. 33 (2). P. 325–337. URL: http://doi.org/10.1016/j.giq.2016.02.001.

15. Rula A., Maurino A., Batini C. Data quality issues in linked open data // Data and information quality. 2016. P. 87–112. URL: https://doi.org/10.1007/978-3-319-24106-7_4.

16. Открытость государства в России – 2021. URL: https://ach.gov.ru/upload/pdf/Otkrytost-2021.pdf (дата обращения: 18.03.2022).

17. Российский сервер Еspacenet. URL: https://ru.espacenet.com (дата обращения: 18.03.2022).

18. Поисковая система Designview. URL: https://www.tmdn.org/tmdsviewweb/welcome#/dsview (дата обращения: 18.03.2022).

19. Поисковая система Google Patents. URL: https://patents.google.com (дата обращения: 18.03.2022).

20. Яндекс.Патенты – поиск по патентным документам. URL: https://yandex.ru/patents (дата обращения: 18.03.2022).

21. eLIBRARY.RU. Поиск патентов. URL: https://elibrary.ru/patents.asp (дата обращения: 18.03.2022).

22. Официальные публикации ФИПС. URL: https://www.fips.ru/publication-web/ (дата обращения: 18.03.2022).

23. Информационно-поисковая система ФИПС. URL: https://www.fips.ru/iiss/ (дата обращения: 18.03.2022).

24. Batini C. Data Quality Assessment // Encyclopedia of Database Systems. Boston: Springer, 2009. P. 608–612. URL: https://doi.org/10.1007/978-0-387-39940-9_107.

25. DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / Dama International [пер. с англ. Г. Агафонова]. Москва : Олимп-Бизнес, 2020. 828 с.

26. Mahanti R. Data Quality: Dimensions, Measurement, Strategy, Management, and Governance. Quality Press, 2019. 526 р.

27. Lee Y. W., Pipino L. L., Funk J. D., Wang R. Y. Journey to data quality. The MIT Press, 2006. 240 р.

28. Sattler Ku. Data Quality Dimensions // Encyclopedia of Database Systems. Boston: Springer, 2009. P. 612–615. URL: https://doi.org/10.1007/978-0-387-39940-9.

29. Gualo F., Rodriguez M., Verdugo J., Caballero I., Piattini M. Data quality certification using ISO/IEC 25012: Industrial experiences // Journal of Systems and Software. 2021. Vol. 176. P. 110938. URL: https://doi.org/10.1016/j.jss.2021.110938.

30. Zhao Y., Gong J., Hu Y., Liu Z., Cai L. Analysis of quality evaluation based on ISO/IEC SQuaRE series standards and its considerations // 2017 IEEE/ACIS 16th International Conference on Computer and Information Science (ICIS). 2017. P. 245–250. URL: https://doi.org/10.1109/ICIS.2017.7960001.

31. Behkamal B., Kahani M., Bagheri E., Jeremic Z. A metrics-driven approach for quality assessment of linked open data // Journal of theoretical and applied electronic commerce research. 2014. Vol. 9 (2). P. 64–79. URL: https://doi.org/10.4067/S0718-18762014000200006.

32. Liu H., Sang Z., Karali S. Approximate quality assessment with sampling approaches // 2019 International Conference on Computational Science and Computational Intelligence (CSCI). 2019. P. 1306–1311. URL: https://doi.org/10.1109/CSCI49370.2019.00244.


Рецензия

Для цитирования:


Зелепухина В.А. Оценка качества открытых данных Роспатента в контексте интеграции с отечественными информационными системами текущих исследований. Научные и технические библиотеки. 2022;(12):15-34. https://doi.org/10.33186/1027-3689-2022-12-15-34

For citation:


Zelepukhina V.A. Assesment of Rospatent open data quality within the context of integration with national current research information systems. Scientific and Technical Libraries. 2022;(12):15-34. (In Russ.) https://doi.org/10.33186/1027-3689-2022-12-15-34

Просмотров: 195


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1027-3689 (Print)
ISSN 2686-8601 (Online)