Preview

Научные и технические библиотеки

Расширенный поиск

Особенности использования больших языковых моделей при составлении текстовых рефератов

https://doi.org/10.33186/1027-3689-2025-11-203-214

Аннотация

В условиях стремительного увеличения объёма издаваемой научной литературы автоматическое реферирование текстов с помощью технологий искусственного интеллекта становится актуальной задачей. Современные модели реферирования основаны на использовании предварительно обученных больших языковых моделей, развёртывание которых часто требует значительных аппаратных ресурсов. В то же время применение для реферирования текстов специализированных моделей, основанных на той же архитектуре трансформеров, не требует больших аппаратных ресурсов, что позволяет использовать их как на локальных серверах, так и в облачной среде со значительно меньшими затратами.

В статье приводятся результаты оценки на основе метрики ROUGE для рефератов, сформированных на больших языковых моделях MBart (специализированная модель) и T-lite (универсальная модель). Исходные текстовые массивы для анализа формировались из статей, опубликованных в журнале «Научные и технические библиотеки» в 2025 г. Проведённый анализ показал, что лучшие значения метрики ROUGE даёт использование модели MBart. Однако полученные данные не могут свидетельствовать о качестве содержания рефератов, формируемых сравниваемыми моделями, поскольку метрика ROUGE показывает лишь степень совпадения слов и фраз в реферате и эталонном тексте. Вывод авторов заключается в том, что достаточно «лёгкие» модели, такие как MBart, в библиотеках могут быть развёрнуты локально и без использования графического процессора, а это предпочтительнее для их широкого использования на практике.

Об авторах

М. В. Гончаров
ГПНТБ России
Россия

Гончаров Михаил Владимирович – канд. техн. наук, доцент, ведущий научный сотрудник, руководитель группы перспективных исследований и аналитического прогнозирования 

Москва



К. А. Колосов
ГПНТБ России
Россия

Колосов Кирилл Анатольевич – канд. техн. наук, ведущий научный сотрудник

Москва



Список литературы

1. Achkar P., Gollub T., Potthast M. Ask, Retrieve, Summarize: A Modular Pipeline for Scientific Literature Summarization // arXiv preprint arXiv:2505.16349. 2025.

2. Uckan T. A hybrid model for extractive summarization: Leveraging graph entropy to improve large language model performance // Ain Shams Engineering Journal. 2025. Vol. 16. № 5. (103348).

3. Шрайберг Я. Л., Волкова К. Ю. Вопросы авторского права в отношении произведений, созданных при помощи генеративного искусственного интеллекта // Научные и технические библиотеки. 2025. № 2. С. 115–130.

4. Lin T. et al. A survey of transformers // AI open. 2022. Vol. 3. P. 111–132.

5. Gusev I. Dataset for automatic summarization of Russian news // Conference on Artificial Intelligence and Natural Language. Cham : Springer International Publishing, 2020. P. 122–134.

6. Бычкова Е. Ф., Колосов К. А. Анализ возможностей автоматического реферирования статей на примере источников базы данных «Экология: наука и технологии» ГПНТБ России // Научные и технические библиотеки. 2023. № 10. С. 99–120.

7. Karci A. Fractional order entropy: New perspectives // Optik. 2016. Vol. 127. № 20. P. 9172–9177.

8. Lin C. Y. Rouge: A package for automatic evaluation of summaries // Text summarization branches out. 2004. P. 74–81.


Рецензия

Для цитирования:


Гончаров М.В., Колосов К.А. Особенности использования больших языковых моделей при составлении текстовых рефератов. Научные и технические библиотеки. 2025;1(11):203-214. https://doi.org/10.33186/1027-3689-2025-11-203-214

For citation:


Goncharov M.V., Kolosov K.A. Specific aspects of using large language models for text abstracting. Scientific and Technical Libraries. 2025;1(11):203-214. (In Russ.) https://doi.org/10.33186/1027-3689-2025-11-203-214

Просмотров: 19


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1027-3689 (Print)
ISSN 2686-8601 (Online)