Особенности использования больших языковых моделей при составлении текстовых рефератов
https://doi.org/10.33186/1027-3689-2025-11-203-214
Аннотация
В условиях стремительного увеличения объёма издаваемой научной литературы автоматическое реферирование текстов с помощью технологий искусственного интеллекта становится актуальной задачей. Современные модели реферирования основаны на использовании предварительно обученных больших языковых моделей, развёртывание которых часто требует значительных аппаратных ресурсов. В то же время применение для реферирования текстов специализированных моделей, основанных на той же архитектуре трансформеров, не требует больших аппаратных ресурсов, что позволяет использовать их как на локальных серверах, так и в облачной среде со значительно меньшими затратами.
В статье приводятся результаты оценки на основе метрики ROUGE для рефератов, сформированных на больших языковых моделях MBart (специализированная модель) и T-lite (универсальная модель). Исходные текстовые массивы для анализа формировались из статей, опубликованных в журнале «Научные и технические библиотеки» в 2025 г. Проведённый анализ показал, что лучшие значения метрики ROUGE даёт использование модели MBart. Однако полученные данные не могут свидетельствовать о качестве содержания рефератов, формируемых сравниваемыми моделями, поскольку метрика ROUGE показывает лишь степень совпадения слов и фраз в реферате и эталонном тексте. Вывод авторов заключается в том, что достаточно «лёгкие» модели, такие как MBart, в библиотеках могут быть развёрнуты локально и без использования графического процессора, а это предпочтительнее для их широкого использования на практике.
Об авторах
М. В. ГончаровРоссия
Гончаров Михаил Владимирович – канд. техн. наук, доцент, ведущий научный сотрудник, руководитель группы перспективных исследований и аналитического прогнозирования
Москва
К. А. Колосов
Россия
Колосов Кирилл Анатольевич – канд. техн. наук, ведущий научный сотрудник
Москва
Список литературы
1. Achkar P., Gollub T., Potthast M. Ask, Retrieve, Summarize: A Modular Pipeline for Scientific Literature Summarization // arXiv preprint arXiv:2505.16349. 2025.
2. Uckan T. A hybrid model for extractive summarization: Leveraging graph entropy to improve large language model performance // Ain Shams Engineering Journal. 2025. Vol. 16. № 5. (103348).
3. Шрайберг Я. Л., Волкова К. Ю. Вопросы авторского права в отношении произведений, созданных при помощи генеративного искусственного интеллекта // Научные и технические библиотеки. 2025. № 2. С. 115–130.
4. Lin T. et al. A survey of transformers // AI open. 2022. Vol. 3. P. 111–132.
5. Gusev I. Dataset for automatic summarization of Russian news // Conference on Artificial Intelligence and Natural Language. Cham : Springer International Publishing, 2020. P. 122–134.
6. Бычкова Е. Ф., Колосов К. А. Анализ возможностей автоматического реферирования статей на примере источников базы данных «Экология: наука и технологии» ГПНТБ России // Научные и технические библиотеки. 2023. № 10. С. 99–120.
7. Karci A. Fractional order entropy: New perspectives // Optik. 2016. Vol. 127. № 20. P. 9172–9177.
8. Lin C. Y. Rouge: A package for automatic evaluation of summaries // Text summarization branches out. 2004. P. 74–81.
Рецензия
Для цитирования:
Гончаров М.В., Колосов К.А. Особенности использования больших языковых моделей при составлении текстовых рефератов. Научные и технические библиотеки. 2025;1(11):203-214. https://doi.org/10.33186/1027-3689-2025-11-203-214
For citation:
Goncharov M.V., Kolosov K.A. Specific aspects of using large language models for text abstracting. Scientific and Technical Libraries. 2025;1(11):203-214. (In Russ.) https://doi.org/10.33186/1027-3689-2025-11-203-214































