Разработка рекомендательной системы научных статей на основе моделей машинного обучения

  • Николай [Nikolay] Алексеевич [A.] Назаров [Nazarov]
Ключевые слова: научные рекомендательные системы, контентно-ориентированная фильтрация, RoBERTa, KeyBERT, машинное обучение

Аннотация

Представлена научная рекомендательная система (НРекС), предназначенная для повышения эффективности поиска релевантных публикаций в условиях стремительного увеличения объема научных материалов в области компьютерных наук (Computer Science). Благодаря ее применению решается проблема информационной перегрузки пользователя (специалиста-предметника) за счет реализации контентно-ориентированного подхода и применения технологий персонализированного поиска, в частности, построения профиля пользователя.

При разработке НРекС использованы современные методы машинного обучения, в том числе предобученная языковая модель RoBERTa, необходимая для тематической классификации, и модель KeyBERT, выделяющая ключевые слова публикаций. Замена полного текста научной статьи на ее векторное представление, для которого служат специально извлекаемые ключевые слова (КС), сокращает вычислительные затраты и повышает универсальность системы. Архитектура НРекС включает несколько модулей: интеграцию с открытыми электронными библиотеками, классификацию статей, генерацию КС, построение пользовательского профиля и алгоритм рекомендации. Такой модульный подход обеспечивает гибкость и позволяет наращивать функционал без значительных изменений в общей структуре системы.

Результаты апробации НРекС продемонстрировали высокое качество рекомендаций для небольших научных коллективов, ведущих исследования в предметной области компьютерных наук.

Возможности системы могут быть расширены за счет интеграции дополнительных источников научных данных, внедрения методов глубокого обучения для обработки мультимодальной информации, а также реализации механизмов интерпретируемости, что позволит обеспечить большую прозрачность и обоснованность выдаваемых рекомендаций.

Сведения об авторе

Николай [Nikolay] Алексеевич [A.] Назаров [Nazarov]

аспирант кафедры управления и интеллектуальных технологий НИУ «МЭИ», e-mail: straider105@gmail.com

Литература

1. Bornmann L., Mutz R. Growth Rates of Modern Science: a Bibliometric Analysis Based on the Number of Publications and Cited References. 2015. V. 66(11). Pp. 2215—2222.
2. Shahid A. e. a. Insights into Relevant Knowledge Extraction Techniques: a Comprehensive Review // J. Supercomputing. 2020. V. 76. Pp. 1695—1733.
3. Google Scholar [Электрон. ресурс] https://scholar.google.com (дата обращения 21.03.2025).
4. Semantic Scholar [Электрон. ресурс] https://www.semanticscholar.org (дата обращения 21.03.2025).
5. Bert D.J. Pre-training of Deep Bidirectional Transformers for Language Understanding [Электрон. ресурс] https://arxiv.org/pdf/1810.04805 (дата обращения 21.03.2025).
6. Liu Y. e. a. RoBERTa: a Robustly Optimized BERT Pretraining Approach [Электрон. ресурс] https://arxiv.org/pdf/1907.11692 (дата обращения 21.03.2025).
7. Grootendorst M. MaartenGr/KeyBERT: BibTeX» [Электрон. ресурс] https://www.maartengrootendorst.com/blog/keybert/ (дата обращения 21.03.2025).
8. Oh H., Wonkeun J., Dongil K. Attention-based Sequential Recommendation System Using Multimodal Data [Электрон. ресурс] https://arxiv.org/pdf/2405.17959 (дата обращения 21.03.2025).
9. Ng Yiu-Kai. Research Paper Recommendation Based on Content Similarity, Peer Reviews, Authority, and Popularity // Proc. IEEE XXXII Intern. Conf. Tools with Artifical Intelligence. 2020. Pp. 47—52.
10. Manning C.D., Raghavan P., Schütze H. An Introduction to Information Retrieval Cambridge: Cambridge University Press, 2009.
11. Li Z., Zou X. A Review on Personalized Academic Paper Recommendation. Computer and Information Sci. 2019. V. 12. Pp. 33—43.
12. Minaee Sh. e. a. Deep Learning Based Text Classification: a Comprehensive Review Электрон. ресурс] https://arxiv.org/pdf/2004.03705 (дата обращения 21.03.2025).
13. ArXiv [Электрон. ресурс] https://arxiv.org (дата обращения 21.03.2025).
14. The ACM Digital Library [Электрон. ресурс] https://dl.acm.org (дата обращения 21.03.2025).
15. Большакова Е.И. и др. Автоматическая обработка текстов на естественном языке и анализ данных. М.: Высшая школа экономики, 2017.
16. Bai X. e. a. Scientific Paper Recommendation: a Survey // IEEE Access. 2019. V. 7. Pp. 9324—9339.
17. Li Z., Zou X. A Review on Personalized Academic Paper Recommendation // Computer and Information Sci. 2019. V. 12. Pp. 33—43.
18. Kreutz C.K., Schenkel R. Scientific Paper Recommendation Systems: a Literature Review of recent Publications [Электрон. ресурс] https://www.researchgate.net/publication/357552714_Scientific_Paper_Recommendation_Systems_a_Literature_Review_of_recent_Publications (дата обращения 21.03.2025).
19. Gündogan E., Kaya M. A Novel Hybrid Paper Recommendation System Using Deep Learning // Scientometrics. 2022. V. 127(7). Pp. 3837—3855.
20. Козлов П.А. и др. Сравнительный анализ бинарных классификаторов на массиве научных публикаций // Заводская лаборатория. Диагностика материалов. 2022. V. 88(7). Pp. 79—87.
---
Для цитирования: Назаров Н.А. Разработка рекомендательной системы научных статей на основе моделей машинного обучения // Вестник МЭИ. 2025. № 4. С. 138—145. DOI: 10.24160/1993-6982-2025-4-138-145.
#
1. Bornmann L., Mutz R. Growth Rates of Modern Science: a Bibliometric Analysis Based on the Number of Publications and Cited References. 2015;66(11):2215—2222.
2. Shahid A. e. a. Insights into Relevant Knowledge Extraction Techniques: a Comprehensive Review. J. Supercomputing. 2020;76:1695—1733.
3. Google Scholar [Elektron. Resurs] https://scholar.google.com (Data Obrashcheniya 21.03.2025).
4. Semantic Scholar [Elektron. Resurs] https://www.semanticscholar.org (Data Obrashcheniya 21.03.2025).
5. Bert D.J. Pre-training of Deep Bidirectional Transformers for Language Understanding [Elektron. Resurs] https://arxiv.org/pdf/1810.04805 (Data Obrashcheniya 21.03.2025).
6. Liu Y. e. a. RoBERTa: a Robustly Optimized BERT Pretraining Approach [Elektron. Resurs] https://arxiv.org/pdf/1907.11692 (Data Obrashcheniya 21.03.2025).
7. Grootendorst M. MaartenGr/KeyBERT: BibTeX» [Elektron. Resurs] https://www.maartengrootendorst.com/blog/keybert/ (Data Obrashcheniya 21.03.2025).
8. Oh H., Wonkeun J., Dongil K. Attention-based Sequential Recommendation System Using Multimodal Data [Elektron. Resurs] https://arxiv.org/pdf/2405.17959 (Data Obrashcheniya 21.03.2025).
9. Ng Yiu-Kai. Research Paper Recommendation Based on Content Similarity, Peer Reviews, Authority, and Popularity. Proc. IEEE XXXII Intern. Conf. Tools with Artifical Intelligence. 2020:47—52.
10. Manning C.D., Raghavan P., Schütze H. An Introduction to Information Retrieval Cambridge: Cambridge University Press, 2009.
11. Li Z., Zou X. A Review on Personalized Academic Paper Recommendation. Computer and Information Sci. 2019;12:33—43.
12. Minaee Sh. e. a. Deep Learning Based Text Classification: a Comprehensive Review Elektron. Resurs] https://arxiv.org/pdf/2004.03705 (Data Obrashcheniya 21.03.2025).
13. ArXiv [Elektron. Resurs] https://arxiv.org (Data Obrashcheniya 21.03.2025).
14. The ACM Digital Library [Elektron. Resurs] https://dl.acm.org (Data Obrashcheniya 21.03.2025).
15. Bol'shakova E.I. i dr. Avtomaticheskaya Obrabotka Tekstov na Estestvennom Yazyke i Analiz Dannykh. M.: Vysshaya Shkola Ekonomiki, 2017. (in Russian).
16. Bai X. e. a. Scientific Paper Recommendation: a Survey. IEEE Access. 2019;7:9324—9339.
17. Li Z., Zou X. A Review on Personalized Academic Paper Recommendation. Computer and Information Sci. 2019;12:33—43.
18. Kreutz C.K., Schenkel R. Scientific Paper Recommendation Systems: a Literature Review of recent Publications [Elektron. Resurs] https://www.researchgate.net/publication/357552714_Scientific_Paper_Recommendation_Systems_a_Literature_Review_of_recent_Publications (Data Obrashcheniya 21.03.2025).
19. Gündogan E., Kaya M. A Novel Hybrid Paper Recommendation System Using Deep Learning. Scientometrics. 2022;127(7):3837—3855.
20. Kozlov P.A. i dr. Sravnitel'nyy Analiz Binarnykh Klassifikatorov na Massive Nauchnykh Publikatsiy. Zavodskaya Laboratoriya. Diagnostika Materialov. 2022;88(7):79—87. (in Russian)
---
For citation: Nazarov N.A. Development of a Recommendation System for Scientific Articles Based on Machine-learning Models. Bulletin of MPEI. 2025;4:138—145. (in Russian). DOI: 10.24160/1993-6982-2025-4-138-145
Опубликован
2025-06-24
Раздел
Системный анализ, управление и обработка информации (2.3.1)