Вибір оптимального підходу до побудови рекомендаційної системи на основі даних про фільми
DOI: 10.31673/2412-4338.2022.028590
Анотація
Останнім часом системи рекомендацій стають все більш популярними, оскільки вони можуть вирішити проблему перевантаження інформацією, пропонуючи елементи, які цікавлять користувачів. Обсяг інформації з кожним роком збільшується, а можливостей для Інтернет-бізнесу все більше, тому через Інтернет стає легше отримати що завгодно, наприклад товари, книги, фільми, новини. Роботи в області створення рекомендаційних систем можуть носити як комерційний, так і дослідницький характер і вимагати вирішення ряду проблем. У статті досліджено проблему вибору оптимального підходу до побудови системи рекомендацій на основі наявних даних. Неможливо створити систему рекомендацій без даних. Дані зазвичай доступні в явному або неявному вигляді. Дані, які називаються відвертими, можна зібрати шляхом пошуку відгуків і обміну думками користувачів про різні продукти. Однак неявні дані пов’язані з пошуковим журналом і історією даних, доступною в системі. Вибір оптимального підходу до побудови системи рекомендацій дозволить використовувати алгоритм машинного навчання. Змодельована архітектура системи рекомендацій, яка допомагає зрозуміти, як створити визначений користувачем процес рекомендацій. Рекомендаційні системи класифікуються за способом відбору необхідного матеріалу для системи користувача. В основному застосовуються два основні підходи: спільна фільтрація та фільтрація, орієнтована на вміст. Існує також гібридна фільтрація, яка поєднує як спільну, так і орієнтовану на вміст фільтрацію. У роботі проведено аналіз та порівняння рекомендаційних систем за типами. Порівняння типів систем рекомендацій за основними характеристиками: складність впровадження, точність впровадження, швидкість роботи, залежність від користувачів системи. Проведено аналіз основних алгоритмів машинного навчання контент-орієнтованої фільтрації.
Ключові слова: система рекомендацій, спільна фільтрація, контент-орієнтована фільтрація, гібридна фільтрація, алгоритм.
Список використаних джерел
- Yadav N., Kumar R., Singh A., Pal S. Diversity in Recommendation System: Cluster Based Approach. Hybrid Intelligent Systems. 2020. 113–122с.
- John S. Breese, David Heckerman, and Carl Myers Kadie. Empirical analysis of predictive algorithms for collaborative filtering. CoRR, abs/1301.7363, 2013. 69с.
- Liu Na, Ming-Xia Li, Qiu Hai-yang, and Hao-Long Su. A hybrid user-based collaborative filtering algorithm with topic model. Appl. Intell., 51(11):7946–7959, 2021.
- Soumen Chakrabarti. Mining the web - discovering knowledge from hypertext data. Morgan Kaufmann, 2003.
- Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze. Introduction to information retrieval. Cambridge University Press, 2008.
- Robin D. Burke. Hybrid recommender systems: Survey and experiments. User Model. User Adapt. Interact., 12(4):331–370, 2002.
- Cosine similarity [Електроний ресурс] – Режим доступу : https://www.wikiwand.com/en/Cosine_similarity
- Tf–idf[Електроний ресурс] – Режим доступу : https://en.wikipedia.org/wiki/Tf–idf
- Roshan Bharti and Deepak Gupta. Recommending Top N Movies Using Content-Based Filtering and Collaborative Filtering with Hadoop and Hive Framework,2019.102-112с.