추천시스템/패스트캠퍼스 추천시스템
[Part 3] Ch01. Hybrid Recommender System
알맹리
2021. 8. 27. 11:04
Hybrid Recommender System
01. Review
Contents-based RS |
Collaborative Filtering |
장점 다른 사용자에 의존할 필요가 없다 새로운 아이템을 추천할 수 있다 |
장점 집단지성을 활용해 평가 품질이 높아진다 잠재적 특징을 활용해 폭넓은 추천이 가능하다 Implicit feedback 활용 가능하다 데이터가 쌓일수록 추천 품질이 올라간다 |
단점 아이템과 비슷한 분류를 추천할 수밖에 없다 잠재적 의미를 활용하기 어렵다 |
단점 cold-start 초기 사용자에게 추천이 어렵다 과거 데이터와 큰 데이터에 의존 |
02. Hybrid?
- 다양한 데이터와 다양한 알고리즘을 조합하는 방식
- → 유저&아이템 프로필, 유저&아이템의 상호관계, 유저의 이웃 정보, 아이템의 이웃 정보
- 가용할 수 있는 최대 정보, 지식을 다양한 source로부터 얻어서 활용
- 다양한 추천 알고리즘의 장점만 모아서 성능이 좋은 시스템을 만드는 방식
03. Hybrid Recommender System?
Contents-based, Collaborative Filtering이 각자 잘하는 역할을 살려주고 도메인지식과 맥락을 활용
Hybrid Methods
Weighted Ensemble | Soft Ensemble 또는 Hard Vote와 같은 방법으로 여러 모델의 추천 결과를 하나로 합쳐 최종 추천 아이템을 정하는 방식 e.g.) model 1, model 2, ... , model n에서 각각 item 1에 대한 score를 weighted ensemble한다. 이 때 각 모델의 성능에 따라 가중치를 둘 수 있다. |
Mixed | 추천시스템이 적용될 플랫폼에 여러 추천 알고리즘을 활용하고, 이 때 알고리즘의 추천 결과를 모두 보여주는 방식 |
Switch | 플랫폼 내 사용자 또는 서비스 상태 등 특정 상황을 고려하여 여러 추천 알고리즘의 추천 결과를 선택적으로 보여주는 방식 |
Feature Combination | 보유하고 있는 데이터로부터 얻을 수 있는 다양한 feature를 모두 조합하여 추천 알고리즘을 학습하고 추천하는 방식 |
Meta-Level | 여러 추천 알고리즘을 활용할 때 첫번째 모델이 다음 모델의 input이 되면서 서로가 서로의 정보를 학습해 추천하는 방식 |
Evaluate Hybrid Methods
- 서비스 관점
- Business KPI
- Online/Offline evaluation
- 모델 성능 관점
- Accuracy, Coverage, Popularity
- Diversity, Serendipity(Novelty), Scalability
- Personalization
- Rating Predction: RMSE, NDC