2009-04-01

如何将用户信息和电影信息加入到基于CF的推荐系统

在传统的协同过滤中,我们仅仅知道用户对电影的评分。但如果我们还有很多其他信息,比如用户的年龄,国籍,城市,学历,以及电影的导演,演员,简介,标签,等等这些内容信息。那么如果将这些信息加入到CF系统中以获得最好的预测误差?

我目前对这个问题还没有切实的解决办法,能够显著的提高现有的协同过滤的精度。这个其实输入内容过滤和协同过滤的结合。以往基于knn的方法一般用这些信息计算相似度,不过在SVD的方法中如何融入这些信息确实是一个值得研究的问题。

2 条评论:

  1. 我以前想,把电影的元信息当做显性的movie feature,(是否具备某离散属性用0-1表示,发布时间等连续属性规范化到[0,1]区间)。放到SVD中训练,训练时只更新用户对应的feature分量,而电影对应的feature分量固定。可惜我实现的版本效果不理想。

    回复删除