2009-08-13

Github Contest关于diversity应用的实例

在Github比赛中,考虑diversity是一个重要的因素。因为这个比赛,对每个用户只要猜出一个可能watch的工程,那么如果不考虑
diversity,对于活跃用户的预测就会很差。

如果我们把watch4个以下的用户称为非活跃,反之称为活跃。那么现在的实验表示,对于非活跃用户有60%的预测准确率,而活跃用户只有40%。

这个原因是,活跃用户实际有很多潜在可能watch的工程,而比赛只要我们猜出1个,这个就像大海捞针,是比较困难的。这个时候diversity就

作用了。

我现在只考虑了简单的方法,对于同一类的,给活跃用户推荐时,只选择前几个,后面的降低权重,这个方法目前是很有用的。

这个也说明,diversity在预测时也是很重要的。

没有评论:

发表评论