PageRank是一个基于图的排名算法,这一算法很像选举政治,一切实体的地位由投票决定。
有了图的rank算法,现在的主要问题就是如何把我们需要rank的东西转化为Graph,现在这个是很多人研究的领域。
- WebPage通过url形成page之间的关系,从而构成图,最早的pagerank就是基于WebPage的排名提出的
- 实体Entity之间通过在一张网页或者一篇文章中co-occurence产生联系,这方面比较著名的研究是 polyphonet an advanced social network extraction system from the web 一文。
- 文本的图表示,我前面也说过,可以建立句子的图,或者词的图
- 还有语义网络...
- 模型的建立,特征提取。
- 模型的匹配,也就是模型的相似度计算,这涉及到分类器的设计。
没有评论:
发表评论