REHIS ：基于层次项目相似性的高效推荐算法

REHIS：基于层次项目相似性的高效推荐算法 论文作者：孙远帅报告人：李培

1 2 3 主要内容推荐系统概念一般推荐算法本文工作

推荐系统概念 1

一般推荐算法 2 • 基于内容的推荐 • 协同推荐 • 混合推荐

本文工作 3 而本文的工作主要集中于协同过滤，协同过滤的主要思想就是k近邻，即在用户集合中查找与目标用户最相似的K个用户来进行推荐，其过程如下：共同评分的item 推荐给目标用户 Top K 最相似用户最喜欢的item

本文工作 3 1. Cosine距离 2. Pearson相关系数数据规模较大时，其比较慢！其中，Sxy是用户x和用户y共同评分的项目

本文工作 3 为此我们引入倒排索引，构建一个用户项目的倒排索引，来方便查找用户的共现项目。虽然这样有效的减少了共现项目的查找时间，但其并没有减少计算量，是否能减少计算量呢？

本文工作 3 为此我们提出了TOPKS算法，利用相似度的分子是累加和的形式，算法的主要过程如下：（以Cosine距离为例）计算部分相似度排序得到topk集删除不必要用户估算最大值 2014/8/31 8

本文工作 3 不同规模用户数量上的比较实验

本文工作 3 不同稀疏度对近邻计算的影响

本文工作 3 通过Topks算法我们有效地提高了协同过滤算法的效率，但是算法的效果不能令人满意。我们该如何改进呢？协同过滤算法的效果依赖于一个准确的相似度度量，传统的cosine距离、pearson系数等受限因素太多，难以准确度量相似度。那我们该如何去度量相似度呢？ 2014/8/31 11

本文工作 3 为了提高协同过滤算法的相似度度量的准确度，我们就需要引入更多的信息，而在推荐系统的用户数据上有很多用户自定义的标签，这些标签存在着一定的层次关系，并在一定程度上描述了项目的关键属性。为此本文提出利用项目间的层次间关系，构建出一个标签和项目之间的层次结构图，而后引入语义网络中一种基于本体的概念相似度计算方法来计算相似度。

本文工作 3 层次相似度的计算过程：构建出标签和项目之间的层次结构图计算父子节点之间距离通过找到两个节点的最短距离来求相似度

本文工作 3 算法效果对比图

本文工作 3 • KNN扩展：引入倒排索引，加入Topks算法改进了KNN算法使得传统协同过滤算法处理数据的能力有所提升，有效的提高了算法的效率。 • 基于层次项目相似性进行推荐：利用KNN算法和关联规则完成标签层次结构，而后提出基于标签层次结构计算项目相似度的方法，提高了推荐的准确度。

欢迎批评指正！ 论文作者：孙远帅邮箱：sys@stu.xmu.edu.cn 电话：18250878229

REHIS ：基于层次项目相似性的高效推荐算法

REHIS ：基于层次项目相似性的高效推荐算法

Presentation Transcript