涵洞


  • 首页

  • 归档

try

发表于 2018-02-15


论文阅读总结:Inferring Networks of Substitutable and Complementary Products

发表于 2018-02-14

本文对论文Inferring Networks of Substitutable and Complementary Products进行了总结,图片来源于原文,帮助读者理解,有争议的请联系我。论文的作者是Julian McAuley、Rahul Pandey和Jure Leskovec,2015年发表于KDD。本文主要将从写作动机(why)、主要思路(what)、模型构建(how)和贡献四个方面来进行总结。

不知大家是否有这种感觉,当购买了一个商品,电商网站会一直为我们推送与其相似的产品,让人不胜其烦。实际上,当用户购买了一个商品之后,往往不再需要相似商品的推荐。该论文提出构建替代和互补商品关系网络,可以实现互补品和替代品推荐,而非仅单一推荐替代品。

写作动机

如上图所示,商品之间有互补品和替代品两种关系,而相关的两种商品又有品质的优劣之分,将商品之间的关系进行刻画,可以有效的应用于推荐之中。最终效果图如下图

主要思路

  • 商品向量表示:利用主题模型—> 从文本中识别出有用的产品特征,将每一个产品 $i$ 用向量 $\theta_i$ 表示出来(使用的文本数据为产品评论)
  • 链路预测,预测产品间是否有连边及连边的方向
  • 选择不同类型的数据集(表征互补或替代关系)进行训练,预测产品之间互补或替代的关系

模型构建

数据来源
  • 亚马逊Amazon product catalog
  • 主要使用产品评论
  • 也使用了其他特征如打分,价格和品牌,产品类别信息
主题模型

使用Latent Dirichlet Allocation(LDA)模型 ,这是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。LDA模型本身就包含大量的知识,因此关于其原理,在此不展开,可能会在以后讲到。只需要知道LDA模型在这里的作用是将每个商品对应的评论信息的主题按照概率分布的形式给出,即给出商品的特征向量表示。

链路预测

主要思路就是面向成对特征$\psi(i,j)$,训练logistic分类器

  • 首先判断是否有连边,即判断商品之间是否存在互补或替代关系

特征向量

$$\psi_\theta(i,j)=(1,\theta_{i,1}\cdot\theta_{j,1},\theta_{i,2}\cdot\theta_{j,2},\ldots,\theta_{i,K}\cdot\theta_{j,K})$$

logistic函数

$$F_\beta(\theta_d)=\sigma(\langle\beta,\psi_\theta(i,j)\rangle)$$

目标函数

其中$\beta$决定要判断产品相关,哪些主题应该相似

‘we are related because we shared these features’,从特征向量可以看到,如果对应主题相同,那么向量元素相乘不为0,如果主题不同,那么相乘为0。有相似主题向量的产品较为可能相连。

  • 然后判断边的方向,即相关产品品质的优劣

特征向量

$$\psi_\theta(i,j)=(1,\theta_{j,1}-\theta_{i,1},\ldots,\theta_{j,K}-\theta_{i,K})$$

logistic函数

$$F_\eta(\psi_\theta(i,j))$$

目标函数

这里特征向量表示的是两个商品主题向量的差异

例如:如果y是一个和x相似的商品,且比x价格低,评分高,那么y就是x一个很好的替代品,但是x是y的一个很差的替代品。同理,对互补品来说,以电池与电视举例,电池可能是电视的一个很好的互补品,但向购买电池的人推荐电视就没多大意义了

learning multiple graphs

四类图

  1. 用户既浏览了$x$又浏览了$y$
  2. 用户浏览过$x$,最终买了$y$
  3. 用户既买了$x$,又买了$y$
  4. 用户经常同时购买$x$和$y$

其中1.2两类图体现的是替代关系,3.4两类图体现的是互补关系

目标函数

其中$g\in G$表明这是属于一类图

可以同时预测多种类型

Sparse topic

实际训练中,不可能每个产品都训练有成百个话题的模型,实际上,只需要从一部分话题中选取,如下图所示

文中的做法是

  • 每当观察到节点拥有例如千个实例,就将对应的主题与节点关联
  • 如果一个产品在类型树的一条路径上,那么它只选取和这条路径上节点相关的topic
训练结果

贡献

本文认为该论文为推荐研究提供了新的思路,对用户购物行为进行细粒度的划分,考虑到了浏览、购买等不同情形,同时将产品的优劣考虑进来,进行了较为全面的模型构建,具有启发作用。

Hello World

发表于 2017-11-12

Welcome to Hexo!

Quick Start

Create a new post

1
$ hexo new "My New Post"

More info: Writing

Run server

1
$ hexo server

More info: Server

Generate static files

1
$ hexo generate

More info: Generating

Deploy to remote sites

1
$ hexo deploy

More info: Deployment

Ellazhouhan

3 日志
© 2018 Ellazhouhan
由 Hexo 强力驱动
|
主题 — NexT.Muse v5.1.3