当前位置：首页 > 编程日记 > 正文

三年、四大顶会，深度推荐系统18篇论文只有7个可以复现

编程日记 2024-12-23 20:10:00

640?wx_fmt=jpeg

作者 | 深度传送门

来源 | 深度传送门（ID:gh_5faae7b50fc5）

导读：本文是“深度推荐系统”专栏的第十篇文章，这个系列将介绍在深度学习的强力驱动下，给推荐系统工业界所带来的最前沿的变化。本文主要根据RecSys 2019中论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》总结的最近三年四大顶会深度推荐系统上的18个最新算法。

今年RecSys 2019上出现的一篇极具批判性的论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。灵魂一问深度学习是否在推荐系统已经取得了足够可信的进展？在知乎上也引起了激烈的讨论：如何看待RecSys 2019上的一篇文章认为现有DNN-based推荐算法带来的基本上都是伪提升？

作者总结了过去三年四大顶会（KDD、SIGIR、WWW和RecSys）推荐系统上18个最新算法，只有7个能重现效果。而且在不同的测试数据集上它们与浅层经典方法效果对比中经常都败下阵来。并开源了评估代码与数据集。

抛开论文中提到到目前推荐系统众所周知的因为评估数据集、评估指标、以及

baseline调参等问题不一致导致诸多论文算法在性能可复现上存在的诸多问题，作为产业界的算法工程师来说更多的是需要从最新的顶会工作中开拓视野、吸取不同的思路，来确定工业界线上系统中的下一步的迭代方向。不管黑猫白猫，只要应用在线上系统有确切实际效果的工作就是好工作。

1. Collaborative Memory Network for Recommendation Systems

作者：Travis Ebesu, Bin Shen, Yi Fang；论文：t.cn/AiRbpFAR；代码：t.cn/EPRooTK；

Google at SIGIR 2018，提出CMN算法融合记忆网络与注意力机制帮助CF类算法捕捉user和item之间的高阶复杂关系。效果好于CDAE和NeuMF等，并开源了代码。

2. Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model

作者：Binbin Hu, Chuan Shi, Wayne Xin Zhao, Philip S. Yu；论文：t.cn/AiRbsEUf；代码：t.cn/EtOkDu7；

KDD 2018，提出MCRec算法借助丰富的元路径和互注意力机制进行Top-N推荐，可以有效学习user、item以及基于元路径的上下文的表示从而学习他们之间的交互。效果好于NeuMF等，并开源了代码。

3. Collaborative Variational Autoencoder for Recommender Systems

作者：Xiaopeng Li, James She；论文：t.cn/AiRGt8SQ；代码：t.cn/EyWuDRS；

KDD 2017，提出CVAE考虑多媒体场景下的推荐内容与交互数据，以无监督的方式学习item和用户的深度隐式表示以及他们之间的隐式关系。效果好于CDL等，并开源了代码。

4. Collaborative Deep Learning for Recommender Systems

作者：Hao Wang, Naiyan Wang, Dit-Yan Yeung；论文：t.cn/AiRG66mD；代码：t.cn/AiRG66mF；

KDD 2015，针对CF类方法学习用户与item的交互往往过于稀疏导致推荐效果不好的问题，提出CDL算法结合用户交互数据与item内容辅助信息来学习隐式表示。效果好于CTR和CMF等模型，并开源了代码。

5. Neural Collaborative Filtering

作者：Xiangnan He, Lizi Liao, Hanwang Zhang, Liqiang Nie, Xia Hu, Tat-Seng Chua；论文：t.cn/ROuL87r；代码：t.cn/ROuhFZP；

WWW 2017，提出NCF框架使用NN网络结构代替內积形式来学习用户和item之间的交互，从而实现对MF类方法进行扩展。效果好于现有MF类方法，并开源了代码。

6. Spectral Collaborative Filtering

作者：Lei Zheng, Chun-Ta Lu, Fei Jiang, Jiawei Zhang, Philip S. Yu；论文：t.cn/AiRM65fz；代码：t.cn/AiRM65VF；

RecSys 2018，提出SpectralCF算法引入光谱图理论结合在用户-item二分图上进行光谱卷积操作解决CF类算法在推荐冷启动问题上的弱点。效果好于NCF等，并开源了代码。

7. Variational Autoencoders for Collaborative Filtering

作者：Dawen Liang, Rahul G. Krishnan, Matthew D. Hoffman, Tony Jebara；论文：t.cn/RRD6veZ；代码：t.cn/RRD6veA；

NetFlix at WWW 2018，基于变分自动编码器的CF算法。效果明显好于NCF和CDAE等，并开源了代码。

8. Multi-Pointer Co-Attention Networks for Recommendation

作者：Yi Tay, Luu Anh Tuan, Siu Cheung Hui论文：t.cn/AiRotBGQ；代码：t.cn/E72ViBh；

KDD 2018，基于协同注意力机制，针对用户评论以及与商品相关的评论进行重要性选择，用来学习用户与item的表示。效果好于同样基于评论建模的D-ATT/ TransNet/DeepCoNN等，并开源了代码。

9. Recurrent Knowledge Graph Embedding for Effective Recommendation

作者：Zhu Sun, Jie Yang, Jie Zhang, Alessandro Bozzon, Long-Kai Huang, Chi Xu论文：t.cn/AiRKtn8B；代码：t.cn/AiRKtn81；

RecSys 2018，提出一种KG embedding方法RKGE，基于RNN网络自动学习实体与实体间path的embedding表示。效果好于NCF与CKE等，并开源了代码。

10. RecGAN: Recurrent Generative Adversarial Networks for Recommendation Systems

作者：Homanga Bharadhwaj, Homin Park, Brian Y. Lim；论文：t.cn/AiRKcnxT；

RecSys 2018，结合RNN和GAN提出RecGAN框架更好地学习用户item交互背后的时域与隐式特征。

11. Attentive Neural Architecture Incorporating Song Features for Music Recommendation

作者：Noveen Sachdeva, Kartik Gupta, Vikram Pudi论文：t.cn/AiEGSrxQ

RecSys 2018，基于Attention机制结合歌曲的特征更好地学习用户短期兴趣进行下一首音乐的推荐，效果好于RNN以及基于Session的CF类算法。

12. 3D Convolutional Networks for Session-based Recommendation with Content Features

作者：Trinh Xuan Tuan, Tu Minh Phuong论文：t.cn/AiEGOGz2

RecSys 2017，使用三维卷积神经网络针对序列推荐中的用户-item交互数据以及内容特征更好地进行建模，效果好于GRU4Rec等。

13. Convolutional Matrix Factorization for Document Context-Aware Recommendation

作者：Donghyun Kim, Chanyoung Park, Jinoh Oh, Seungyong Lee, Hwanjo Yu论文：t.cn/AiEGRrew；代码：t.cn/AiEGRreA；

RecSys 2016，提出ConvMF算法结合CNN以及概率矩阵分解PMF更好地捕捉item的上下文信息，从而提高预测的准确度。效果好于CDL等，并开源了代码。

14. Meta-Prod2Vec: Product Embeddings Using Side-Information for Recommendation

作者：Flavian Vasile, Elena Smirnova, Alexis Conneau论文：t.cn/AiEGsbzB

RecSys 2016，提出Meta-Prod2Vec算法针对Prod2Vec算法加入类别型side information。效果好于原有Prod2Vec。

15. A Contextual Attention Recurrent Architecture for Context-Aware Venue Recommendation

作者：Jarana Manotumruksa, Craig Macdonald, Iadh Ounis论文：t.cn/AiEqZfuT；代码：t.cn/AiEqLdDT；

SIGIR 2018，提出CARA框架结合序列中的反馈信息以及上下文信息更好地捕获用户的动态偏好，进行酒店推荐。主要包含一个上下文注意力门和基于时间和地理位置门。效果好于GRU以及LatentCross等，并开源了代码。

16. Attentive Collaborative Filtering: Multimedia Recommendation with Item-and Component-Level Attention

作者：Jingyuan Chen, Hanwang Zhang, Xiangnan He, Liqiang Nie, Wei Liu, Tat-Seng Chua论文：t.cn/AiEq5MT6；代码：t.cn/AiEq5MTA；

SIGIR 2017，提出适用于CF的注意力机制跨级啊ACF，包含component-level和item-level的注意力模块，更好地学习多媒体内容上用户的偏好。效果好于DeepHybrid等，并开源了代码。

17. Latent Relational Metric Learning via Memory-based Attention for Collaborative Ranking

作者：Yi Tay, Anh Tuan Luu, Siu Cheung Hui论文：t.cn/AiEqIszv；代码：t.cn/AiEqMIuC；

WWW 2018，提出一种协同推荐上新的度量学习方法LRML，旨在学习用户和item之间的相关关系，而不是简单的用户和项目之间的push和pull关系。采用了一个增强的存储器模块，并通过这些记忆块来构建用户和项目潜在的关系。效果好于NeuMF和CML等，并开源了代码。

18. A Multi-view Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems

作者：Ali Mamdouh Elkahky, Yang Song, Xiaodong He论文：t.cn/AiEqJyzT；代码：t.cn/AiEqJ8iv；

微软 at WWW 2015，基于DSSM匹配模型提出一种跨领域构建用户模型的推荐算法MV-DSSM框架。MV-DNN联合了多个域做的丰富特征进行联合模型推荐，效果好于CTR等并开源了代码。

(*本文为AI科技大本营转载文章，转载请联系作者)

推荐阅读

打破深度学习局限，强化学习、深度森林或是企业AI决策技术的“良药”
自动驾驶行业观察 | 停车不再难，L2到L4的泊车辅助系统技术剖析

Python微信远程控制摄像头-拍摄女朋友坐电脑前聊天时表情
5大必知的图算法，附Python代码实现
阿里云弹性计算负责人蒋林泉：亿级场景驱动的技术自研之路

40 岁身体死亡，11 年后成“硅谷霍金”，他用一块屏幕改变 100 万人！
AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志

Docker是啥？容器变革的火花？

你点的每个“在看”，我都认真当成了喜欢

https://www.dkcj.cn/info/33129.html

三年、四大顶会，深度推荐系统18篇论文只有7个可以复现

打破深度学习局限，强化学习、深度森林或是企业AI决策技术的“良药”

自动驾驶行业观察 | 停车不再难，L2到L4的泊车辅助系统技术剖析

Python微信远程控制摄像头-拍摄女朋友坐电脑前聊天时表情

5大必知的图算法，附Python代码实现

阿里云弹性计算负责人蒋林泉：亿级场景驱动的技术自研之路

40 岁身体死亡，11 年后成“硅谷霍金”，他用一块屏幕改变 100 万人！

AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志

Docker是啥？容器变革的火花？

相关文章：

PHP教程中验证正整数is_int($value+0)，为什么要这样？

[给12306支招]取消车票预订-采用全额预售(充值)

一维码ITF 25简介及其解码实现(zxing-cpp)

微软云计算业务增长，或成全球最具价值上市公司

激光雷达，马斯克看不上，却又无可替代？

解决CSV文件中长数字以科学记数格式保存问题

假设检验怎么做？这次把方法+Python代码一并教给你

C++实现tar包解析

HTML5的学习，各个标签的尝试

Android获取内部和SDCard的存储空间

排序算法 Java实现

正则表达式简介及在C++11中的简单使用

经典再读 | NASNet：神经架构搜索网络在图像分类中的表现

javascript面向对象技术基础(二)

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

机器学习研究的七个迷思

Caffe源码中common文件分析

编程乐趣：C#彻底删除文件

大数据工程师手册：全面系统的掌握必备知识与工具

JSON.stringify()

C++中前置声明介绍

在Java SE中使用Hibernate处理数据

利用OpenCV、Python和Ubidots构建行人计数器程序（附完整代码）

开源软件License汇总

前深度学习时代CTR预估模型的演化之路：从LR到FFM\n

神器与经典--sp_helpIndex

评分9.7！这本Python书彻底玩大了？程序员：真香！

Caffe源码中caffe.proto文件分析

这套完美的Java环境安装教程，完整，详细，清晰可观，让你一目了然，简单易懂。⊙﹏⊙...

【畅谈百度轻应用】云时代·轻应用·大舞台