三年、四大顶会,深度推荐系统18篇论文只有7个可以复现
作者 | 深度传送门
来源 | 深度传送门(ID:gh_5faae7b50fc5)
导读:本文是“深度推荐系统”专栏的第十篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文主要根据RecSys 2019中论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》总结的最近三年四大顶会深度推荐系统上的18个最新算法。
今年RecSys 2019上出现的一篇极具批判性的论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。灵魂一问深度学习是否在推荐系统已经取得了足够可信的进展?在知乎上也引起了激烈的讨论:如何看待RecSys 2019上的一篇文章认为现有DNN-based推荐算法带来的基本上都是伪提升?
作者总结了过去三年四大顶会(KDD、SIGIR、WWW和RecSys)推荐系统上18个最新算法,只有7个能重现效果。而且在不同的测试数据集上它们与浅层经典方法效果对比中经常都败下阵来。并开源了评估代码与数据集。
抛开论文中提到到目前推荐系统众所周知的因为评估数据集、评估指标、以及
baseline调参等问题不一致导致诸多论文算法在性能可复现上存在的诸多问题,作为产业界的算法工程师来说更多的是需要从最新的顶会工作中开拓视野、吸取不同的思路,来确定工业界线上系统中的下一步的迭代方向。不管黑猫白猫,只要应用在线上系统有确切实际效果的工作就是好工作。
1. Collaborative Memory Network for Recommendation Systems
作者:Travis Ebesu, Bin Shen, Yi Fang;论文:t.cn/AiRbpFAR;代码:t.cn/EPRooTK;
Google at SIGIR 2018,提出CMN算法融合记忆网络与注意力机制帮助CF类算法捕捉user和item之间的高阶复杂关系。效果好于CDAE和NeuMF等,并开源了代码。
2. Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model
作者:Binbin Hu, Chuan Shi, Wayne Xin Zhao, Philip S. Yu;论文:t.cn/AiRbsEUf;代码:t.cn/EtOkDu7;
KDD 2018,提出MCRec算法借助丰富的元路径和互注意力机制进行Top-N推荐,可以有效学习user、item以及基于元路径的上下文的表示从而学习他们之间的交互。效果好于NeuMF等,并开源了代码。
3. Collaborative Variational Autoencoder for Recommender Systems
作者:Xiaopeng Li, James She; 论文:t.cn/AiRGt8SQ;代码:t.cn/EyWuDRS;
KDD 2017,提出CVAE考虑多媒体场景下的推荐内容与交互数据,以无监督的方式学习item和用户的深度隐式表示以及他们之间的隐式关系。效果好于CDL等,并开源了代码。
4. Collaborative Deep Learning for Recommender Systems
作者:Hao Wang, Naiyan Wang, Dit-Yan Yeung; 论文:t.cn/AiRG66mD;代码:t.cn/AiRG66mF;
KDD 2015,针对CF类方法学习用户与item的交互往往过于稀疏导致推荐效果不好的问题,提出CDL算法结合用户交互数据与item内容辅助信息来学习隐式表示。效果好于CTR和CMF等模型,并开源了代码。
5. Neural Collaborative Filtering
作者:Xiangnan He, Lizi Liao, Hanwang Zhang, Liqiang Nie, Xia Hu, Tat-Seng Chua; 论文:t.cn/ROuL87r;代码:t.cn/ROuhFZP;
WWW 2017,提出NCF框架使用NN网络结构代替內积形式来学习用户和item之间的交互,从而实现对MF类方法进行扩展。效果好于现有MF类方法,并开源了代码。
6. Spectral Collaborative Filtering
作者:Lei Zheng, Chun-Ta Lu, Fei Jiang, Jiawei Zhang, Philip S. Yu;论文:t.cn/AiRM65fz;代码:t.cn/AiRM65VF;
RecSys 2018,提出SpectralCF算法引入光谱图理论结合在用户-item二分图上进行光谱卷积操作解决CF类算法在推荐冷启动问题上的弱点。效果好于NCF等,并开源了代码。
7. Variational Autoencoders for Collaborative Filtering
作者:Dawen Liang, Rahul G. Krishnan, Matthew D. Hoffman, Tony Jebara; 论文:t.cn/RRD6veZ;代码:t.cn/RRD6veA;
NetFlix at WWW 2018,基于变分自动编码器的CF算法。效果明显好于NCF和CDAE等,并开源了代码。
8. Multi-Pointer Co-Attention Networks for Recommendation
作者:Yi Tay, Luu Anh Tuan, Siu Cheung Hui论文:t.cn/AiRotBGQ;代码:t.cn/E72ViBh;
KDD 2018,基于协同注意力机制,针对用户评论以及与商品相关的评论进行重要性选择,用来学习用户与item的表示。效果好于同样基于评论建模的D-ATT/ TransNet/DeepCoNN等,并开源了代码。
9. Recurrent Knowledge Graph Embedding for Effective Recommendation
作者:Zhu Sun, Jie Yang, Jie Zhang, Alessandro Bozzon, Long-Kai Huang, Chi Xu论文:t.cn/AiRKtn8B;代码:t.cn/AiRKtn81;
RecSys 2018,提出一种KG embedding方法RKGE,基于RNN网络自动学习实体与实体间path的embedding表示。效果好于NCF与CKE等,并开源了代码。
10. RecGAN: Recurrent Generative Adversarial Networks for Recommendation Systems
作者:Homanga Bharadhwaj, Homin Park, Brian Y. Lim;论文:t.cn/AiRKcnxT;
RecSys 2018,结合RNN和GAN提出RecGAN框架更好地学习用户item交互背后的时域与隐式特征。
11. Attentive Neural Architecture Incorporating Song Features for Music Recommendation
作者:Noveen Sachdeva, Kartik Gupta, Vikram Pudi论文:t.cn/AiEGSrxQ
RecSys 2018,基于Attention机制结合歌曲的特征更好地学习用户短期兴趣进行下一首音乐的推荐,效果好于RNN以及基于Session的CF类算法。
12. 3D Convolutional Networks for Session-based Recommendation with Content Features
作者:Trinh Xuan Tuan, Tu Minh Phuong论文:t.cn/AiEGOGz2
RecSys 2017,使用三维卷积神经网络针对序列推荐中的用户-item交互数据以及内容特征更好地进行建模,效果好于GRU4Rec等。
13. Convolutional Matrix Factorization for Document Context-Aware Recommendation
作者:Donghyun Kim, Chanyoung Park, Jinoh Oh, Seungyong Lee, Hwanjo Yu论文:t.cn/AiEGRrew;代码:t.cn/AiEGRreA;
RecSys 2016,提出ConvMF算法结合CNN以及概率矩阵分解PMF更好地捕捉item的上下文信息,从而提高预测的准确度。效果好于CDL等,并开源了代码。
14. Meta-Prod2Vec: Product Embeddings Using Side-Information for Recommendation
作者:Flavian Vasile, Elena Smirnova, Alexis Conneau论文:t.cn/AiEGsbzB
RecSys 2016,提出Meta-Prod2Vec算法针对Prod2Vec算法加入类别型side information。效果好于原有Prod2Vec。
15. A Contextual Attention Recurrent Architecture for Context-Aware Venue Recommendation
作者:Jarana Manotumruksa, Craig Macdonald, Iadh Ounis论文:t.cn/AiEqZfuT;代码:t.cn/AiEqLdDT;
SIGIR 2018,提出CARA框架结合序列中的反馈信息以及上下文信息更好地捕获用户的动态偏好,进行酒店推荐。主要包含一个上下文注意力门和基于时间和地理位置门。效果好于GRU以及LatentCross等,并开源了代码。
16. Attentive Collaborative Filtering: Multimedia Recommendation with Item-and Component-Level Attention
作者:Jingyuan Chen, Hanwang Zhang, Xiangnan He, Liqiang Nie, Wei Liu, Tat-Seng Chua论文:t.cn/AiEq5MT6;代码:t.cn/AiEq5MTA;
SIGIR 2017,提出适用于CF的注意力机制跨级啊ACF,包含component-level和item-level的注意力模块,更好地学习多媒体内容上用户的偏好。效果好于DeepHybrid等,并开源了代码。
17. Latent Relational Metric Learning via Memory-based Attention for Collaborative Ranking
作者:Yi Tay, Anh Tuan Luu, Siu Cheung Hui论文:t.cn/AiEqIszv;代码:t.cn/AiEqMIuC;
WWW 2018,提出一种协同推荐上新的度量学习方法LRML,旨在学习用户和item之间的相关关系,而不是简单的用户和项目之间的push和pull关系。采用了一个增强的存储器模块,并通过这些记忆块来构建用户和项目潜在的关系。效果好于NeuMF和CML等,并开源了代码。
18. A Multi-view Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
作者:Ali Mamdouh Elkahky, Yang Song, Xiaodong He论文:t.cn/AiEqJyzT;代码:t.cn/AiEqJ8iv;
微软 at WWW 2015,基于DSSM匹配模型提出一种跨领域构建用户模型的推荐算法MV-DSSM框架。MV-DNN联合了多个域做的丰富特征进行联合模型推荐,效果好于CTR等并开源了代码。
推荐阅读
打破深度学习局限,强化学习、深度森林或是企业AI决策技术的“良药”
自动驾驶行业观察 | 停车不再难,L2到L4的泊车辅助系统技术剖析
Python微信远程控制摄像头-拍摄女朋友坐电脑前聊天时表情
5大必知的图算法,附Python代码实现
阿里云弹性计算负责人蒋林泉:亿级场景驱动的技术自研之路
40 岁身体死亡,11 年后成“硅谷霍金”,他用一块屏幕改变 100 万人!
AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志
Docker是啥?容器变革的火花?

相关文章:

PHP教程中验证正整数is_int($value+0),为什么要这样?
2019独角兽企业重金招聘Python工程师标准>>> 最近学习PHP应用,其中有一段是要验证变量是否为正整数,除了is_numeric($value)外,还要加上is_int($value0)且($value0) > 0,为什么还要 0呢?直接验证$value不…

[给12306支招]取消车票预订-采用全额预售(充值)
为什么80%的码农都做不了架构师?>>> 取消车票预订 预订给车票销售带来的负面效应: 产生"占座", 如果用户不付款就会造成席位在支付期内无法销售.回收成本, 超过支付期需要回收车票.恶意占座, 如果恶意占座会造成大量真正要买票的客户无法购票…
一维码ITF 25简介及其解码实现(zxing-cpp)
一维码ITF 25又称交插25条码,常用在序号,外箱编号等应用。交插25码是一种条和空都表示信息的条码,交插25码有两种单元宽度,每一个条码字符由五个单元组成,其中二个宽单元,三个窄单元。在一个交插25码符号中…

微软云计算业务增长,或成全球最具价值上市公司
近日,有消息指出,微软公司在云计算业务上的豪赌正在取得回报,目前微软已超越苹果公司,成为全球市值最高的上市公司。就在几年前,这家软件制造商的市场前景还不被人看好,随着个人电脑销量的大幅度下滑&#…

激光雷达,马斯克看不上,却又无可替代?
作者 | Xingwei来源 | 辣笔小星(ID:XingweiSteven)【导读】最近Velodyne挑起的激光雷达LiDAR专利之战成为了业界热点。可以说在严苛的自动驾驶系统中激光雷达成为一种不可替代的传感器。今天让我们详细聊聊激光雷达LIDAR是怎么回事。什么是激光雷达LIDAR…

解决CSV文件中长数字以科学记数格式保存问题
今天因为需要做数据导入到数据表中,用xlxs文件做好了转化为csv文件,结果一看,傻眼了,全部变为科学记数了,在xlxs设置好的单元格格式为文本,可是转化为csv之后就变为了常规,而且也改变了。源文件…

假设检验怎么做?这次把方法+Python代码一并教给你
(图片付费下载于视觉中国)作者 | Jose Garcia译者 | 张睿毅校对 | 张一豪、林亦霖编辑 | 于腾凯来源 | 数据派THU(ID:DatapiTHU)【导读】本文中,作者给出了假设检验的解读与Python实现的详细的假设检验中的…
C++实现tar包解析
tar(tape archive)是Unix和类Unix系统上文件打包工具,可以将多个文件合并为一个文件,使用tar工具打出来的包称为tar包。一般打包后的文件名后缀为”.tar”,也可以为其它。tar代表未被压缩的tar文件,已被压缩的tar文件则追加压缩文…

HTML5的学习,各个标签的尝试
style标签的使用可以更好的改变各个标题风格 基本标签<p>,标题<h>,这里br是换行。 超链接的使用,属性href。 表格的使用table。 最后就是图片 img,和音频audio插入地址即可。 今天的学习就分享这些,谢谢大家。转载于:https://www…

Android获取内部和SDCard的存储空间
有时我们开Android项目开发时会用到文件存储或上传文件的一些操作,那么我们前提是要获取到该存储设备的大小,以方便于与我们需要操作的文件的大小做比较,如果操作的文件大小小于存储空间,那么就可以继续操作,反之则不能…

排序算法 Java实现
选择排序 核心思想 选择最小元素,与第一个元素交换位置;剩下的元素中选择最小元素,与当前剩余元素的最前边的元素交换位置。 分析 选择排序的比较次数与序列的初始排序无关,比较次数都是N(N-1)/2。 移动次数最多只有n-1次。 因此&…

正则表达式简介及在C++11中的简单使用
正则表达式(regular expression)是计算机科学中的一个概念,又称规则表达式,通常简写为regex、regexp、RE、regexps、regexes、regexen。 正则表达式是一种文本模式。正则表达式是强大、便捷、高效的文本处理工具。正则表达式本身,加上如同一…

经典再读 | NASNet:神经架构搜索网络在图像分类中的表现
(图片付费下载于视觉中国)作者 | Sik-Ho Tsang译者 | Rachel编辑 | Jane出品 | AI科技大本营(ID:rgznai100)【导读】从 AutoML 到 NAS,都是企业和开发者的热门关注技术,以往我们也分享了很多相关…

javascript面向对象技术基础(二)
数组我们已经提到过,对象是无序数据的集合,而数组则是有序数据的集合,数组中的数据(元素)通过索引(从0开始)来访问,数组中的数据可以是任何的数据类型.数组本身仍旧是对象,但是由于数组的很多特性,通常情况下把数组和对象区别开来分别对待(Throughout this book, objects and a…

MediaPipe:Google Research 开源的跨平台多媒体机器学习模型应用框架
作者 | MediaPipe 团队来源 | TensorFlow(ID:tensorflowers)【导读】我爱计算机视觉(aicvml)CV君推荐道:“虽然它是出自Google Research,但不是一个实验品,而是已经应用于谷歌多款产…

机器学习研究的七个迷思
作者 Oscar Chang 总结了机器学习研究中的七大迷思,每个问题都很有趣,也可能是你在研究机器学习的过程中曾经遇到过的“想当然”问题。AI 前线对这篇文章进行了编译,以飨读者。迷思之一:TensorFlow 是张量操作库 它实际上就是一个…
Caffe源码中common文件分析
Caffe源码(caffe version:09868ac , date: 2015.08.15)中的一些重要头文件如caffe.hpp、blob.hpp等或者外部调用Caffe库使用时,一般都会include<caffe/common.hpp>文件,下面分析此文件的内容:1. include的文件:boost中…
编程乐趣:C#彻底删除文件
经常用360的文件粉碎,删除隐私文件貌似还不错的。不过C#也可以实现彻底删除文件。试了下用360文件恢复恢复不了源文件了。代码如下:public class AbsoluteFile{public event EventHandler FinishDeleteFileEvent null;public event EventHandler Finish…

大数据工程师手册:全面系统的掌握必备知识与工具
作者 | Phoebe Wong译者 | 陆离编辑 | Jane出品 | AI科技大本营(ID:rgznai100)前言如何才能成为一名真正的“全栈(full-stack)”数据科学家?需要了解哪些知识?掌握哪些技能?概括来讲…

JSON.stringify()
写在前边 不言而喻,JSON.stringify() 是用来将合法的JSON数据字符串化的!然而在正常的工作中我们用到的只是最基础的功能;今天我们就探索不一样的JSON.stringify()。 基础用法 基本数据类型 JSON.stringify(2) // "2" JSON.stringi…

C++中前置声明介绍
前置声明是指对类、函数、模板或者结构体进行声明,仅仅是声明,不包含相关具体的定义。在很多场合我们可以用前置声明来代替#include语句。类的前置声明只是告诉编译器这是一个类型,但无法告知类型的大小,成员等具体内容。在未提供…

在Java SE中使用Hibernate处理数据
如今,Hibernate正在迅速成为非常流行的(如果不是最流行的)J2EE O/R映射程序/数据集成框架。它为开发人员提供了处理企业中的关系数据库的整洁、简明且强大的工具。但如果外部需要访问这些已被包装在J2EE Web应用程序中的实体又该怎么办&#…

利用OpenCV、Python和Ubidots构建行人计数器程序(附完整代码)
作者 | Jose Garcia译者 | 吴振东校对 | 张一豪、林亦霖,编辑 | 于腾凯来源 | 数据派(ID:datapi)导读:本文将利用OpenCV,Python和Ubidots来编写一个行人计数器程序,并对代码进行了较为详细的讲解…
开源软件License汇总
开源软件英文为Open Source Software,简称OSS,又称开放源代码软件,是一种源代码可以任意获取的计算机软件,这种软件的著作权持有人在软件协议的规定之下保留一部分权利并允许用户学习、修改以及以任何目的向任何人分发该软件。 某…

前深度学习时代CTR预估模型的演化之路:从LR到FFM\n
本文是王喆在 AI 前线 开设的原创技术专栏“深度学习 CTR 预估模型实践”的第二篇文章(以下“深度学习 CTR 预估模型实践”简称“深度 CTR 模型”)。专栏第一篇文章回顾:《深度学习CTR预估模型凭什么成为互联网增长的关键?》。重看…

神器与经典--sp_helpIndex
每每和那些NB的人学习技术的时候,往往都佩服他们对各个知识点都熟捻于心,更佩服的是可以在很短时间找出很多业界大师写的文章和开发的工具,就像机器猫的口袋,让人羡慕嫉妒恨啊!宋沄剑宋桑就是其中之一,打劫其硬盘的念头已计划很久,只待时机成…

评分9.7!这本Python书彻底玩大了?程序员:真香!
「超级星推官/每周分享」是一个围绕程序员生活、学习相关的推荐栏目。CSDN出品,每周发布,暂定5期。关键词:靠谱!优质!本期内容,我们将抽1人送出由我司程序员奉为“超级神作”的《疯狂Python讲义》1本&#…

Caffe源码中caffe.proto文件分析
Caffe源码(caffe version:09868ac , date: 2015.08.15)中有一些重要文件,这里介绍下caffe.proto文件。在src/caffe/proto目录下有一个caffe.proto文件。proto目录下除了caffe.proto文件外,还有caffe.pb.h和caffe.pb.cc两个文件,此两个文件是根…

这套完美的Java环境安装教程,完整,详细,清晰可观,让你一目了然,简单易懂。⊙﹏⊙...
JDK下载与安装教程 2017年06月18日 22:53:16 Danishlyy1995 阅读数:349980版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u012934325/article/details/73441617学习JAVA,必须得安装一下JDK(java dev…

【畅谈百度轻应用】云时代·轻应用·大舞台
云时代轻应用大舞台刘志勇君不见,上下班的地铁上,低头看手机;同事吃饭聊天,低头看手机;甚至朋友聚会,忙里偷闲打个招呼,然后继续低头看手机。正如微博上一个流传甚广的段子:“世界上…