当前位置: 首页 > 编程日记 > 正文

阿里、京东、快手、华为......他们是如何构建一个个推荐系统“帝国”的?

640?wx_fmt=jpeg


推荐系统在人们的日常生活中随处可见,成为我们生命中不可或缺的一部分。作为当今应用最为广泛和成熟的 AI 技术之一,它是信息生产者、传播者与用户之间的桥梁,可以让信息最精准、最高效地到达需求不一的用户面前。 每天打开手机或电脑端的大部分 App 和网页界面,我们第一眼看到的五花八门的内容,都是为你“独家定制”的,正所谓“千人千面”。这背后的技术,就是个性化 AI 推荐算法。


推荐算法总是让你“头大”?


然而,在使用过程中我们会发现,AI 推荐算法推送的内容并不总是让你满意,有时推送的内容甚至与你的兴趣差之千里。 推荐算法给人的感觉差强人意,原因是多种多样的,比如数据的缺失、算法本身存在缺陷,或者推荐机制不完善等。而且,即使是在推荐算法的应用已经相当成熟的今天,还存在着隐私、幕后操纵等问题,比如去年闹得纷纷扬扬的 YouTube “艾莎门”视频事件,Facebook AI 推荐操纵美国总统选举的丑闻,以及近日前谷歌工程师实名揭发老东家利用公司资源,通过修改 YouTube 等产品的后台搜索和推荐算法,找到用户中潜在的特朗普支持者,并向他们推送相反的内容给他们洗脑,目的是让特朗普在 2020 年败选,引得特朗普连发推特进行谴责。不得不感叹,这波操作实在让人大开眼界,同时后背发凉。        640?wx_fmt=png  (图源:Fox News 公开视频画面) 从技术层面来说,推荐算法主要有基于内容的推荐算法、协同过滤推荐算法和基于知识的推荐算法等,但是每种方法都有其各自的优缺点,比如基于内容的推荐算法可以根据用户以前的观看历史,推荐强关联性的信息,这种方法可以避免 Item 的冷启动问题,但弊端在于推荐的 Item 可能会重复;协同过滤算法的训练过程比较长,但是训练完成后,推荐过程比较快;基于知识的推荐算法则需要构建复杂的规则等。 在设计一个推荐系统时,都会涉及召回和排序的算法设计,以更好地理解 item 和 user 的特征与他们之间的关系。以我们最常用的一个场景——购物来说,当系统要向一位用户推荐某一商品时,如何设计一个完整的电商领域推荐系统,选择哪个算法的效果最 work?到底怎样才算做到“真的懂他”? 这是推荐系统要解决的一个问题:了解每一个用户(个体),向他们推荐专属需求。从业务角度来说,推荐系统需要更高效、更理解用户,推荐结果更受用户喜欢;推荐算法在更多、更复杂场景下的拓展能力;而企业则是希望在提升效果的同时,还能降低计算、人力等成本。 如果你是一名推荐算法工程师,也许你可以和京东推荐工程团队的负责人殷大伟聊一聊,他建立了京东推荐系统。他将为你介绍电子商务推荐系统的设计,然后对推荐系统中存在的研究问题逐个展开,包括候选检索、用户行为理解,以及推荐排名等。最后,还会与你讨论一下商业推荐系统中对这些问题的最新进展和潜在解决方案。 进入深度学习时代,推荐算法从传统算法现在在结合 DL 方法后,推荐效果得到了很大的提升,但是,面对不断变化的用户需求,在高昂的计算成本、人力成本下,推荐系统领域的企业和开发者还面临很多挑战,比如面对性能瓶颈、高昂计算成本要怎么办? 随着知识图谱、强化学习、AutoML 等技术的研究成果不断应用于工程中,推荐系统也在尝试结合,对于开发者和企业来说,也是一大挑战。而这是否会成为企业都青睐的解决方案?还需要我们在不断探讨与实践。 对这些问题,华为诺亚方舟实验室推荐与搜索项目组资深研究员唐睿明可以给你一些答案和意见。他会告诉你,将 DL、强化学习、AutoML 这三项技术应用于推荐系统,会带来如何的效果,有哪些不错的研究与技术大家可以学习与运用?同时,大家还可以深度了解华为诺亚方舟实验室的研究成果以及其在推荐系统中的落地应用情况。 一言以蔽之,推荐系统不是没有可做的了,是还有很多工作有待大家去挖掘,也为自己的开发道路开辟新方向。在当下主流的购物、短视频、广告等几大场景中,推荐系统的现在与未来,要如何走? 

答案尽在这里

 身为开发者,这些问题是不是也在困扰着你,但却苦于没有渠道学习到真正有效的解决之道?现在机会就在眼前,来到 AI ProCon 2019,这里有当前一线的推荐系统构建者们,与你分享当今大受欢迎、效果显著的推荐系统实践案例,将推荐系统在各个领域落地复用的经验倾囊相授! AI ProCon 2019 专设了推荐系统技术专场,大会组委会邀请到了来自阿里妈妈、京东、华为和快手的推荐系统负责人,他们将带来在广告、电商、视频领域构建推荐系统的设计思路和解决方案:  阿里妈妈深度学习算法平台负责人 朱小强(出品人)         640?wx_fmt=png       朱小强,花名怀人,毕业于清华大学,阿里资深算法专家,现任阿里妈妈深度学习算法平台负责人、兼任定向广告&信息流广告排序技术团队负责人。他主持了三代核心算法架构(大规模、深度端到端、深度实时化)的设计和落地,驱动了深度学习对阿里广告技术的全面变革与创新,领导了阿里开源深度学习框架X-DeepLearning从0到1的自研、从1到开源演进的全过程,在KDD、AAAI、SIGIR等顶级会议上发表过DIN/DIEN/ESMM等多篇有影响力的工业实战论文,是workshop DLP-KDD 2019的发起人和联合主席。 京东集团高级总监 殷大伟 640?wx_fmt=png 殷大伟,京东集团高级总监,负责管理推荐工程团队,建立京东推荐系统。他还创建了数据科学实验室,领导推荐、搜索、数据记录、知识图谱等研究工作。在加入京东之前,他是雅虎实验室的高级研究经理,领导相关科学团队并负责雅虎搜索的核心搜索相关性。他获得了利哈伊大学理科硕士学位(2010 年)和博士学位(2013 年),山东大学本科毕业(2006 年)。他的研究领域包括数据挖掘、应用机器学习、信息检索和推荐系统,曾在高级会议和期刊上发表了 70 多篇研究论文,并获得 WSDM 2016 最佳论文奖,KDD 2016 最佳论文奖,WSDM 2018 最佳学生论文奖和 ICHI 2019 最佳论文荣誉奖。 演讲议题:电商中的推荐系统 内容简介:电子商务中的推荐系统通过推荐最符合其需求和偏好的项目来帮助用户完成信息搜索任务。 个性化推荐系统已经在商业应用中表现出了巨大的成功,例如亚马逊、eBay、淘宝等。在本次演讲中,我将首先介绍电子商务推荐系统的设计,然后对推荐系统中存在的研究问题逐个展开,包括候选检索、用户行为理解,以及推荐排名等。最后,我将讨论商业推荐系统中对这些问题的最新进展和潜在解决方案。 快手科技推荐架构负责人 任恺   640?wx_fmt=png 任恺,快手科技推荐架构负责人,2015年毕业于卡内基梅隆大学 (Carnegie Mellon University),获得博士学位。主要研究领域方向为大规模分布式系统、机器学习系统和大数据分析。博士期间发表多篇系统领域顶级会议论文,并曾获得 2014 年世界超算大会(Supercomputing)最佳论文奖。博士毕业后,曾担任 Instagram 广告组的研究科学家。作为Instagram 广告组的创始成员,从零开始建设 Instagram 广告排序服务,和团队合作在一年内将Instagram 广告营收做到数十亿美元规模。2019 年加入快手,负责核心推荐系统和中台的建设,包括推荐线上服务、推荐模型大规模实时训练、推荐异构计算等项目。 华为诺亚方舟实验室推荐与搜索项目组资深研究员 唐睿明 640?wx_fmt=png 唐睿明,华为诺亚方舟实验室推荐与搜索项目组资深研究员。他于 2009 年在中国东北大学获得学士学位,专业为计算机科学与技术;并在 2014 年从新加坡国立大学计算机专业获得博士学位。2014 年底,他加入华为诺亚方舟实验室。他的研究方向包括机器学习、推荐系统、深度学习、强化学习、AutoML等。在基于深度学习和强化学习的推荐系统领域,他的多篇论文发表于国际顶级会议和期刊,如WWW,IJCAI,TOIS,AAAI,RecSys,SIGIR等。 演讲议题:推荐系统中的前沿技术研究与落地:深度学习、强化学习与AutoML 内容简介:推荐系统在人们的日常生活中随处可见,是不可或缺的一部分。深度学习,在大数据时代,做为主流的机器学习模型之一,在图像和语音识别领域取得了突破性的进展。强化学习,在机器人控制和游戏博弈场景下,取得了长足的进步。AutoML,在计算视觉中的图像分类问题中,自动设计出各种新颖的神经网络,不断刷新各类竞赛的精度上限。 将这三类技术应用于推荐系统,会带来如何的效果,这是一个非常有趣且值得研究的课题。在这次演讲中,我将首先向大家简单的介绍推荐系统、其在华为内部的一些应用场景;然后我会向大家科普学术界和工业界中一些比较流行的用于推荐系统的深度学习、强化学习模型和AutoML技术;同时,我会向大家展示诺亚方舟实验室研究出的学术成果以及其在推荐系统中的落地应用情况。 更多嘉宾正在确认之中......(最终出席嘉宾以现场为准) 2019 年 9.6~9.7(周五~周六),AI ProCon 2019 将在北京富力万丽酒店如约举行。 除了推荐系统论坛之外,我们还邀请到来自阿里、华为、Google Brain、Amazon、微软中国、百度、京东、小米、快手、科大讯飞、商汤、旷视、图森、云知声、思必驰等企业和机构的重磅嘉宾,在 Keynote 和机器学习、计算机视觉、自然语言处理、知识图谱、推荐系统、5G 驱动 AIoT、AI 开源、AI+小程序、AI+DevOps 9 大技术论坛上分享硬核 AI 技术。 届时,来自全球各地的 60 余位 AI 专家和学者,包括阿里巴巴技术副总裁贾扬清、微软(中国)首席技术官韦青、思必驰副总裁总裁、北京研发院院长初敏、商汤科技研究总监石建萍等将齐聚一堂,共同研讨机器学习领域最新的技术趋势与最严峻的挑战和难题。       640?wx_fmt=png       AI ProCon 首轮议题曝光,精彩马上为你呈现!        640?wx_fmt=png         640?wx_fmt=png              距离大会优惠票 2050 元限时抢购结束只剩 4 天,时间不多,扫描下方二维码购票,即享折扣。        640?wx_fmt=png 特惠票价限时抢购中,扫码或点击阅读原文,了解更多嘉宾和大会信息。

相关文章:

前端基础_ES6

声明 三大关键字声明变量:var (ES5语法) let (ES6语法)声明常量:const (ES6语法) var 声明变量特性1、支持 函数作用域2、支持 JS预解析 (所谓变量提升)3、支持 重复声明 &#xff…

5大典型模型测试单机训练速度超对标框架,飞桨如何做到?

导读:飞桨(PaddlePaddle)致力于让深度学习技术的创新与应用更简单。在单机训练速度方面,通过高并行、低开销的异步执行策略和高效率的核心算子,优化静态图训练性能,在Paddle Fluid v1.5.0的基准测试中&…

windowsXP用户被禁用导致不能网站登录

1、查看系统事件,发现弹出如下的错误 2、根据上面的错误,我们很容易就可以判断是禁用了账户引起的 2.1后面进入计算机管理,再进入用户管理 2.2双击点开Internet来宾用于,发现此用户已经停用了。 2.3双击点开与IIS访问有关用户&…

从头到尾使用Geth的说明-3-geth参数说明和环境配置

1.参数说明 ETHEREUM选项:--config value TOML 配置文件--datadir "/home/user4/.ethereum" 数据库和keystore密钥的数据目录--keystore keystore存放目录(默认在datadir内)--nousb …

OpenSSL中对称加密算法DES常用函数使用举例

主要包括3个文件&#xff1a; 1. cryptotest.h:#ifndef _CRYPTOTEST_H_ #define _CRYPTOTEST_H_#include <string>using namespace std;typedef enum {GENERAL 0,ECB,CBC,CFB,OFB,TRIPLE_ECB,TRIPLE_CBC }CRYPTO_MODE;string DES_Encrypt(const string cleartext, const…

从原理到落地,七大维度读懂协同过滤推荐算法

作者丨gongyouliu来源 | 大数据与人工智能导语&#xff1a;本文会从协同过滤思想简介、协同过滤算法原理介绍、离线协同过滤算法的工程实现、近实时协同过滤算法的工程实现、协同过滤算法应用场景、协同过滤算法的优缺点、协同过滤算法落地需要关注的几个问题等7个方面来讲述。…

sql查询语句优化需要注意的几点

为了获得稳定的执行性能&#xff0c;SQL语句越简单越好。对复杂的SQL语句&#xff0c;要设法对之进行简化。 常见的简化规则如下&#xff1a; 1&#xff09;不要有超过5个以上的表连接&#xff08;JOIN&#xff09; 2&#xff09;考虑使用临时表或表变量存放中间结果。 3&#…

决策树算法原理(ID3,C4.5)

决策树算法原理(CART分类树) CART回归树 决策树的剪枝 决策树可以作为分类算法&#xff0c;也可以作为回归算法&#xff0c;同时特别适合集成学习比如随机森林。 1. 决策树ID3算法的信息论基础 1970年昆兰找到了用信息论中的熵来度量决策树的决策选择过程&#xff0c;昆兰把这…

对称加密算法之RC4介绍及OpenSSL中RC4常用函数使用举例

RC4是一种对称密码算法&#xff0c;它属于对称密码算法中的序列密码(streamcipher,也称为流密码)&#xff0c;它是可变密钥长度&#xff0c;面向字节操作的流密码。 RC4是流密码streamcipher中的一种&#xff0c;为序列密码。RC4加密算法是Ron Rivest在1987年设计出的密钥长度…

SpringMVC中实现的token,防表单重复提交

一&#xff1a;首先创建一个token处理类 &#xff0c;这里的类名叫 TokenHandlerprivate static Logger logger Logger.getLogger(TokenHandler.class);static Map<String, String> springmvc_token new HashMap<String, String>();//生成一个唯一值的tokenSupp…

利用CxImage实现编解码Gif图像代码举例

Gif(Graphics Interchange Format&#xff0c;图形交换格式)是由CompuServe公司在1987年开发的图像文件格式&#xff0c;分为87a和89a两种版本。Gif是基于LZW算法的无损压缩算法。Gif图像是基于颜色表的&#xff0c;最多只支持8位(256色)。Gif减少了图像调色板中的色彩数量&…

SpringBoot b2b2c 多用户商城系统 ssm b2b2c

来源&#xff1a; SpringBoot b2b2c 多用户商城系统 ssm b2b2c用java实施的电子商务平台太少了&#xff0c;使用spring cloud技术构建的b2b2c电子商务平台更少&#xff0c;大型企业分布式互联网电子商务平台&#xff0c;推出PC微信APP云服务的云商平台系统&#xff0c;其中包括…

AI“生死”落地:谁有资格入选AI Top 30+案例?

2019 年&#xff0c;人工智能应用落地的重要性正在逐步得到验证&#xff0c;这是关乎企业生死攸关的一环。科技巨头、AI 独角兽还有起于草莽的创业公司在各领域进行着一场多方角斗。进行平台布局的科技巨头们&#xff0c;正在加快承载企业部署 AI 应用的步伐&#xff0c;曾经无…

liunx 下su 和sudo 的区别

一. 使用 su 命令临时切换用户身份1、su 的适用条件和威力su命令就是切换用户的工具&#xff0c;怎么理解呢&#xff1f;比如我们以普通用户beinan登录的&#xff0c;但要添加用户任务&#xff0c;执行useradd &#xff0c;beinan用户没有这个权限&#xff0c;而这个权限恰恰由…

非对称加密算法之RSA介绍及OpenSSL中RSA常用函数使用举例

RSA算法&#xff0c;在1977年由Ron Rivest、Adi Shamirh和LenAdleman&#xff0c;在美国的麻省理工学院开发完成。这个算法的名字&#xff0c;来源于三位开发者的名字。RSA已经成为公钥数据加密标准。 RSA属于公开密钥密码体制。公开密钥体制就是产生两把密钥&#xff0c;一把…

依图科技CEO朱珑:“智能密度”对AI发展意味着什么?

8月9日&#xff0c;由中央网信办、工业和信息化部、公安部联合指导&#xff0c;厦门市政府主办的“中国人工智能峰会”于厦门召开。中国工程院院士、北京大学教授高文&#xff0c;依图科技创始人兼CEO朱珑博士等出席峰会并发表了主题演讲。当前&#xff0c;人工智能正在扮演越来…

Office 2016使用NTKO OFFICE控件提示“文件存取错误”的解决办法

2019独角兽企业重金招聘Python工程师标准>>> 之前使用NTKO&#xff0c;电脑安装的说OFFICE2007,但是前2天电脑固态硬盘坏了 &#xff0c;重新安装了系统&#xff0c;安装的说win10和office2016&#xff0c;再访问网站使用ntko时&#xff0c;却提示“文件存取错误”&…

如何制作一个类似Tiny Wings的游戏 Cocos2d-x 2.1.4

在第一篇《如何使用CCRenderTexture创建动态纹理》基础上&#xff0c;增加创建动态山丘&#xff0c;原文《How To Create A Game Like Tiny Wings with Cocos2D 2.X Part 1》&#xff0c;在这里继续以Cocos2d-x进行实现。有关源码、资源等在文章下面给出了地址。 步骤如下&…

腾讯优图开源业界首个3D医疗影像大数据预训练模型

整理 | Jane出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;近日&#xff0c;腾讯优图首个医疗AI深度学习预训练模型 MedicalNet 正式对外开源。这也是全球第一个提供多种 3D 医疗影像专用预训练模型的项目&#xff0c;将为全球医疗AI发展提供基础。许多研…

接口冲突的一种解决方法

问题描述&#xff1a;在一个大的项目中往往会包括很多模块&#xff0c;会有不同的部门或公司来负责实现某个模块&#xff0c;也有可能有第三方或客户的参与。假如他们都用到了某个开源软件&#xff0c;底层模块根据自身的需求对这个开源软件进行了修改或裁减。上层也用到了此开…

程序员:请你不要对业务「置之不理」

成长是条孤独的路&#xff0c;一个人会走得更快&#xff1b;有志同道合者同行&#xff0c;会走得更远。本篇内容整理自 21 天鲲鹏新青年计划线上分享内容。鲲鹏新青年计划是由 TGO 鲲鹏会组织的线上分享活动&#xff0c;希望能帮助更多同学一起学习、成长。12 月 28 日&#xf…

史上最简单的人脸识别项目登上GitHub趋势榜

来源 | GitHub Trending整理 | Freesia译者 | TommyZihao出品 | AI科技大本营&#xff08;ID: rgznai100&#xff09;导读&#xff1a;近日&#xff0c;一个名为 face_recognition 的人脸识别项目登上了 GitHub Trending 趋势榜&#xff0c;赚足了眼球。自开源至截稿&#xff0…

Centos 64位 Install certificate on apache 即走https协议

2019独角兽企业重金招聘Python工程师标准>>> 一: 先要apache 请求ssl证书的csr 一下是步骤&#xff1a; 重要注意事项 An Important Note Before You Start 在生成CSR文件时同时生成您的私钥&#xff0c;如果您丢了私钥或忘了私钥密码&#xff0c;则颁发 证书给您…

C/C++中“#”和“##”的作用和用法

在C/C的宏中&#xff0c;”#”的功能是将其后面的宏参数进行字符串化操作(Stringfication)&#xff0c;简单说就是在对它所引用的宏变量通过替换后在其左右各加上一个双引号。而”##”被称为连接符(concatenator)&#xff0c;用来将两个子串Token连接为一个Token。注意这里连接…

国贫县山西永和:“一揽子”保险“保”脱贫

永和是吕梁山特困连片地区的深度贫困县&#xff0c;生产生活条件极差。 范丽芳 摄 永和是吕梁山特困连片地区的深度贫困县&#xff0c;生产生活条件极差。 范丽芳 摄 中新网太原1月16日电 题&#xff1a;国贫县山西永和&#xff1a;“一揽子”保险“保”脱贫 作者范丽芳 李海金…

内存泄漏检测工具VLD在VS2010中的使用举例

Visual LeakDetector(VLD)是一款用于Visual C的免费的内存泄露检测工具。它的特点有&#xff1a;(1)、它是免费开源的&#xff0c;采用LGPL协议&#xff1b;(2)、它可以得到内存泄露点的调用堆栈&#xff0c;可以获取到所在文件及行号&#xff1b;(3)、它可以得到泄露内存的完整…

天下武功,唯快不破,论推荐系统的“实时性”

作者 | 王喆转载自知乎王喆的机器学习笔记导读&#xff1a;周星驰著名的电影《功夫》里面有一句著名的台词——“天下武功&#xff0c;无坚不摧&#xff0c;唯快不破”。如果说推荐系统的架构是那把“无坚不摧”的“玄铁重剑”&#xff0c;那么推荐系统的实时性就是“唯快不破”…

新疆兵团开展迎新春“送文化下基层”慰问演出活动

演员表演舞蹈。 戚亚平 摄 演员表演舞蹈。 戚亚平 摄演员表演豫剧《花木兰》选段。 戚亚平 摄为物业公司员工送春联。 戚亚平 摄公安民警收到春联后留影。 戚亚平 摄走进退休职工家中表演节目。 戚亚平 摄为退休职工送春联。 戚亚平 摄 1月16日&#xff0c;2019年迎新春新疆生产…

Python爬取B站5000条视频,揭秘为何千万人为它流泪

作者 | Yura编辑 | 胡巍巍来源 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;导语&#xff1a;我们特邀作者Yura爬取B站5000条视频&#xff0c;为你揭秘电影《哪吒》的更多“优秀梗”&#xff0c;看完还能Get新技能&#xff0c;赶快往下滑吧。这个夏天&#xff0c;《哪…

父域与子域之的信任关系

搭了一个测试环境&#xff0c;做一个父、子域间信任关系的测试&#xff0c;过程如下&#xff1a;两台测试服务器&#xff0c;主域为primary.com&#xff0c;子域为child.primary.com客户机Clientpri加入父域&#xff0c;客户机Clientcli加入子域&#xff0c;父域中有一个用户为…