京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要
来源 | 京东智联云开发者
过去几十年间,人类的计算能力获得了巨大提升;随着数据不断积累,算法日益先进,我们已经步入了人工智能时代。确实,人工智能概念很难理解,技术更是了不起,背后的数据和算法非常庞大复杂。很多人都在疑惑,现在或未来AI将会有哪些实际应用呢?
其实,关于AI的实际应用以及所带来的商业价值并没有那么的“玄幻”,很多时候就已经在我们的身边。接下来,【AI论文解读】专栏将会通过相关AI论文的解读,由深入浅地为大家揭秘,AI技术是如何对电商领域进行赋能,以及相关的落地与实践。
人工智能技术在电商领域,有着丰富的应用场景。应用场景是数据入口,数据通过技术得到提炼,反过来又作用于技术,二者相辅相成。
京东基于自然语言理解与知识图谱技术,开发了商品营销内容AI写作服务。并将此项技术应用到了京东商城【发现好货】频道中。
通过AI创作的数十万商品营销图文素材,不仅填补了商品更新与达人写作内容更新之间的巨大缺口,也提升了内容频道的内容丰富性。
同时,AI生成内容在曝光点击率、进商详转化率等方面其实都表现出了优于人工创作营销的内容。
接下来让我们一起来看看,针对不同群体采用不同营销策略及不同风格的营销文案从而提高营销转化率是怎样通过AI来实现的。
与传统的文本摘要任务相比,商品摘要任务更具挑战性。一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着至关重要的影响。因此,商品摘要系统必须能够充分挖掘商品视觉信息,反映商品的外观特色。另一方面,不同的产品有不同的卖点。例如,紧凑型冰箱的优点是节省空间,而环保型冰箱的优点是节能。因此,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买。
本文接下来将介绍由京东 AI 研究院提出的一种电商商品的多模态摘要模型,该模型可以有效地整合商品的视觉和文本信息来生成卖点突出、流畅和简洁的商品文本摘要。
论文的标题为 :Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products ,发表于 AAAI 2020。
论文链接:
http://box.jd.com/sharedInfo/2926429040ECC7D3
多模态摘要模型
如下图1所示,商品广告含有大量的文字介绍,顾客很难在短时间内在这些广告中获取有价值的商品信息,尤其是当顾客想要比较多个商品时,将会耗费大量的时间,影响了购物体验。商品摘要模型可以为商品生成文本摘要,为潜在消费者提供了短时间内了解商品的便利。从消费者决策的角度出发,一个好的商品摘要需要反映商品的外观特色和卖点信息,这也是本文提出的商品摘要模型的出发点。
图1
论文提出了一种基于商品要素的多模态商品摘要方法,如图1所示,该模型将商品图像、产品标题和其他产品描述作为输入,生成商品文本摘要。该模型不仅可以有效地整合商品的视觉和文本信息,而且从商品要素出发,使生成的商品摘要尽可能的包含商品的特色要素,并提高商品摘要的流畅性和简洁性。
论文中构建了一个中文商品摘要数据集,该数据集包含约140万个“商品-摘要”对,涵盖家电、服饰和箱包品类。在该数据集上的实验结果表明,文中提出的模型在自动评价和人工评价指标上都显著优于其他对比方法。
模型介绍
如图2所示,论文中提出的商品摘要模型基于指针-生成器网络(Pointer-Generator)。采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,通过注意力机制生成图片上下文向量参与解码。
图2
首先,对商品要素进行建模(所谓的商品要素,就是商品不同方面的属性。例如:对洗衣机而言,商品要素包括容量和能耗等),然后从商品的要素出发,对摘要的重要性、非冗余性和可读性进行建模。
(1)采用基于商品要素的RAML(reward augmented maximum likelihood)训练,鼓励模型生成的摘要涵盖商品的特色要素。如图2(b)所示,该商品ground-truth特色要素是容量、操控与电机,则该模型将会鼓励生成描述容量、操控与电机相关的文本;
(2)采用基于商品要素的覆盖度机制消除冗余信息。传统覆盖度机制仅能在词维度进行去冗余,难以处理相关词冗余问题。如图2(c)所示,“noise”、“quiet”和“tranquil”均在描述“运行声音”这一商品要素,如果仅对“noise”进行去冗余,难以保证“quiet”和“tranquil”不出现摘要中。本文提出的模型通过商品要素维度的去冗余,可以避免“noise”、“quiet”和“tranquil”同时出现在摘要中;
(3)通过商品要素放回跳机制提高摘要的可读性。如图2(d)所示,商品要素的回跳描述降低了商品摘要的连贯性,影响了消费者的阅读体验。本文提出的模型通过解码时禁用回跳要素词,有效地避免了这一现象。
实验结果
如表1所示,本文提出的带有的多模态商品摘要模型,MMPG模型取得了比所有基于纯文本的模型更好的结果,这证明了商品视觉信息和商品要素信息在商品摘要任务中起着重要的作用。
表1
总结
论文提出了一个多模态商品摘要模型,其可以利用商品图像、标题和其他文本介绍,为商品生成摘要。文中提出的模型可以有效地利用商品的视觉信息,并反映商品的特色要素,从重要性、非冗余性和可读性的角度对商品要素进行了有效的建模。
对于电商而言,海量商品的营销内容在由达人供稿的过程中,受限于达人写作的效率限制,商品更新速度明显高于营销内容上线速度,导致内容短缺。
AI生成内容在生成效率、曝光点击率、订单转化率等方面其实都表现出了优于人工创作营销的内容。该方法正在应用于垂直电商、综合电商、社交电商、新媒体平台等众多场景。
【end】◆精彩推荐◆「AI应用技术大师课」是CSDN发起的“百万人学AI”倡议下的重要组成部分,4月份AI大师课以线上技术峰会的形式推出,来自微软、硅谷TigerGraph、北邮等产学界大咖就图计算+机器学习,语音技术、新基建+AI、AI+医疗等主题展开分享,扫描下方二维码免费报名,限时再送299元「2020AI开发者万人大会」门票一张。
推荐阅读
用于单图像超分辨率的对偶回归网络,达到最新SOTA | CVPR 2020
悼念前端大牛司徒正美
罗永浩抖音直播首秀:3小时1.1亿;微软曝三屏折叠机专利;Linux Mint 20仅提供64位版本
“死扛”高并发大流量,大麦抢票的技术涅槃之路
比特币由"蒙面人"创造,那下一个"比特币"还会由蒙面人创造吗?
在容器上构建持续部署及最佳实践初探
你点的每个“在看”,我都认真当成了AI
相关文章:

CSS哲学伪命题
标题党。这篇文章断断续续的修改过好几次,也没有满意,本来是想总结一下我这些零散的 CSS 知识结构,可能由于知识体系不全面,总是没能把知识点串联成一个通顺的内容。贴出来权当大家一起讨论下“前世今生”。文章后续可能会不定时更…

Linux TCP/IP协议栈笔记
数据包的接收作者:kendoKernel:2.6.12一、从网卡说起这并非是一个网卡驱动分析的专门文档,只是对网卡处理数据包的流程进行一个重点的分析。这里以Intel的e100驱动为例进行分析。大多数网卡都是一个PCI设备,PCI设备都包含了一个标…
技术大佬的肺腑之言:“不要为了 AI 而 AI”! | 刷新 CTO
扫描上方二维码直达精彩回顾整理 | 伍杏玲出品 | CSDN(ID:CSDNnews)据 CSDN 最新数据统计显示,在 CSDN 3000万的注册开发者中,689 万开发者有阅读、撰写与研究 AI 技术的行为,聚焦 AI 学习及应用的开发者人…

Silverlight中使用CompositionInitializer宿主MEF
MEF可以在传统应用程序中使用(包括桌面的Winform、控制台程序和Web的ASP.NET),也可以在RIA的Silverlight中使用。在Silverlight中只是宿主的方式有所不同,实际上在Silverlight中也可以像传统应用程序中是方式去宿主,ME…
Verilog与SystemVerilog编程陷阱:怎样避免101个常犯的编码错误
这篇是计算机类的优质预售推荐>>>>《Verilog与SystemVerilog编程陷阱:怎样避免101个常犯的编码错误》 编辑推荐 纠错式学习,从“陷阱”中学习编程,加深对语言本身的理解。逆向式学习,从错误中学习避免错误的方法。让读…

Linux网卡驱动程序编写
Linux网卡驱动程序编写 [摘自 LinuxAID] 工作需要写了我们公司一块网卡的Linux驱动程序。经历一个从无到有的过程,深感技术交流的重要。Linux作为挑战微软垄断的强有力武器,日益受到大家的喜爱。真希望她能在中国迅速成长。把程序文档贴出来࿰…
旷视提双边分支网络BBN:攻坚长尾分布的现实世界任务 | CVPR 2020 Oral
作者 | 旷视研究院出品 | AI科技大本营(ID:rgznai100)导读:本文是旷视 CVPR 2020 论文系列解读文章,也是 CVPR 2020 Oral展示论文之一,它揭示了再平衡方法解决长尾问题的本质及不足:虽然增强了分类器性能&a…

kissy core
http://code.google.com/p/kissy/转载于:https://www.cnblogs.com/pinnasky/archive/2010/07/07/1772646.html
VIM多窗口编辑
vim提供多窗口编辑的功能,可以简化复合的编辑任务。vim的多窗口并不是说在终端上启动多个vim实例。启动多窗口编辑 vim的多窗口是动态的,可以开始编辑时就打开多窗口,也可以工作时随时增加新窗口,或者删除一个窗口。$ …
从Nginx绑定80端口学套接字编程
《UNIX网络编程(卷1):套接字联网API(第3版)》 ngx_connection.c ngx_int_t ngx_open_listening_sockets(ngx_cycle_t *cycle) {int reuseaddr;ngx_uint_t i, tries, failed;ngx_err_t err;ngx_log_t *log;ngx_socket_t …
中国无人机“老炮儿”回忆录
整理 | 夕颜采访嘉宾 | 刘宾,通飞航空总工程师、飞行教员来源 | CSDN(ID:CSDNnews)今天的采访嘉宾有些与众不同,在我的印象中,这是一位不原意用“中国式”讲话与人沟通的人,因为费劲,也只有在回…

一些常用DOS命令
1. gpedit.msc-----组策略2. sndrec32-------录音机3. Nslookup-------IP地址侦测器4. explorer-------打开资源管理器5. logoff---------注销命令6. tsshutdn-------60秒倒计时关机命令7. lusrmgr.msc----本机用户和组8. services.msc---本地服务设置9. oobe/msoobe /a----检查…

linux文本编辑nano
2019独角兽企业重金招聘Python工程师标准>>> Nano命令指南 今天在输命令时,无意中输入了nano,对这个命令不太熟悉,结果不知道如何才能退出,保存,赶快查了一下资料,原来是这样的啊。打开文件与新…

write的奥秘
在Linux下我们在使用设备的时候,都会用到write这个函数,通过这个函数我们可以象使 用文件那样向设备传送数据。可是为什么用户使用write函数就可以把数据写到设备里面 去,这个过程到底是怎么实现的呢? 这个奥秘就在于设备驱动…

常用的键盘命令
Alt空格C 关闭窗口 <?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />Alt空格N 最小化当前窗口 Alt空格R 恢复最小化窗口 Alt空格X 最大化当前窗口 Alt空格M 移动窗口 Alt空格S 改变窗口大小 AltTab 两个程序交换 Alt255 QQ号中输…
京东智能内容创作算法的演进与实践:基于关键词自动生成摘要
来源 | 京东智联云开发者导读:京东商城背后的 AI 技术能力揭秘: 基于关键词自动生成摘要过去几十年间,人类的计算能力获得了巨大提升;随着数据不断积累,算法日益先进,我们已经步入了人工智能时代。确实&…

【基础复习】二:预处理、const与sizeof
赋值语句 1.i的值为? #include <iostream> using namespace std; int i 1; int main() {int i i; } 解析: 此时main函数内的i是优先考虑局部变量,除非使用作用域符号,否则是和外面值为1的i是无关的。 其次,使用…

使用多线程还是用IO复用select/epoll? epoll 或者 kqueue 的原理是什么?
原作者:蓝形参 原文:http://www.zhihu.com/question/20114168/answer/14024115 使用多线程还是用IO复用select/epoll? 多线程模型适用于处理短连接,且连接的打开关闭非常频繁的情形,但不适合处理长连接。多线程模型默认情况下…
使用大batch优化深度学习:训练BERT仅需76分钟 | ICLR 2020
作者 | Yang You, Jing Li等译者 | 刘畅在海量数据集上训练大型深度神经网络,是非常具有挑战性的。最近,有许多研究均使用大batch随机优化方法来解决此问题。在该研究领域中,目前最杰出的算法是LARS,它通过采用分层自适应学习率&a…

华为AR28-11路由器配置
公司使用华为AR28-11路由器,宽带接入。现使用2M光纤接入,地址:124.117.254.* 255.255.255.252.公司电脑使用192.168.1.0 255.255.255.0 网段地址参考配置#version 5.20, Release 1205P02, Basic#sysname H3C#domain default enable system#vl…

PHPExcel使用-使用PHPExcel导出文件-导出MySQL数据
现在数据库里面有一组数据,我们将它按照不同的难度进行分sheet. 首先我们需要写一个mysql的配置文件- db.config.php(utf-8编码) : <?php $dbconfig array( host > 127.0.0.1, username > root, password > , database > xxx, charset &…

C语言清空输入缓冲区的N种方法对比
C语言中有几个基本输入函数: //获取字符系列 int fgetc(FILE *stream); int getc(FILE *stream); int getchar(void); //获取行系列 char *fgets(char * restrict s, int n, FILE * restrict stream); char *gets(char *s);//可能导致溢出,用fgets代替之…
低耗时、高精度,微软提基于半监督学习的神经网络结构搜索算法
作者 | 罗人千、谭旭、王蕊、秦涛、陈恩红、刘铁岩 来源 | 微软研究院AI头条(ID:MSRAsia)编者按:近年来,神经网络结构搜索(Neural Architecture Search, NAS)取得了较大的突破,但仍然面临搜索耗…

《虚拟化与云计算》读书感(三)数据中心的概述
看了《虚拟化与云计算》的第一章第一节‘数据中心的概述’。在我读这一节开始,我看到这个题目的时候总是联想到类似谷歌数据中心一类的东西,多个硬盘或者服务器的堆叠。然后整来几个集装箱把这些堆叠的服务器塞进去,然后供用户使用。然而自从…

golang笔记——struct
1、定义一个结构体 type User struct {userid intusername stringpassword string } 2、初始化一个结构体 有两种情况,一是得到结构体的对象,一是得到结构的对象指针,分别有三种方式: //第1种方式,先声明对象&#x…

posix_memalign
翻译的<Linux system programming> 第八章 二 ;《Linux System Programming》中文版 对齐 数据的对齐(alignment)是指数据的地址和由硬件条件决定的内存块大小之间的关系。一个变量的地址是它大小的倍数的时候,这就叫做自然对齐(naturally aligned)。例如&…

ubuntu 10.04 安装eclipse及其中文语言包
1.安装eclipsesudo apt-get install eclipse2.暗自中文语言包点 击下载中文语言包(http://www.eclipse.org/downloads/download.php?file /technology/babel/babel_language_packs/BabelLanguagePack-eclipse- zh_3.5.0.v20091121043401.zip&urlhttp://d2u376u…
世界顶级赛事百万座位如何做到票务限时匹配?
作者 | 阿里文娱技术专家 展恒出品 | AI科技大本营(ID:rgznai100)背景麦座,是大麦旗下的票务系统。去年,我们承接了 2019 年国际篮联篮球世界杯(2019FBWC), 核心目标是完成三种套票的运营及售卖…

[转](不理想)Ubuntu下更改主显示器
参考链接:http://www.cnblogs.com/feng_013/archive/2012/03/05/2380111.html 查看显示器信息: fdmfdm-OptiPlex-780:~$ xrandr 设置主显示器 fdmfdm-OptiPlex-780:~$ xrandr --output HDMI1 --auto --primary 设置副显示器在主显示器右边 fdmfdm-OptiPl…

Nginx源码分析--数据对齐posix_memalign和memalign函数
posix_memalign函数() /* * 背景: * 1)POSIX 1003.1d * 2)POSIX 标明了通过malloc( ), calloc( ), 和 realloc( ) 返回的地址对于 * 任何的C类型来说都是对齐的 * 功能:由posix_memalign分配的内存空间&…