当前位置: 首页 > 编程日记 > 正文

认知智能再突破,阿里 18 篇论文入选 AI 顶会 KDD

作者 | 马超

责编 | 屠敏

头图 | CSDN 下载自东方 IC

出品 | CSDN(ID:CSDNnews)

近日,国际知识发现与数据挖掘协会KDD在官网(https://www.kdd.org/kdd2020)公布其2020年度的论文收录结果,笔者看到阿里共有18篇论文入选,这个入选论文数量刷新国内企业记录,成为近几年KDD会议论文入选数量最多的科技公司之一。

KDD(Knowledge Discovery and DataMining)是机器学习领域的顶级国际学术会议,由ACM创办于1995年,目前KDD在AI领域已经发展成为影响力最大、最具活力的国际学术组织之一。

KDD对论文接收非常严格,入选论文非常注重可重现性。与其它AI顶会允许rebuttal的方式不同,KDD自2019年开始使用双盲审稿制度,每年的接收率仅为15%左右,收录的论文代表了学术界和工业界的研究方向。由于严格的入选标准,KDD官方材料显示,今年入选论文仅有337篇。

而且尤其值得一提的是由KDD组织是对我国科技界相当友好的国际组织,由KDD举办的KDD CUP,也是目前是目前数据挖掘领域中规模最大、影响最广、水平最高的国际顶级赛事,有数据挖掘领域“世界杯”之称,而在这项赛事上阿里相关团队的成绩也相对不错,并两次当选赛事主办方。

此次阿里巴巴入选的18篇论文中,认知智能再次成为关键,有6篇论文为认知智能方向的研究成果,并全面涵盖了认知智能的三个层次,包括跨领域知识图谱(底料),图神经网络(推理工具),用户交互(图文、短视频理解)

据笔者的最新观察,目前在疫情的影响下,比如我们银行这些非科技巨头企业正在全面触云,而BAT这样的科技巨头则在全力的将AI能力进行由感知到认知的升级,最近除了本次阿里称雄KDD之外,腾讯也凭借其在对话数据方面的超强积累,在自然语言处理的顶会ACL上取得了非常好的成绩,相信而这样的态势可能还将持续很长一段时间。

认知智能——科技巨头的必由之路

数据是人工智能的三要素之一,堪称我们这个数据时代的石油。阿里旗下淘宝、天猫等电商平台丰富的业务场景无疑是为其AI能力提供了强力的支撑,而如何利用这样绝佳的“数据训练场”, 使数据真正产生价值,无疑成了摆在各巨头前面的一道难题。

笔者在前文《达摩院十大科技趋势发布:2020非同小可》中曾经介绍过。人工智能正在从感知智能到认知智能演进,而关键突破口就是跨过深度学习去做研究。由于深度学习只能处理单一模态的数据,因此深度学习模型下的智能机器只能够照章办事,缺乏灵活性,认知智能就是要找到多模态信息之间的关系,因此这使得多模态成为完成由感知到认知这一跨越的必然途径。

比如今年KDD Cup的一道赛题就是“多模态商品推荐”, 其中多模态商品推荐指的是关联融合视频、图片、文本等多模态用户数据,并结合用户的购买习惯、浏览序列等多维信息进行建模学习,精准理解用户的检索需求,推荐并返回用户真正关心、感兴趣的产品图片或视频。我们目前的年轻人尤其是90后一代,在对话当中经常使用表情图、动态图等方式来表达情感,而将这些非语言信息的语义提取并翻译出来,就是多模态的含义了。

认知智能的三大支柱:

知识图谱、图神经网络(推理工具)、用户交互

下面笔者就认知智能的三大核心支柱:知识图谱、图神经网络(推理工具)、用户交互三个核心概念向各位读者做一下简要介绍。

知识图谱

知识图谱可以看做是主体以及其关系的知识库,是知识表示方式之一,知识图谱的构建可以为计算认知技术,提供了丰富的背景知识,使得机器语言认知成为可能,因此知识图谱也成为了行业智能化转型道路上的关键技术,也是认知智能的重要展示形式。

图神经网络

图神经网络(GNN)将深度神经网络从处理传统非结构化数据(如图像、语音和文本序列)推广到更高层次的结构化数据(如图结构)。大规模的图数据可以表达丰富和蕴含逻辑关系的人类常识和专家规则,图节点定义了可理解的符号化知识,不规则图拓扑结构表达了图节点之间的依赖、从属、逻辑规则等推理关系。可以说图神经网络是对机器学习进行智慧赋能最重要的落地路径。

用户交互

前段时间笔者经常熬夜加班,结果打开淘宝会发现总给我推荐防脱洗发水,当然目前已经推荐枸杞了。不过这其实也说明认知智能的终极发展就是让用户在使用过程中对于“人工智能”不断淡化,甚至无感化。

现在用户使用人工智能时还会明显感受到它的存在,比如你打开电视还需要说“我要看**的电视剧”,还要对手机说“给**打电话”而真正实现认知智能之后,将会让你觉得你的这些交互行为变为多余,比如你回到家,人工智能系统会根据你的步态,推荐一个适合你当下身体状况的食谱,等你吃完饭下楼去超市的时候,你的手机会建议补充一些牛奶,因为你刚刚已经把家里最一一袋牛奶喝掉了。相信读到这里读者也就会明白,化有形于无形,就是用户交互的最终奥义。

认知智能代表论文解读

在通读本次KDD 2020阿里的18篇论文入选论文之后,笔者认为《DisentangledSelf-Supervision in Sequential Recommenders》是比较有代表性的一篇,在此文中阿里AI团队提出了一种让机器预测人类行为的训练思路,通过用户之前的行为序列来预测用户未来的行为,并融合了解纠缠表征和自监督对比学习,突破了目前主流推荐算法依赖于过往数据做预测而无法进行精准、长远推理的局限。

《Graph Contrastive Codingfor Structural Graph Representation Pre-Training》、《UnderstandingNegative Sampling in Graph Representation Learning》两篇论文则是有关图表示学习领域中,中创新性比较强的。其中前者提出一种图对比编码(GCC)的方案,以捕获多个网络之间的通用网络拓扑特性,并利用对比学习使模型能够学习内在的和可传递的结构表示形式;而后一篇对负采样策略在图网络中的使用进行了一次非常有益的尝试,我们知道负例采样最早被用在词向量的表示中,而在图表示学习中还鲜有其它尝试,而此论文中从目标函数和方差两个角度系统地分析了负采样的作用,从理论上证明了负采样与正采样在确定优化目标和估计方差方面同样重要。

而《A Dual Heterogeneous GraphAttention Network to Improve Long-Tail Performance for Shop Search》则关注到了推荐系统中的长尾现象,我们知道在用户搜索的过程中,绝大多数被曝光的都是高频的查询词,而用户实际需要的低频查询词则鲜有机会,这就会导致所谓的长尾现象。在在本论文当中则提出了通过迁移商品搜索中的数据与知识,弥补用户搜索行为的稀疏性,消除用户查询词与目标间的文本语义鸿沟;另一方面通过用户查询历史,抽取构建大规模的异构图,提出对偶异构图层次注意力网络框架,同时利用同构与异构邻居去增强查询词和店铺的向量表示,最后融合多种用户特征以实现个性化的搜索结果。

当然KDD的论文水平之高有目共睹,不过以上论文也的确令人耳目一新,推荐大家可以到KDD的官网去阅读一下原文。

后记

从实现快速计算、记忆与存储的“计算智能”,到识别处理语音、图像、视频的“感知智能”,再到实现思考、理解、推理和解释的“认知智能”,人工智能发展的终极目标是赋予机器人类的智慧。

近年来,语音识别、人脸识别等“感知智能”技术已相对成熟,甚至在许多领域已经达到或超出了人类的水平。但这些技术仅在工具、模型层面实现了突破,对诸如需要专家知识、逻辑推理或者领域迁移等需要去思考、规划、联想、创作的复杂任务时,表现不佳。不过随着大数据、云计算、深度学习等技术的蓬勃发展,探索在如何保持大数据智能优势的同时,赋予机器常识和因果逻辑推理能力,实现“认知智能”,成为当下人工智能研究的核心,新一代人工智能技术也正在从“感知智能”向“认知智能”迈进。而如何迎得从感知到认知的AI技术,将成为未来IT巨头之间的主要战场之一。

近期阿里在IT基础设施领域,突破级成果不断, AI芯片-含光910、新一代对话模型ESIM,OceanBase也再次以提升了11倍的成绩登顶TPC-C排行榜。期待阿里未来开源更多的IT基础设施,为整个行业的发展做出更大的贡献!

推荐阅读
  • 实操来了!一文告诉你如何用 Streamlit 和 Heroku 开发 Web

  • 避坑!使用 Kubernetes 最易犯的 10 个错误

  • 雷军:4G 手机已清仓,全力转 5G;QQ音乐播放中途插语音广告引热议;Wine 5.9 发布 | 极客头条

  • 15 岁黑进系统,发挑衅邮件意外获 Offer,不惑之年捐出全部财产,Twitter CEO 太牛了!

  • 必读!53个Python经典面试题详解

  • 赠书 | 1月以来 Tether 增发47亿 USDT,美元都去哪儿了?

  • 你点的每个“在看”,我都认真当成了AI

相关文章:

python采集cpu信息

旧博文,搬到 csdn 原文:http://rebootcat.com/2018/05/20/analyze_cpu/ python脚本采集cpu 经常要做一些 linux 系统上的性能分析或者采集 cpu/mem/bandwidth 上报到监控系统。 分享一个我平常常用到的 cpu 采集脚本,原理是分析 /proc/stat…

Pretty Login便携版:Windows 7登录界面修改器

Pretty Login是由chnable开发的一个美化小工具,用来辅助修改Widnows 7登陆界面的背景图片,除此之外,它也能定制欢迎界面上的文本、按钮样式,如设置阴影、半透明效果。 由于Windows 7限制登录背景图片的大小不超过255KB&#xff0c…

来了来了!趋势预测算法大PK!

作者 | 王哲责编 | Carol头图 | CSDN 付费下载自视觉中国趋势预测在很多应用场景中都会起到至关重要的作用,比如淘宝商家会考虑库存量应该保持在多少才能够满足客户需求,商场希望得知假期会迎来多大的客流量以安排系列活动,机场想要预测五一黄…

hdu 5713(状态压缩DP)

要进行两次dp&#xff0c; 第一个&#xff0c;dp[i],1<i<(1<<n) 其中用i的二进制形式表示已选择的点。 dp[i] 用来保存i中的点构成一个连通块&#xff0c;边集多少种可能。 转移方程&#xff1a; save[0] 1;//这里用save[i]表示dp[i]for(int i1;i<(1<<n)…

nginx特定的 404页面利于seo

要求&#xff1a;访问http://www.qq.com/123 url保持不变 显示的结果为指定的404页面curl -I http://www.qq.com/123 返回的状态码为404 准备一 404.php页面在最底部加上&#xff1a;<?phpheader(HTTP/1.1 404 Not Found);header(Status: 404 Not Found);?>然后ngin…

python采集bandwidth信息

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2018/05/21/analyze_bandwidth/ python脚本采集bandwidth 经常要做一些 linux 系统上的性能分析或者采集 cpu/mem/bandwidth 上报到监控系统。 分享一个我平常常用到的 bandwidth 采集脚本&#xff0c;原理…

零基础搭建个性化精准营销 AI 应用,这次手把手教你!

百万学AI系列AI 应用开发大师课已经直播两期了&#xff0c;在前两期的内容中&#xff0c;大家在入门级任务《猫狗分类器》中上手 TensorFlow 开发&#xff0c;通过离线 SDK 在 Android 手机中完成人脸识别应用的部署。在这两个任务中&#xff0c;能成功安装开发环境&#xff0c…

C++数据类型简析

C语言的基本数据类型有如下四种&#xff1a; 整型&#xff0c;说明符为int&#xff1b;字符型&#xff0c;说明符为char&#xff1b;浮点型&#xff08;又称实型&#xff09;&#xff0c;说明符为float&#xff08;单精度&#xff09;&#xff0c;double&#xff08;双精度&…

浅谈几种区块链网络攻击以及防御方案之51#37攻击

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2020/04/11/network_attack_of_blockchain_51_attack/ 写在前面的话 自比特币诞生到现在&#xff0c;比特币&#xff08;网络&#xff09;经历过大大小小非常多次的攻击&#xff0c;尤其在比特币诞生之初的…

全球Python调查报告:Python 2正在消亡,PyCharm比VS Code更受欢迎

作者 | 唐小引题图 | 自东方 IC出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;一年一度的 Python 开发者调查报告终于发布了。该报告由 Python 软件基金会和 JetBrains 联合发起&#xff0c;已经持续三年&#xff0c;并且参与调查的开发者人数正在逐年上…

中兴V880使用手记之五——刷入recovery

Recovery是安卓系统的一个特殊工作模式&#xff0c;也就是一个刷机的工程界面&#xff0c;给安卓手机刷入Recovery相当于给系统安装了一个dos界面&#xff0c;可以在未开机的状态下&#xff0c;实现系统更新、还原出厂设置、清除手机缓存等。通过一些第三方工具&#xff0c;可以…

windows 系统常用操作

1、所有端口使用情况 netstat -ano 2、查询xxxx端口pid netstat -aon|findstr "xxxx" 3、根据端口Pid查详情 tasklist|findstr "pkd" 4、根据进程pid kill 进程 taskkill /pid pid -f 转载于:https://www.cnblogs.com/vitre/p/5549344.html

浅谈几种区块链网络攻击以及防御方案之日蚀攻击

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2020/04/12/network_attack_of_blockchain_eclipse_attack/ 写在前面的话 自比特币诞生到现在&#xff0c;比特币&#xff08;网络&#xff09;经历过大大小小非常多次的攻击&#xff0c;尤其在比特币诞生之…

微服务的理想与现实

来源 | 京东智联云开发者随着云原生微服务的日益火热&#xff0c;很多人都开始对微服务的相关知识内容感兴趣。本篇内容&#xff0c;旨在扫盲&#xff08;意思是小白可入&#xff09;&#xff0c;希望能对大家有帮助。如有问题&#xff0c;欢迎大家一起讨论&#xff0c;共同学习…

感恩心成就了车建新和红星美凯龙

前几天参加了红星美凯龙成立25周年庆典活动&#xff0c;庆典活动非常的隆重&#xff0c;庆典之前红地毯上星光熠熠&#xff0c;红星美凯龙掌舵人车建新等多位高管、品牌代言人大小S、刘谦、古巨基、萧亚轩、胡一虎等演艺群星、马未都、马艳丽、包小柏、王潮歌、殷智贤等不同领域…

第二阶段团队项目冲刺站立会议(九)

昨天做了什么&#xff1a; 已经简单实现我的后续显示问题。 今天准备做什么&#xff1a; 美观上的东西来不及做了估计&#xff0c;我要整合到项目的实现上去。 遇到的问题&#xff1a; 项目问题大体上和竞赛一致&#xff0c;但也有不一样的地方。转载于:https://www.cnblogs.co…

浅谈几种区块链网络攻击以及防御方案之女巫攻击

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2020/04/13/network_attack_of_blockchain_sybil_attack/ 写在前面的话 自比特币诞生到现在&#xff0c;比特币&#xff08;网络&#xff09;经历过大大小小非常多次的攻击&#xff0c;尤其在比特币诞生之初…

INODE上网IP地址刷新超时处理

IP地址刷新超时2011-06-07 09:19:08 连接网络...2011-06-07 09:19:08 开始进行身份验证... [wangliyafaguibu]2011-06-07 09:19:09 正在上传用户密码...2011-06-07 09:19:10 您的身份验证成功2011-06-07 09:19:10 自动获取IP地址...2011-06-07 09:19:11 IP地址刷新超时2011-06-…

让大规模深度学习训练线性加速、性能无损,基于BMUF的Adam优化器并行化实践...

导语&#xff1a;深度学习领域经典的 Adam 算法在大规模并行训练的情况下会导致模型性能损失。为了解决这一问题&#xff0c;微软亚洲研究院采用 BMUF 框架对 Adam 算法进行了并行化&#xff0c;并在微软大规模 OCR 和语音产品数据集上进行了测试&#xff0c;使其在并行训练中几…

Spring AOP AspectJ Pointcut Expressions With Examples--转

原文地址&#xff1a;http://howtodoinjava.com/spring/spring-aop/writing-spring-aop-aspectj-pointcut-expressions-with-examples/ 1) Matching Method Signature Patterns The most typical pointcut expressions are used to match a number of methods by their signatu…

限免!百名AI大咖,20大技术和行业论坛,不可错过的开发者嘉年华

根据《2020科技趋势报告》的预测&#xff0c;AI将引发第三次计算浪潮&#xff0c;也是重塑世界最大的动因之一。而在全球人工智能技术的赛道上&#xff0c;中国无疑是领先者&#xff0c;到2030中国将成为全球主要的人工智能创新中心。在这样的大环境下&#xff0c;如何抓住机遇…

浅谈几种区块链网络攻击以及防御方案之拒绝服务攻击

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2020/04/14/network_attack_of_blockchain_ddos_attack/ 写在前面的话 自比特币诞生到现在&#xff0c;比特币&#xff08;网络&#xff09;经历过大大小小非常多次的攻击&#xff0c;尤其在比特币诞生之初…

C++中#include的工作原理

大多数人可能对“#include”比较熟悉&#xff0c;因为我们写C/C程序的时候都会写的字符串之一&#xff0c;但是它是具体怎么工作的&#xff1f;或者它的原理是什么呢&#xff1f; 可能不太熟悉&#xff0c;也有可能没有去关心过。我们只关心程序能否正确运行&#xff0c;或者程…

浅谈几种区块链网络攻击以及防御方案之其它网络攻击

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2020/04/16/network_attack_of_blockchain_other_attack/ 写在前面的话 自比特币诞生到现在&#xff0c;比特币&#xff08;网络&#xff09;经历过大大小小非常多次的攻击&#xff0c;尤其在比特币诞生之初…

基于深度学习和传统算法的人体姿态估计,技术细节都讲清楚了

作者 | 站长 pursueYfuture来源 | AI专栏&#xff08;ID: pursue-Y-future&#xff09;计算机视觉的一大研究热点是人体姿态估计&#xff0c;还有很多问题急需解决&#xff0c;比如遮挡&#xff0c;交互等等。在最近的CVPR2020里边也有很多这方面的工作。本文站长主要是想谈谈基…

怎么让百度快速重新收录

每天更新网站和做外链让百度重新收录的快速方法很多人都比较头疼让百度如何重新来收录你站点&#xff0c;这里为大家介绍一下我的经验;大家都知道做网络推广&#xff0c;特别是企业站推广&#xff0c;如果能在相关的关键字在搜索引擎里有个好的名次&#xff0c;肯定能给企业增长…

HQL语句大全

Hibernate配备了一种非常强大的查询语言&#xff0c;这种语言看上去很像SQL。但是不要被语法结构 上的相似所迷惑&#xff0c;HQL是非常有意识的被设计为完全面向对象的查询&#xff0c;它可以理解如继承、多态 和关联之类的概念。Hibernate配备了一种非常强大的查询语言&#…

自动创建阿里云抢占式实例

旧博文&#xff0c;搬到 csdn 原文&#xff1a;http://rebootcat.com/2020/08/24/auto_run_aliyun_spot/ aliyun_spot 自动创建阿里云抢占式实例。 支持一下作者&#xff0c;购买阿里云 背景 阿里云抢占式实例应该属于阿里云的一种闲置资源利用&#xff0c;性价比非常高&am…

What?! Python一行代码,能玩这么多童年的游戏?

来源 | 早起 Python责编 | Carol封图 | CSDN 下载自视觉中国儿童节就要来了&#xff0c;虽然秃头程序员没有头发&#xff0c;但是童心还是一直都在的&#xff0c;今天就分享一个私藏的GitHub项目——free-python-games&#xff0c;一行代码就能进入使用Python开发的小游戏快乐…

McAfee可能要收购NitroSecurity?

近日&#xff0c;根据国外媒体报道和业界人士的坊间传闻&#xff0c;有传闻指McAfee可能将在近期收购SIEM厂商NitroSecurity。最近&#xff0c;NitroSecurity正在准备IPO&#xff0c;去年年收入约4000万美元&#xff0c;在Gartner的MQ中位于Leader阵营。 NitroSecurity的SIEM技…