当深度学习遇上图: 图神经网络的兴起 | 赠书
什么是图
也许我们从来没有意识到,我们正生活在一个充满图的世界。例如,我们最熟悉的社交网络(如下图所示),就是一个最典型的图。
在计算机领域,我们通常用图指代一种广义的抽象结构,用来表示一堆实体和它们之间的关系。实体被叫作图的节点,而实体和实体之间的关系构成了图的边。严格来说,一个图 G = {V, E} 包含一个节点集合V 和一个边的集合E。
以社交网络为例,用户可以作为节点,而用户和用户之间的朋友关系可以作为边。事实上,作为表示实体关系和结构化数据的一种方式,图几乎无处不在。
当我们在网上购物时,用户和产品之间的购买关系可以形成用户-产品图。
当我们在公司工作时,有公司的组织结构图。
当我们与同事或朋友发邮件、发微博交流时,则会产生交流图。
除此之外,在人工智能的研究和应用产品中,图结构的数据也占据了非常重要的地位。
在自然语言处理中常用的知识图谱,是用来表示领域知识、促进知识推理不可或缺的载体。
用于生物研究的蛋白质网络,能够表示蛋白质之间的相互作用。
在化学中,如果我们把原子看成节点,将原子间的化学键看成边,那么所有分子都是天然的图结构。
物联网传感器之间需要连接成图,共同获取监测状态。
互联网中的链接关系让所有网页形成链接图。
论文中的引用关系让所有论文形成引文图。
金融交易让交易双方形成交易图。
此类例子不胜枚举。
甚至在很多原本没有明显图的数据上,人们也发现可以利用图结构获得新的突破。
一个典型的例子是文本摘要中利用句子之间的相似性构建的图,对早期文档摘要领域做出了巨大的贡献。
在定理证明中,逻辑表达式可以表示成由变量和操作构成的图。
同样地,程序也可以表示成由变量构成的图,用来判断正确性;在多智能体(Multi-agent)系统中,agent 之间的隐性交互也被当作图来处理。
深度学习与图
毫无疑问,深度学习正在成为人类实现人工智能最重要的工具。
在当前时代,在大量数据和超强计算资源的推动下,深度学习强大的表征能力使其在各个应用领域(自然语言处理、计算机视觉、计算机语音等)有了突破性的进展。
时至今日,在人工智能各种任务的排行榜上,我们已经很难找到非深度学习的最优模型了。
然而,大部分传统深度学习模型,如卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Networks,RNN)等, 处理的数据都限定在欧几里得空间,如二维的网格数据—图像和一维的序列数据—文本,因为它们的模型设计正得益于欧几里得空间中这些数据的一些性质:例如,平移不变性和局部可联通性。图数据不像图像和文本一样具有规则的欧几里得空间结构,因此这些模型无法直接应用到图数据上。
图数据的特殊性质
以卷积神经网络为例,我们通过对比网格数据和图数据(如下图所示)来说明为什么它不能直接用在图上。
1. 节点的不均匀分布
在网格数据中,每个节点(不包含边缘节点)只有 4 个邻接点,因此我们可以很方便地在一个网格数据的每个小区域中定义均匀的卷积操作。而在图结构中,节点的度数可以任意变化,每个邻域中的节点数都可能不一样,我们没有办法直接把卷积操作复制到图上。
2. 排列不变性
当我们任意变换两个节点在图结构中的空间位置时,整个图的结构是不变的。如果用邻接矩阵表示图,调换邻接矩阵的两行,则图的最终表示应该是不变的。在网格中,例如在图像上,如果我们变换两行像素,则图像的结构会明显变化。因此,我们没有办法像处理图像一样直接用卷积神经网络处理图的邻接矩阵,因为这样得到的表示不具有排列不变性。
3. 边的额外属性
大部分图结构上的边并非只能取值二元的 {0,1},因为实体和实体的关系不仅仅是有和没有,在很多情况下,我们希望了解这些实体关系连接的强度或者类型。强度对应到边的权重,而类型则对应到边的属性。显然,在网格中,边是没有任何属性和权重的,而卷积神经网络也没有可以处理边的属性的机制。
将深度学习扩展到图上的挑战
由于图结构的普遍性,将深度学习扩展到图结构上的研究得到了越来越多的关注,图神经网络(Graph Neural Networks,GNN)的模型应运而生。总体来说,深度学习在图上的应用有以下几个难点。
1. 图数据的不规则性
正如前面所讲,相对于网格数据,图结构数据的不规则性使得传统的卷积神经网络不能直接应用在图上,因此,在图上,我们必须发展新的深度学习模型。
2. 图结构的多样性
作为表示实体关系的数据类型,图结构具有丰富的变体。图可以是无向的,也可以是有向的;可以是无权重的,也可以是有权重的;除了同质图,还有异构图;等等。
3. 图数据的大规模性
大数据作为深度学习的“燃料”,在各个应用领域发挥了重要的作用。在大数据时代,我们同样面临大规模的图的处理难题。我们常用的图结构数据,如互联网、社交网络、金融交易网络,动辄有数以亿计的节点和边,这对深度学习模型的效率提出了很高的要求。
4. 图研究的跨领域性
我们介绍了各种各样的图,很容易发现图的研究是横跨很多不同的领域的,而在很多任务上,研究图的性质都需要具有领域知识。例如,对分子图的性质进行预测,我们需要具有一些化学知识;对逻辑表达式的图进行处理,我们需要具有一些逻辑学知识。在《图神经网络:基础与前沿》这本书中,我们将继续探讨图神经网络如何解决这些问题。
▊《图神经网络:基础与前沿》,马腾飞 编著
梳理图神经网络(GNN)领域的经典模型
帮助读者构建图神经网络知识体系
厘清重要模型的设计思路和技术细节
展现图神经网络的研究进展
图神经网络在推荐系统、生物医疗、自然语言处理等不同场景的实践
图神经网络是人工智能领域的一个新兴方向,它不仅迅速得到了学术界的广泛关注,而且被成功地应用在工业界的多个领域。
本书介绍了图神经网络和图深度学习的基础知识和前沿研究,不仅包括它们的发展历史和经典模型,还包括图神经网络在深层网络、无监督学习、大规模训练、知识图谱推理等方面的前沿研究,以及它们在不同领域(如推荐系统、生化医疗、自然语言处理等)的实际应用。
本书既可作为人工智能领域研究和开发人员的技术参考书,也可作为对图上的深度学习感兴趣的高年级本科生和研究生的入门书。
(扫码了解本书详情)
#欢迎来留言#
留言点赞数量最多的前两名
AI科技大本营携手【电子工业出版社-博文视点】送出
《图神经网络:基础与前沿》一本
截至3月19日14:00点
直播间地址:https://live.csdn.net/room/csdnnews/B3423dYF
更多精彩推荐
☞玩转3D全息图像!AI即刻生成☞用 Python 动态可视化,看看比特币这几年☞Python 搭建车道智能检测系统点分享点收藏点点赞点在看
相关文章:

Asp.net 2.0 中将网站首页生成静态页的一个比较好的方法
做网站时,有时为了提高性能会将网站首页生成静态页(当然, Asp.net中页面缓存也是一个不错的选择了 将页面生成静态的方法有多中,据不完全统计有N种(N>1) 呵呵 以下的方法来自 "孟子E " 解释的方法 代码如下 protected override void Render(HtmlTextWriter wri…

[转]解决Eclipse中编辑xml文件的智能提示问题
转自:http://hi.baidu.com/cghroom/item/48fd2d0dc1fc23c675cd3c3e 摘要: Eclipse for Android xml 文件代码自动提示功能,介绍Eclipse 编辑器中实现xml 文件代码自动智能提示功能,解决eclipse 代码提示失效、eclipse 不能自动提…

温水里的程序员,技术将淘汰一切。
七月,炎炎的夏日,疯狂的暴雨不分昼夜,侵袭着这座城。早上七点,我骑着摩拜单车出发去往地铁站,誓死如归一般的,挤进地铁。像往常一样,骑车、挤地铁、打卡上班。相 信大家都跟我一样,未…

ASP.net 2.0下应用程序离线信息
ASP.net 2.0 有一个新特性,就是支持应用程序离线信息。 什么是离线信息呢?以前我们在更新应用程序,导至asp.net应用程序重启,应用程序的用户通常会显示不友好的错误信息,或者IE一直显示加载状态。 ASP.net 2.0支持您…

Lync server 2013 之office web apps server 搭建步骤
office web apps server 搭建步骤:一、.NET Framework 4.5 节点下的HTTP 激活.NET Framework 3.5Windows Identity Foundation 3.5Add-WindowsFeature Web-Server,Web-Mgmt-Tools,Web-Mgmt-Console,Web-WebServer,Web-Common-Http,Web-Default-Doc,Web-Static-Conte…

360数科发布2020全年财报:全年收入上涨47.1%,科技为运营效率提供第一动力
3月16日,360数科发布2020年第4季度及全年未经审计的财务报告。2020财年,360数科实现收入135.64亿元,较2019年92.2亿元增长47.1%;非美国会计准则(Non-GAAP)下净利润为37.97亿元,较2019年27.52亿元…

内存分配器memblock【转】
转自:http://blog.csdn.net/kickxxx/article/details/54710243 版权声明:本文为博主原创文章,未经博主允许不得转载。 目录(?)[-] 背景 Data structurememblock initializationmemblock API memory和reserved regionmemblock_reservedmemblo…

with admin option /with grant option
1. with admin option是用在系统权限上的,with grant option是用在对象权限上的。 SQL> grant create synonym to scott with grant option;grant create synonym to scott with grant option *第 1 行出现错误:ORA-01939: 只…

第四层到第七层的高层交换技术及其应用
1 前言Internet的特点就是不断变化发展,目前网络上的信息量和业务量都呈现爆炸性的增长趋势。不断增长的负荷和新需求的出现,使得用单台服务器处理应用服务的结构已成为过去,取而代之的是以单一虚拟IP地址(VIP)来代表整个服务器集群&#x…

赠书 | 315之后,无人旁观时我们是谁
315的曝光,让人脸信息被随意采集、简历被低价出卖等话题受到公众热议。然而,不知道有多少人,直到这一场晚会才知道,原来自己始终是被悄悄“出卖”的人。智联招聘声称拥有1.8亿用户,视用户信息安全与隐私保护为自己“生…

bugzilla部署
Centos6.8部署bugzilla apache mysql1.apache可以使用系统自带的apache服务2.安装mysql:yum –y installmysql mysql-server //使用yum安装vi /etc/my.cnf //编辑mysql配置文件default-character-set utf8 //在mysql_safe段添加字符集支持service mysq…

ASP.NET 2.0 AJAX中Webservice调用方法示例
ASP.NET 2.0 AJAX中能够在客户端js中很方便地调用服务器Webservice,以下为一些调用的示例。笔者安装的ASP.NET 2.0 AJAX 版本为AJAX November CTP。 三个示例分别为:1 带参数的WS方法2 不带参数的WS方法3 参数类型为DataTable的WS方法一、WebMethod注意…

Python 玩出花儿,把罗小黑养在自己桌面
作者 | 李秋键责编 | 寇雪芹出品 | AI科技大本营(ID:rgznai100)引言:了解过我们之前文章的都知道我们曾经做过一个智能桌宠项目。但是很显然那个程序过于卡段。故这一次我们将重新制作个智能桌宠项目,不同于之前的项目在于&#x…

Google推荐的15条HTML 5代码军规----来看看你知道几个,我一个都不知道。。。
Google规范的原文链接大家可以访问:http://google-styleguide.googlecode.com/svn/trunk/htmlcssguide.xml 1.协议头: 建议在指向图片或其他媒体文件、样式表和脚本的URL地址中省略http:https:协议部分,除非已知相应文件不能…

OTS parsing error: invalid version tag woff和ttf文件被Filter拦截
从服务器下载的字体文件放在本地,执行无法展示iconfont,浏览器控制台报出 Failed to decode downloaded font: http://127.0.0.1:8080/mhr/group-assets/iconfont/iconfont.ttf?t1500884389272login_group.html:1 OTS parsing error: invalid version t…

asp.net 的性能计数器
ASP.NET 支持两组性能计数器:系统和应用程序。前者在 ASP.NET 性能计数器对象中的 PerfMon 中公开;后者在 ASP.NET Applications 性能对象中公开。ASP.NET 性能对象中的 State Server Sessions 计数器(仅适用于在其中运行状态服务器的服务器计…

为什么那么多程序员不敢学Python?
Python入门从哪开始?90%以上的书上都是这样讲的:先介绍 Python 的基本语法规则、list、dict、tuple 等数据结构,然后再介绍字符串处理和正则表达式,介绍文件等IO操作.... 就这样一点一点往下说。然而这种按部就班的学习方法&#…
5 配置邮箱服务器
配置邮箱服务器 一邮箱服务器角色 当Exchange邮件服务器使用一段时间后可能面临以下几个问题:邮箱服务器的磁盘空间出现不足、如何将数据库文件移到新的硬盘上、如何共享一些文件给指定的人;为了解决这些问题,我们就要了解邮箱服务器中的邮件…

mongodb 连接和备份
2019独角兽企业重金招聘Python工程师标准>>> 1.查询某一列的值: db.collection_name.find({},{key:1,key1:0}) 第一个 {} 放 where 条件,为空表示返回集合中所有文档 第二个 {} 指定那些列显示和不显示 (0表示不显示 1表示显示[非0都是显示])…

HTTP和SOAP完全就是两个不同的协议
HTTP只负责把数据传送过去,不会管这个数据是XML、HTML、图片、文本文件或者别的什么。而SOAP协议则定义了怎么把一个对象变成XML文本,在远程如何调用等,怎么能够混为一谈。 这样说两种协议: HTTP就是邮局的协议,他…

对网络骚扰和霸凌说不!神经网络可以做得更好
导语:无论在论坛、评论区还是游戏聊天界面,网络骚扰和网络霸凌都是一件让人烦恼的事。怎样避免这些烦人的问题?也许本文介绍的神经网络模型,可以对于使用AI技术手段解决这些问题有所启示。译者 | Rachel头图 | 下载于东方 IC出品 …

主机入侵防御系统(HIPS)分析
主机入侵防御系统(Host Intrusion Prevent System,HIPS)是近几年出现并迅速发展的新兴产物,与传统意义的防火墙和杀毒软件不同,它并不具备特征码扫描和主动杀毒等功能,所以想用它来替换传统杀毒软件然后安枕…

Centos 7 让docker飞一会儿
为什么80%的码农都做不了架构师?>>> 安装shadowsocks yum install -y epel-release python-pip pip install shadowsocks vim /etc/shadowsocks.json {"server": "your.vpn.com","server_port": 8388,"password&quo…

.net应用程序如何批上XP的外衣?
.net framework 所提供的开发控件也太少了,也太难看了,自已画又费时费力也不见得会得出个什么好的效果。如果能够上我们的程序运行在XP环境中能自动应用XP的主题样式那就省时多了,让MICROSOFT给我们去画控件!以下是我所所试验过的解决办法: …

AppCan 学习
2019独角兽企业重金招聘Python工程师标准>>> AppCan 学习 AppCan是以web前端开发方式来开发移动app的解决方案。下面是一些记录: 1.注意 uexWindow.open和uexWindow.openPopover的不同,后者是pop,pop里不能在打开window了。 2.…

在 5G 速度上,iPhone 12 只是个弟弟
作者 | 郑丽媛头图 | 下载自东方 IC出品 | CSDN(ID:CSDNnews)如果不考虑价格因素,让你选择一部手机,你是选 iPhone 还是安卓手机?目前,移动操作系统市场被 iOS 和安卓系统瓜分,体现在…

hadoop install start-dfs.sh 失败
linux:ubuntu 16.04 LTS hadoop version: 2.7.3 JDK: java-9-open-jdk issue: start-dfs.sh start-dfs.sh:command not found 在hadoop sbin目录下可以找到这个文件。但是run不起来。 解决方法: 1. 打开 $HOME/.bashrc 加入下面一行。 PATH$PATH:/usr/l…

用.net中的socket实现文件传输
socket是网络套接字,使用它我们可以很方便的实现网络的数据传输。在.net中提供了socket类来帮助开 发者调用socket的使用,从而避免了调用socket的动态库来实现socket的麻烦。下面我们就来看一个简单的例子,从这个简单的例子来看看.net中的so…

ARP协议学习
Dolphin,ChinaBJ,20131122本文档是检验自己学习TCP/IP协议卷1:协议中关于ARP协议的学习情况。本文档包含以下四部分:1、简述ARP协议;2、ARP的分组格式;3、ARP Spoofing 实验 4、应用及防御方法。1.简述ARP协…

数学,对人工智能开发者意味着什么
21世纪以来,全球化的加速和互联网的蓬勃发展,带来全球范围内电子数据的爆炸性增长,人类迈入了大数据时代。与此同时,计算机芯片的计算能力也持续高速增长。在数据和计算能力指数式增长的支持下,人工智能算法在应用中取…