性能超越图神经网络,将标签传递和简单模型结合实现SOTA
译者 | 刘畅
出品 | AI科技大本营
头图 | CSDN付费下载自视觉中国
图神经网络(GNNs)是图学习中一种主流的技术。然而,对于GNN为什么在实际使用中很成功以及它们是否是优异性能所必需的技术,了解相对较少。
本文展示了许多标准的传导节点网络的分类基准结果,作者通过将忽略图结构的浅层模型与利用标签结构中相关性的两个简单后处理步骤相结合,可以超越或匹配SOTA的GNN的性能,这里主要有两个相关性(i)将训练数据中的残余误差带到测试数据中,用于矫正错误的“误差相关性”(error correlation),以及(ii)一个“预测相关性”,它可以平滑测试数据上的预测。本文称整个过程为矫正且平滑(Correct and Smooth, C&S),后处理步骤是通过对早期基于图的半监督学习方法的标准标签传导技术的简单修改来实现的。
本文的方法在各种基准测试上超过或接近于SOTA的GNNs的性能,并且它只需要一小部分的参数,运行速度更快。例如,本文方法在OGB产品数据集中以减少137倍的参数和100倍的训练时间超过了最著名的GNN性能。本文方法的性能突出展现了如何直接将标签信息纳入学习算法(如在传统技术中所做的那样),并产生简单而实质性的性能提升,也可以将技术融入大型GNN模型中,提供适度增益。
OGB结果的代码是:
https://github.com/Chillee/correctandsooth。
引言
随着神经网络在计算机视觉和自然语言处理方面的成功,现在有许多的图神经网络(GNN)来对关系性数据进行预测。这些模型已经取得了很大的成功,并且在开放的图基准排行榜上名列前茅。通常,GNN的方法主要是围绕着创建比基本结构更具表现力的体系结构,如图卷积网络(GCN)或GraphSAGE;例子如图注意力网络,图同构网络和各种深层模型。许多新GNN架构的想法都是从语言(例如注意力)或视觉(例如深层CNN)模型中的新架构改编而来的,希望能成功转化为图形。然而,随着这些模型变得越来越复杂,理解它们的性能增益是一个主要的挑战,并且将它们扩展到大型数据集是很困难的。
在本文中,我们将展示,通过组合更简单的模型,我们可以达到多大的程度,重点是了解在图学习中,特别是转化节点分类中,哪里有容易提高性能的机会。本文提出了一个包含三个主要部分的简单管道(pipeline)(图1):(i)使用忽略图结构的节点特征进行基础预测(例如,MLP或线性模型);(ii)校正步骤,它将训练数据中的不确定性传播到图中,以校正基础预测;以及(iii)对图上的预测进行平滑处理。步骤(ii)和(iii)只是后处理,使用的是经典的基于图的半监督学习方法,即标签传播。
图1 任意GNN模型,校正和平滑过程整体概述,并附带一个示例。
假设左侧簇属于橙色类,右侧簇属于蓝色类。我们使用mlp进行基础的预测,假设在本例中,图结构对所有节点都给出了相同的预测。然后,通过传递训练数据中的误差来校正基础的预测。最后,通过标签传递对校正后的预测进行平滑处理。
本文方法性能改进的一个主要来源是直接使用标签进行预测。这种想法并不是什么新鲜事,早期的基于扩散的半监督学习算法,如光谱图传感器、高斯随机场模型和标签扩散都使用了这一思想。然而,这些方法的动机是在点云数据上进行半监督学习,因此使用特征来构造图。从那时起,这些技术被用于仅从标签(即无特征)学习关系数据,但在GNNs中基本上被忽略了。
尽管如此,本文发现即使是简单的标签传播(忽略了特征)在许多基准测试中都表现得出奇地好。这就为组合两个预测能力的正交提供了动力,一个来自节点特征(忽略图结构),另一个来自直接在预测中使用已知标签。
最近的研究将GNN与标签传播以及马尔可夫随机场联系起来,并且一些技术在特征中使用了标签信息。然而,这些方法的训练成本仍然很高,而本文是以两种可理解的低成本方式使用标签传播。本文从一个忽略了图结构的模型的“基础预测”开始。之后,使用标签传播进行误差修正,然后平滑最终预测。这些后处理步骤基于这样一个事实,即连接节点上的错误和标签是正相关的。
总的来说,本文的方法表明,结合几个简单的思想,在传导节点分类中,无论是在模型大小还是在训练时间方面,成本都只占一小部分。例如,在OGB产品基准测试中,我们用少于两个数量级的参数和训练时间,超过了目前最著名的GNN方法。
然而,本文的目标并不是说当前的图学习方法很差或不合适。相反,本文的目标是强调在图学习中提高预测性能的更简单的方法,这样可以更好地理解性能增加的缘由。本文的主要发现是在学习算法中更直接地加入标签是非常关键的。通过将我们的想法与现有的GNN相结合,我们也看到了一些提升,尽管这些提升是微不足道的。但作者希望本文的方法能为其他的图学习任务,如归纳节点分类、链接预测和图预测提供一些思路。
方法
我们的方法从一个简单的基于节点特征的基础预测器开始,这个预测器不依赖于图的任何学习。之后,我们执行两种类型的标签传播(LP):一种是通过建模相关误差来修正基础的预测,另一种是平滑最终的预测结果。我们称这两种方法的组合是校正和平滑(C&S;图1)。LP(Label Propagation, 标签传递)只是一个后处理的步骤,本文的算法pipeline不是一个端到端的训练。此外,该图仅用于这些后处理步骤和增强特征的前处理步骤。而一般的基础预测方式不是这样的。与标准GNN模型相比,这使得训练变得更快且可扩展。此外,我们利用了LP(在没有特性的情况下,它本身的性能往往相当好)和节点特征。我们将看到,将这些补充的信息结合起来会产生很好的预测。
首先,我们使用一个不依赖于图结构的简单的基础预测器。这个预测器可以是线性的模型或者一个浅的多层感知器,接下来,我们通过合并标签来关联修正错误,从而提高基础预测器的精度。为了最终的预测,出于图中的相邻节点可能具有相似标签的考虑,作者进一步平滑了修正后的预测值。回顾整个处理的流程,就是从简单的基础预测Z开始,只使用节点特征,而不是图结构。然后,通过在训练数据上传递已知误差来估计误差,得到误差修正后的预测Z(r)=Z+^E。最后,作者将这些作为未标记节点上的得分向量,通过另一个LP步骤将其与已知标签相结合,得到平滑的最终预测。这就是Correct and Smooth(C&S)方法。
实验
为了证明本文方法的有效性,我们使用了九个数据集(表1)。Arxiv和Products数据集来自开放图基准数据集;Cora、Citeseer和Pubmed是三个经典的引文网络基准数据集;wikiCS是一个网络图。在这些数据集中,类标签是论文、产品或页面的种类,而特征是从文本派生出来的。本文还使用Rice 大学的Facebook社交网络,其中类标签是宿舍,特征是性别、专业和班级年份等属性,以及美国的地理数据集,类标签是2016年选举结果,特征是人口统计。最后,我们使用了一个欧洲研究机构的电子邮件数据集,其中的类标签是部门成员,没有特征。
具体的对比方法和结果如下图所示,其他更详细的实验步骤和对比结果,可以详细阅读论文。
结论
GNN模型正变得越来越有泛化能力,参数也越来越多,训练成本相应的也变得越来越高。本文的研究结果表明,我们应该探索其他提高性能的技术,例如标签传递和特征增强。特别是,标签传递和它的变体是一种可持续发展的想法。直接地将它们结合到图学习模型中就会带来很大的好处,而且本文已经证明这些方法可以使预测结果更好,训练更快。
更多精彩推荐
隐私数据在隐私AI框架中的安全流动
比Python 3.8快20%,Pyston v2正式发布
一口气看完45个寄存器,CPU核心技术大揭秘
在吗?我要讲件大事了,你绝对不知道CSDN公众号还有这个功能!错过后悔!
离职后竟半夜偷溜回办公室写代码?一个为自由软件而战斗的程序员
相关文章:

模仿VIMD的模式的简化代码示例
按numpad0来切换模式,按t显示不同的结果; Numpad0:: tfmode:!tfmode aaa:(tfmode1?"AAAA":"BBBB") SplashImage Off SplashImage, "",X500 Y500 W200 B fs10 CT00FFFF CW000000,%aaa%, , 切换模式提示 WinSet, Tr…

DataGrid连接Access的快速分页法(1)——需求与现状
作者:黎波一、需求分析 DataGrid是一个功能强大的ASP.NET Web服务器端控件,它除了能够按各种方式格式化显示数据,还可以对数据进行动态的排序、编辑和分页。大大减轻了广大Web程序员的工作量。实现DataGrid的分页功能一直是很多入门者感到棘手…
CSDN公众号新功能上线,居然还能搜出小姐姐???
为了给各位打工人更好的搜索体验CSDN总是在学习新技能这次CSDN公众号又给大家带来了一项全新的搜索技能在CSDN旗下的公众号内回复消息就能自动回复想搜索的内容啦小编来给大家演示一下,在公众号内输入“mysql安装教程”,就能得到CSDN全站内关于mysql安装…
p2v、v2v 转换-windows篇
问题:如何把 xenserver的虚拟机转成Esxi的虚拟机 如何把物理机转成Esxi的虚拟机答案:↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓首先介绍一下实验环境。一台xenserver主机上两台虚拟机 win03和win08 转到Esxi5.0的一台主机上。Esxi5.0在某个…
WebViewJavascriptBridge原理解析
基本说明 我们的项目是一个OC与javascript重度交互的app,OC与javascript交互的那部分是在WebViewJavascriptBridge的github地址的基础上修改的,WebViewJavascriptBridge应该是当前最流行最成功的OC与Web交互实现了。最近看了一下他的实现原理,…
DataGrid连接Access的快速分页法(2)——SQL语句的选用(升序与降序)
作者:黎波 一、相关概念 在 ACCESS 数据库中,一个表的主键(PRIMARY KEY,又称主索引)上必然建立了唯一索引(UNIQUE INDEX),因此主键字段的值是不会重复的。并且索引页依据索引列的值…
从谷歌AutoML到百度EasyDL,AI大生产时代,调参师不再是刚需
出品 | AI科技大本营头图 | 付费下载于视觉中国2018 年,Google Cloud 宣布将 AutoML 作为机器学习产品的一部分。至此,AutoML 开始进入大众的视野。 实际上,2013 年AutoWEKA的发布可以算作AutoML的开端;2014 年,ICML开…

Python 语法小知识
为什么80%的码农都做不了架构师?>>> 序列解包 将含有多个值的序列解开,然后把值存放到变量中,当函数或者方法返回元组时这个特性很有用,可以把返回的序列值直接赋值给变量,在序列解包时等号两边的元素个数…

CSS布局之-水平垂直居中
对一个元素水平垂直居中,在我们的工作中是会经常遇到的,也是CSS布局中很重要的一部分,本文就来讲讲CSS水平垂直居中的一些方法。另外,文中的css都是用less书写的,如果看不懂less,可以把我给的demo链接打开&…

DataGrid连接Access的快速分页法——动态生成SQL语句
作者:黎波using System;using System.Text;namespace Paging{/// <summary>/// FastPaging 的摘要说明。/// </summary>public class FastPaging {private FastPaging() {}/// <summary>/// 获取根据指定字段排序并分页查询的 SELECT 语句。/// &…
一文读懂机器学习“数据中毒”
作者 | Ben Dickson翻译 | 火火酱~出品 | AI科技大本营头图 | 付费下载于视觉中国在人类的眼中,下面的三张图片分别展示了三样不同的东西:一只鸟、一只狗和一匹马。但对于机器学习算法来说,这三者或许表示同样的东西:一个有黑边的白色小方框。…

chartee
2019独角兽企业重金招聘Python工程师标准>>> 一个绘制图表的类库,支持绘制股票的K线图,还可以绘制曲线、柱状图等等。 Code4App编译测试,测试环境:Xcode 4.3, iOS 5.0。 转载:http://www.adobex.com/ios/source/detail…

C语言存储类关键字
1、static这个关键字有三种用法:(1)第一种是用来修饰局部变量,使之成为静态局部变量;静态局部变量存储在数据段/bss段中,作用域是代码块作用域,生命周期是程序生命周期,链接属性是无…

显示DataGrid序号的一个适用的方法
作者Blog:http://blog.csdn.net/wangj2001/如果数据量小的话没有问题,一旦数据量大,显示特别慢,还有个缺点就是拖动行高时行号不随行高的变化而变动,出现是几个序号在一个单元格中显示。我自己对他们的算法进行总结&am…

Integer的自动缓存
2019独角兽企业重金招聘Python工程师标准>>> Interger装箱有个自动缓存的概念 Integer a 100;Integer b 100;Integer c 200;Integer d 200;System.out.println(a b); //trueSystem.out.println(c d); //false Integer是对象,比较的是对象在内存中…
崩溃!双十一第 4 天,某互联网公司黄了?
01打折这么狠是不是要黄了??今年的双十一,开始地比以往早一些!不知道各位程序员小哥哥们的战绩如何,是不是已经被一轮又一轮的定金、尾款,折腾到数学细胞耗尽?付款了也不清楚自己有没有真正的「…
FreeBSD设备驱动管理介绍(BSP: Ti AM335x)
这段时间一直在忙FreeBSD驱动移植的项目,因此对FreeBSD做了一定的了解,鉴于网上对于FreeBSD的设备驱动资料较少,在这里给出本人对于FreeBSD驱动管理的理解心得(主要是USB驱动管理),希望能对开源开发者有所帮…

视障人士体验自动驾驶:携导盲犬登车,未来有望“自己开”
6月27日,滴滴出行首次面向公众开放自动驾驶服务。用户可通过滴滴APP线上报名,审核通过后,将能在上海自动驾驶测试路段,免费呼叫自动驾驶车辆进行试乘体验。现阶段,滴滴自动驾驶载人测试范围仅限于在上海开放测试道路上…

Listview获取选中行的值
一般情况请注意别先删除了选中行,又去使用。那就会导致找不到选中行。。。。。哥犯了这个错误。。。找了很长时间问题if (this.lstwlview.SelectedIndices.Count > 0) { if (MessageBox.Show("确认删除该条码?",…

asp.net中DataGrid性能测试
作者Blog:http://blog.csdn.net/yzdy/ 测试环境:数据库服务器:2.4G P4 CPU,2G 内存,Windows Advanced Server 2000,SQL Server 2000Web服务器:2.4G P4 CPU,1G 内存,Windows Advanced…

javassist学习笔记
2019独角兽企业重金招聘Python工程师标准>>> 介绍:www.javassist.org/ javassist、ASM 对比 1、javassist是基于源码级别的API比基于字节码的ASM简单。 2、基于javassist开发,不需要了解字节码的一些知识,而且其封装的一些工具类可…
金融领域首个开源中文BERT预训练模型,熵简科技推出FinBERT 1.0
出品 | AI科技大本营头图 | CSDN付费下载于东方IC为了促进自然语言处理技术在金融科技领域的应用和发展,熵简科技 AI Lab 近期开源了基于 BERT 架构的金融领域预训练语言模型 FinBERT 1.0。据悉,这是国内首个在金融领域大规模语料上训练的开源中文BERT预…

raspberry pi下使用mp3blaster播放mp3音乐
首先:sudo apt-get install mp3blaster mp3blaster wode.mp3会报错 但是加padsp mp3blaster wode.mp3 就可以正常播放了

把Excel文件中的数据读入到DataGrid中
作者Blog:http://blog.csdn.net/net_lover/使用Excel文件做为DataGrid的数据源是非常简单的,一旦数据被装载进来,就可以把数据再保存进SQL Server或XML中。我们只需要简单地使用OLE DB Provider 来访问Excel文件,然后返回DataSet即…

Vue 数组中更新属性值后,视图不更新,等待其他元素更新后会触发的解决办法...
因为 JavaScript 的限制,Vue.js 不能检测到下面数组变化: 直接用索引设置元素,如 vm.items[0] {}; 修改数据的长度,如 vm.items.length 0。 this.examineIntro.questionList[0].selList[1].url url;为了解决问题 (…
DeepMind 最新论文解读:首次提出离散概率树中的因果推理算法
翻译 | 高卫华出品 | AI科技大本营头图 | CSDN付费下载自视觉中国当前,一些前沿AI研究人员正在寻找用于表示上下文特定的因果依赖关系清晰的语义模型,这是因果归纳所必需的,在 DeepMind的算法中可看到这种概率树模型。概率树图用于表示概率空…

使用c#+(datagrid控件)编辑xml文件
作者Blog:http://blog.csdn.net/ouyang76cn/ 使用c#(datagrid控件)编辑xml文件 这个源码是我根据网上一个vb.net编辑xml文件的原理用c#重写的。除重用xml文件外.并未重用任何代码!. 这小段代码,可对xml文件的记录进行删除,修改&am…

HorizontalTable
2019独角兽企业重金招聘Python工程师标准>>> HorizontalTable 实现了可水平滚动的 TableView。 转载:http://www.adobex.com/ios/source/details/00000761.htm 转载于:https://my.oschina.net/u/868244/blog/106055

敏捷软件开发的12个原则
作为一个软件工程师,软件设计和开发是最重要的技能,但是,从整个产品的角度上讲,项目管理能力比开发能力更重要,本文摘自Robert大叔的《敏捷软件开发》,粗体是Robert大叔的话,细体是我的理解。 1…

JAVE EE 企业级开发之从零开始学JAVA【51CTO技术论坛】
http://bbs.51cto.com JAVE EE 企业级开发之从零开始学JAVA 从零开始学JAVA?YES!本刊内容全部为午饭redking整理、撰写,所涉及内容均为原创,非常适合入门级JAVA新人学习,从理论到实际,跟随redking一起学习JAVA&#x…