人工智能的浪潮中,知识图谱何去何从?
漆桂林认为,目前知识图谱整个领域最关注的问题还是如何能够高效、低成本构建知识图谱,而这个问题对于研究人员来说,仍是一个非常大的挑战,比如现在大家都在关注如何在少量甚至无标注场景下进行知识图谱构建。
记者 | Jane
责编 | 琥珀
出品 | AI科技大本营(id:rgznai100)
近年来,随着人们对 AI 认知能力的积极探索,知识图谱因其表达能力强、拓展性好,基于知识进行推理等优势得到了学界与业界的高度关注。知识图谱,旨在描述客观世界概念、实体、事件及其之间关系,具备可解释性,而且可以用于解决复杂决策问题。这也意味着通过深度学习与知识图谱的结合,模型底层特征空间与人类自然语言之间巨大的语义鸿沟问题有望得以解决。在大数据和机器学习两大引擎下,大规模知识图谱的自动化构建成为现实,这就加快了知识图谱的落地与应用。
传统意义上,知识图谱可以划分为通用知识图谱和领域知识图谱。例如,国外的谷歌搜索引擎和国内的百度搜索引擎,这类通用领域知识图谱是最先被大家熟知的应用;而场景的不断丰富、需求不断增多、用户对体验与品质的要求不断提高,各行各业都亟需构建领域知识图谱。
那么,从趋势到实际需要,知识图谱已经取得了哪些学术与技术成果,产业与应用发生了哪些变化?当下知识图谱领域最关注的问题又是什么?未来,知识图谱又有哪些发展前景?近日,AI科技大本营采访到了东南大学教授、博士生导师,东南大学认知智能研究所所长漆桂林。
漆桂林认为,目前知识图谱整个领域最关注的问题还是如何能够高效、低成本构建知识图谱,而这个问题对于研究人员来说,仍是一个非常大的挑战,比如现在大家都在关注如何在少量甚至无标注场景下进行知识图谱构建。
从知识抽取到知识推理,大家在关注什么?
漆桂林表示,近两年知识图谱研究有一些值得关注的成果,比如:
- 知识抽取,如何在少量甚至无标注场景下进行知识图谱构建是一个具有挑战性的问题。目前大家都在关注基于图神经网络、增强学习、交互式知识抽取等方法。
- 知识融合,代表性工作有交互式知识融合以及基于表示学习的知识融合的工作。
- 知识更新,针对百科类知识图谱的自动化更新技术取得了一些突破,从而可以对百科知识进行自动化更新。
- 知识推理,最近两年有不少混合式推理的方法出现,也就是混合机器学习和符号推理的方法,这些方法的提出对于解决某些机器学习技术的不可解释性,以及提升知识图谱的推理能力都有作用。
与此同时,这些关键技术的应用也有一些突破性的进展,尤其是在知识抽取和知识融合方面:一是人机交互的商业化系统的出现,二是关于人机交互的信息抽取和知识融合的学术论文也开始。
在他看来,知识图谱表示学习与推理也取得了很多进展,大家开始研究知识表示学习在多模态数据上的应用,即结合文本、知识图谱、图像或者视频的知识表示学习,以及基于知识表示学习的推理。
从通用走向领域:广泛复杂的场景
知识图谱从以前研究与产业界脱钩,到现在领域知识图谱成为研究的重点,开始面向解决实际的问题。比如最近司法知识图谱的构建出现了不少研究成果。另外,知识图谱用于解决问答、推荐系统、图像理解方面的论文也不断在增加。
同时,知识图谱在不同行业也得到了广泛应用,领域知识图谱成为企业的迫切需求。例如,金融领域中的信用评估、风险控制、反欺诈问题;医疗领域中的智能问诊问题。从通用知识图谱到领域知识图谱,知识图谱开始在越来越广泛、复杂的场景中落地并解决实际问题。
“在医疗、电商、金融、军工、电力、司法、教育、公安、石油这几个领域知识图谱已经落地并且取得了突出成果。”漆桂林谈到。知识图谱可以帮助这些领域的公司或研究机构更好地处理多源异构数据,也就是说可以提供一个统一数据模型并且可以灵活地集成和关联这些数据,对这些数据进行关联分析。
知识图谱产学研相辅相成
“知识图谱的产学研需要有一个整体规划,这也是我一直在实践的。”漆桂林表示。
在他看来,首先需要了解产业界对知识图谱的需求,知道知识图谱可以解决什么应用问题,带来什么价值。
其次,通过了解知识图谱落地的挑战,确定知识图谱的研究课题。
从短期和长期来看,短期课题是要解决产业界急迫的问题,比如少量标注情况下的信息抽取方法的研究;而长期课题是面向三年之后可能对知识图谱落地有用的技术,比如无标注场景下的信息抽取技术。
最后,让知识图谱技术可以快速普及。为了进一步贯彻知识图谱的产学研,漆桂林还联合学界、工业界的专家共同成立了 OpenKG 联盟。
漆桂林简介
漆桂林,东南大学教授,博士生导师,东南大学认知智能研究所所长。现任中国中文信息学会语言与知识计算专业委员会副主任和中国科学技术情报学会知识组织专业委员会副主任。2006年,漆教授获得英国贝尔法斯特女皇大学计算机博士学位,导师为人工智能界著名专家 Weiru Liu 教授。2006年8月至2009年8月在德国Karlsruhe大学AIFB研究所做博士后研究,导师为语义 Web 界国际知名专家Rudi Studer教授。
目前,漆桂林的研究方向为:知识图谱的表示和推理、通用知识图谱构建、情感分析、智能问答、关系抽取、多模态图像处理。在知识图谱的表示和推理,知识图谱融合和更新,通用知识图谱引擎构建,以及高效、低成本构建知识图谱方面取得了一些成果,包括:
- 一套并行本体推理引擎和一套规则引擎,可高效处理千万级别本体推理,并且支持本体和规则的混合式推理;
- 一个通用知识图谱系统,可针对百科数据进行抽取、融合、更新、推理,还可针对各种社交网站数据自动化构建知识分类体系;
- 一个针对通用知识图谱的问答引擎,可处理复杂问句的问答;
- 一套在少量标注情况下的知识抽取工具。
关于杭州 CTA 核心技术大会·知识图谱论坛的准备工作
作为本次杭州 CTA 大会知识图谱论坛的出品人,漆桂林表示:“我希望跟各位嘉宾交流他们在知识图谱产业化落地过程中遇到的主要技术挑战有哪些,这些技术挑战可以为高校的研究带来什么好的课题。”
他还表示,无论是对知识图谱前沿技术研究还是对知识图谱产业化落地感兴趣的人,都值得来参加。与会者在本次论文将了解知识图谱最新技术进展与知识图谱应用价值,知识图谱落地的技术挑战,如何解决这些挑战,本次论坛的一个目的就是探讨知识图谱下一步发展的道路。
扫码购票立享8折预售优惠,添加小助手微信:15101014297,备注「CTA」,了解大会详情。
相关文章:

布Sendmail之网,安全则不漏(上)
Sendmail是一种古老的邮件服务器,但是它仍然存在着种种问题,最大的问题就是安全问题。由于Sendmail邮件服务器占据了很大的市场份额,因此,提高Sendmail的安全性就显得格外重要了。本篇拟从证书、Starttls、Sasl技术来探讨Sendmail…

英伟达发布新型GAN,豹子秒变沙皮狗!| 技术头条
作者 | 刘静编译 | 李尔客转自自图灵TOPIA(ID:turingtopia)5月9日,英伟达首席研究科学家刘明宇在社交网站公布了其最新研究成果:一种新型的GAN,在测试期间只需几张示例图像,就可以将图像转换为以前从未见过…

【Live555】live555源码详解(九):ServerMediaSession、ServerMediaSubsession、live555MediaServer
【Live555】live555源码详解系列笔记 继承协作关系图 下面红色表示本博客将要介绍的三个类所在的位置: ServerMediaSession、ServerMediaSubsession、DynamicRTSPServer DynamicRTSPServer是live555MediaServer中实现的类,用来创建RTSP服务器 17、ServerMediaSession Se…

windows下mysql和linux下mysql主从配置
1. linux下mysql安装版本5.6 windows下mysql版本5.7 不要问我为什么版本不一致 就是想这么搞 2. linux为主服务器 windows为从服务器 3.找到liunx下mysql配置文件 添加如下 然后重新启动 4.添加复制用户 5.查看master状态,记录下两个参数 mysql> show mas…

myeclipse快捷键大全
1.转变大写:ctrlshiftx; 2.转变小写:ctrlshifty; 3.关闭当前窗口:ctrlw; 4.关闭所有的窗口:ctrlshiftw; 5.帮助提示:这个可以选择自己喜欢的键位组合:我比较喜欢ctrlenter; 6.复制当前行:ctrlal…

算力觉醒后,智慧距离勃发就只差一个想法
“太阳把自己的能量以光的形式洒向地面,让植物得以利用光合作用生长成熟;繁茂的草木不仅为动物们提供了栖息的家园,更将太阳的馈赠化为甜蜜的果实,在滋养万灵的同时把自己对未来的希望变成种子,播撒到远方……形成下一…

【Ubuntu】将Ubuntu的源改为国内源
1、备份源 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak2、查询系统代号 $ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 20.04.1 LTS Release: 20.04 Codename: focal我在Ubuntu20.4上做的测试,Ubun…
浏览器缓存和webpack缓存配置
网络请求会耗费大量时间和请求,如果可以重用为改变的网络资源,对于用户来说可以更快更流畅的查看网页,对于服务器来说减少了很多负荷,所以浏览器缓存是前端优化的重要内容。本文介绍了浏览器缓存的机制和缓存在webpack中的应用。 …

ipsec ***野蛮模式应用
IPSEC野蛮模式:简介:IKE 的协商模式 在RFC2409(The Internet Key Exchange )中规定,IKE 第一阶段的协商可以采用两种模式:主模式(Main Mode )和野蛮模式(Aggressive Mode…

漫画:什么是LRU算法?
本期封面作者:A17————— 两个月前 —————用户信息当然是存在数据库里。但是由于我们对用户系统的性能要求比较高,显然不能每一次请求都去查询数据库。所以,小灰在内存中创建了一个哈希表作为缓存,每次查找一个用户的时候…

第15章节-Python3.5-Django实现用户登录与前端交互2 14
目的我想登陆成功后显示我的后台管理(实现过程): 新建home.html 在templates目录下代码如下: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title> </head> <body style"…

【GLib】GLib学习笔记(一):GLib、GObject、GType
1、GLib GLib是 Gtk 库和 Gnome 的基础。glib 可以在多个平台下使用,比如 Linux、Unix、Windows 等。GLib为许多标准的、常用的 C 语言结构提供了相应的替代物。 GLib是GTK的基础库,它由基础类型、对核心应用的支持、实用功能、数据类型和对象系统五个…

tomcat配置tomcat-redis-session-manager
为什么80%的码农都做不了架构师?>>> 今天写了半天程序,有点乏了。想想来配置一下tomcat-redis-session-manager吧,但是按照 官方文档配了总是tomcat启动错误。 java.lang.NoClassDefFoundError: org/apache/commons/pool/impl/Ge…

链式比较、奇怪的字母、有趣的import...Python冷知识(六)
本文转载自Python编程时光(ID:Python-Time)冷知识系列,已经更新至第六篇。谈谈 Python 那些不为人知的冷知识(一)谈谈 Python 那些不为人知的冷知识(二)谈谈 Python 那些不为人知的冷知识&#…

【GLib】GLib学习笔记(二):源码编译
一、源码下载 http://ftp.acc.umu.se/pub/GNOME/sources/glib/本人下载是最新版本(截至2020-08-26):glib-2.65.2.tar.xz 二、安装依赖 1、安装依赖库 sudo apt install cmake sudo apt install zlib1g-dev sudo apt install meson sudo apt install ninja sudo …

java之类和对象
概述 面向过程:面向过程主要是把问题分解成多个不同的步骤,然后把各个步骤变成方法,它更强调过程。代表语言:c 面向对象:面向对象会把问题分解成各个对象,然后各个对象之间进行交互,每个对象内部…

【GLib】GLib学习笔记(三):gtypes、garray、gerror、goption
1、类型:glib/gtypes.h 1.1 基本类型; typedef char gchar; typedef short gshort; typedef long glong; typedef int gint; typedef gint gboolean;typedef unsigned char guchar; typedef unsigned short gushort; typedef unsigned lo…

Bert时代的创新:Bert应用模式比较及其它 | 技术头条
作者:张俊林,中国中文信息学会理事,中科院软件所博士。目前在新浪微博 AI Lab 担任资深算法专家。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是…

HashSet 详解
为什么80%的码农都做不了架构师?>>> package com.sun;/* |——SortedSet接口——TreeSet实现类 Set接口——|——HashSet实现类|——LinkedHashSet实现类 HashSet 此类实现 Set 接口,由哈希表(实际上是一个 HashMap 实例&#…

肖仰华:知识图谱落地,不止于“实现”
作者 | Just出品 | AI科技大本营(ID:rgznai100)“知识将比数据更重要,得知识者得天下”,去年十月,在 CSDN 对肖仰华教授的一篇约稿里,他指出数据的真正价值蕴含于其深加工的知识中。从 Google 于 2012 年提…

【摄像头】摄像头相关名词解释
1、白平衡 白平衡,字面上的理解是白色的平衡。白平衡是描述显示器中红、绿、蓝三基色混合生成后白色精确度的一项指标。 那什么是白色?这就涉及到一些色彩学的知识,白色是指反射到人眼中的光线由于蓝、绿、红三种色光比例相同且具有一定的亮度所形成的视觉反应。我们都知道…

金额跳动动画效果
前言 金额效果,因为觉得公司目前的金额太乏味,决定加点效果,也特此写了个小demo,代码非常简单,贴代码方便大家看看 通过 runtime 建立属性(setter/getter方法) /** 由于分类中要添加属性,所以通过runtime方…

POJ 3070 Fibonacci
裸奔的矩阵乘法,当模板了。 #include <iostream>#include <cstring>#include <cstdio>using namespace std;const int N 2;const int MOD 10000;struct Mat {long long mat[N][N];void init() {for(int i 0; i < N; i) {for(int j 0; j &l…

推荐一个小而美的Python代码格式化工具
代码可读性是评判代码质量的标准之一,有一个衡量代码质量的标准是 Martin 提出的 “WFT” 定律,即每分钟爆出 “WTF” 的次数。你在读别人代码或者做 Code Review 的时候有没有 “WTF” 冲动呢? 为了帮助开发者统一代码风格,Pytho…

【摄像头】摄像机工作原理
1、摄像机工作原理 外部光线穿过镜头(lens)后, 经过滤光片(color filter)滤波后照射到光学传感器(Sensor)上面, Sensor 将从 lens 上传导过来的光线转换为电信号,再通过内部的 AD 转换为数字信号。 如果 Sensor 没有集成 DSP,则通…

@程序员,别再自己闷头学了
60 年冬去春来,人工智能技术发展起起落落。现在是 2019 年,属于 AI 不可阻挡的新转机正强势袭来。 科技巨头一向是未来技术发展最重要的风向标。2011 年,随着 Google 将一线业务引入深度学习技术,落伍移动时代的微软也拉起了一支…

linux下的oracle10g rman备份
RMAN是Oracle提供的一个数据库备份和恢复工具,利用rman可以比较方便的对数据库进行备份。Oracle 数据库可运行在归档和非归档模式下,这两者的区别就在于对redo log的处理。归档模式下,当一个redo log 写满之后,就会把这个redo lo…

最全Python算法实现资源汇总!
整理 | Rachel责编 | Jane出品 | Python大本营(ID:pythonnews)【导语】数据结构与算法是所有人都要学习的基础课程,自己写算法的过程可以帮助我们更好地理解算法思路,不要轻视每一个算法,一些虽然看似容易&…

【摄像头】低照度和光圈
1、低照度 低照度摄像机是指在较低光照度的条件下仍然可以摄取清晰图像的摄像头。 照度,即光照强度,是一种物理术语,指单位面积上所接受可见光的能量。单位:勒克斯Lux,简作Lx。 照度和光圈大小的关系:镜头的光圈越大(F值越小),所需的照度越低。这个好理解,光圈大了进…

CART树 python小样例
决策树不断将数据切分成小数据集,直到所有目标变量完全相同,或者数据不能再切分为止,决策时是一种贪心算法,它要在给定的时间内做出最佳选择,但并不关心能否达到最优 树回归 优点:可以对复杂和非线性的数据…