开源 | IBM、哈佛共同研发:Seq2Seq模型可视化工具
作者 | Ben Dickson
译者 | 刘旭坤
编辑 | Jane
出品 | AI科技大本营
近年来随着深度学习和神经网络技术的发展,机器翻译也取得了长足的进步。神经网络结构越来越复杂,但我们始终无法解释内部发生了什么,“黑箱问题”一直困扰着我们。我们不清楚程序在翻译过程中如何进行决策,所以当翻译出错时也很难改正。随着深度学习在各行各业中的广泛应用,深度学习的不可解释性已经成为其面临的严峻挑战之一。
今年,在德国柏林举办的 IEEE VAST 可视化分析大会上,来自 IBM 和哈佛大学的研究人员展示了为解决翻译中的 AI 黑盒问题所开发的调试工具。这款名为 Seq2Seq-Vis 的工具能将人工智能的翻译过程进行可视化,方便开发人员对模型进行调试。
Seq2Seq-Vis 主要针对机器翻译中最常用的 Seq2Seq 模型。这一模型能够将任意长度的序列,也就是原文的句子,映射到目标语言。除了机器翻译任务,在自动问答、文本摘要等任务中也都主要应用 Seq2Seq 模型。
简单来说,Seq2Seq 模型在机器翻译中的工作原理就是把源语言映射到目标语言,得到了目标语言的序列(也就是初步翻译完的句子)后再进行优化,保证语法和语义上的正确。虽然使用神经网路模型后,机器翻译的结果得到了很大的提升,但同时也非常复杂。
可视化机器翻译的过程
研究人员称研发 Seq2Seq-Vis 的初衷是想有一个类似于基于规则的传统翻译软件中的规则表,这样开发人员可以通过在规则表中对照得到错误信息就可以很简单地修改模型。
Seq2Seq-Vis.io 网站上给出了一个从德语到英语的演示程序。德语的“die längsten reisen fangen an , wenn es auf den straßen dunkel wird.”翻译成英语应该是“The longest journeys begin when it gets dark in the streets.”,但被机器翻译成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以可视化的方式呈现出了序列到序列模型翻译的每一步,这样用户就能像查找规则表一样来找出机器翻译翻译错误的原因。
Seq2Seq-Vis 另一个很有用的功能是它能找出与某个字词相关的训练集,这也是解决 AI 黑盒问题的一大难点。其实一个机器学习模型除了训练集一无所知,所以要解决机器翻译中的错误最终都要回到训练集中去。
将机器翻译过程可视化,用户就能确定翻译出错到底是编码器解码器使用的训练样本出了错还是注意力模型的设置或者其他环节出错了。
更正序列到序列模型
Seq2Seq-Vis 并不是第一个试图解决 AI 黑盒问题的工具,之前有很多大公司和研究机构都有进行尝试,甚至 IBM 自己也在这上面下过功夫。事实上,很多类似的工具需要的信息比 Seq2Seq-Vis 更少,比如有的工具只需要神经网络的输出就可以,而 Seq2Seq-Vis 还需要训练集,整个模型的架构和设置。但 Seq2Seq-Vis 却是第一个既能可视化模型的决策过程也能让开发人员直接修改模型的工具。开发人员可以通过可视化的方式对模型的决策过程进行修改并观察反馈来实现探索式的调试,比如修改输出序列的单词或者对注意力模型的配置进行修改。
听起来是不是很酷,不过 Seq2Seq-Vis 的目标群体是模型架构师或工程师而非机器翻译的终端用户。因为要让这一工具真正发挥作用需要用户对“序列到序列”模型有较为深入的了解。虽然目标这一工具还只是应用在IBM的内部项目中,但它是开源的,所以大家都可以来试试。
项目地址:http://seq2seq-vis.io
Github地址:https://github.com/HendrikStrobelt/Seq2Seq-Vis
原文地址: https://venturebeat.com/2018/11/01/ibm-harvard-develop-tool-to-tackle-black-box-problem-in-ai-translation/
本文由AI科技大本营翻译,转载请联系微信1092722531
2018 中国大数据技术大会
◆
BDTC 2018
◆
BDTC 2018中国大数据技术大会携主题“大数据新应用”再度强势来袭。本次大会由华东师范大学副校长、教授周傲英,百度商业智能实验室主任熊辉,阿里巴巴副总裁李飞飞三位会议主席对大会内容把关,多位两院院士参与指导,由最了解行业痛点的一线从业者为同行打造。
八折优惠仅最后一天,扫描二维码一键抢票,预定属于你的超强干货。点击「阅读原文」查看大会详情。
推荐阅读
程序员的江湖 务必掌握这些黑话!
高达800万次下载量的npm包被黑客篡改了代码,你的设备或正成为挖矿机
相关文章:

h3c l2tp ***配置
远程用户-------internet-------F100 采用l2tp方式sysname XXXX //设备名称#l2tp enable //开启l2tp功能 #firewall packet-filter enablefirewall packet-filter default permit#undo connection-limit enableconnection-limit default den…

Blockchain与Big Data将碰撞出怎样的火花?
区块链技术热潮席卷全球,正在与各种新兴技术深入融合——大数据也不例外,卓有远见的企业已将区块链作为未来发展重点。数据开放的大势下,如何保护隐私与安全是大数据领域的难点与挑战。凭借可信与安全的特性,区块链令越来越多高价…

机器学习之开源库
机器学习库(1)scikit-learn [http://scikit-learn.org/] Python下做机器学习,首推scikit-learn。该项目文档齐全、讲解清晰,功能齐备,使用方便,而且社区活跃。 (2)Orange …

arduino跑python,尝试在我的Arduino和stu上执行Python3.7.2中的代码
提前谢谢你。在我会尽量简短。在我有一个ArduinoIDE,有一个串行端口,工作正常。我下载了python3.7.2、PySerial和VPython。全部安装完毕。在通过我的MacBook终端安装了PySerial。sudo easy_install pyserialPassword: Searching for pyserialBest match:…

揭开Windows XP 系统安全模式的密秘
经常使用电脑的人可能都听说过,当电脑出了故障时,Windows会提供一个名为“安全模式”的平台,在这里用户能解决很多问题--不管是硬件(驱动)还是软件的。然而你会使用这个安全模式么?今天我们就来带您认识一下…

matlab文档型数据导入,MATLAB-数据导入
MATLAB-数据导入在MATLAB中导入数据意味着从外部文件加载数据。 importdata函数允许加载不同格式的各种数据文件。它具有以下五种形式-Sr.No.Function & Description1A importdata(filename)Loads data into array A from the file denoted by filename.2A importdata(‘…

专访百度熊辉:有人转AI纯粹因为好找工作,这样的人不是我想要的
2018 年初,学术界的明星人物,美国罗格斯-新泽西州立大学教授、ACM 杰出科学家、长江学者熊辉加盟百度,担任百度商业智能实验室主任以及百度人才智库主任。 从计算机博士到商学院教授,再从学术圈到工业界,熊…

活下去,是一种信念 !
2008年5月12日14:28分以来,读着不想看到的文字和数据,看着不愿看见的图片和画面,已经成了我的主要生活内容。即便是艰难收拾好心情坐在电脑前的此刻,耳边回响的依然是那种撕心裂肺的痛哭和感天动地的呼喊,眼前浮现的依…

我的一个rsync的包装
我完成了一个基于rsync的文件同步方案,其实有人会问,直接用rsync命令不就可以了吗?其实不然,直接用这个命 令的话只能保证得到了同步的效果,审计信息得不到,然而审计信息很重要,比如哪个时间同步…

2018最后一战:25天编程PK赛!
作者 | Jane出品 | AI科技大本营2018 年余额已不足一个月!是惊喜还是惊恐?这一年是充实有意义的一年,还是觉得略有失望?最后这三十天,我们还能学些什么?获得哪些成长?如何为 2019 年准备一个好的…

java 获取已有字体,java获取本机全部可用字体
java获取本机所有可用字体//just for fun,那个28个字母的函数满满都是恶心import java.awt.GraphicsEnvironment ;class Tester{public static void main(String args[]){GraphicsEnvironment ge GraphicsEnvironment.getLocalGraphicsEnvironment();String forName[] ge.get…

mount --bind
mount --bind 能够镜像的把目录挂载到其他路径下mount --bind //此命令可以把目录挂载到其他目录,有镜像功能,会占用两份同样大小的空间,当你umount的时候,所作的镜像会立马消失. $ls ftp tools $cd ftp $mkdir /home/ftp/tools $cd tools $pwd /home/ftp/tools $mount --bin…

Javascript URL编码方法的比较
javascript中存在几种对URL字符串进行编码的方法:escape(),encodeURI(),以及encodeURIComponent()。这几种编码所起的作用各不相同。 escape() 方法: 采用ISO Latin字符集对指定的字符串进行编码。所有的空格符、标点符号、特殊…

前端、云与人工智能的碰撞 | GDG广州
活动介绍 随着Google TensorFlow的开源升级、前端技术以及云计算的不断发展更迭,企业和开发者都需要与时俱进,才能不被时代大潮给淘汰。本次GDG沙龙旨在通过多个专题演讲为开发者们分享技术进步和业务经验,聚焦前端技术、人工智能以及云计算…

java三维滑雪,第六章 三维数据空间分析方法.ppt
第六章 三维数据空间分析方法* * * * 可视性分析 * * 自然邻域法插值 基本思路: 利用输入点及邻近栅格单元进行插值生成栅格表面。 方法: 利用输入数据点(样本点)为节点,建立Delaunay三角形; 样本点的邻域为其周边相邻多边形形成的凸集中最小…

求教关于NFS服务器的防火墙的设置
我都研究了两个星期的NFS的防火墙了呀,开了rpcinfo -p 显示的所有端口,有hosts,hosts.allow,hosts.deny下的文件也设置了过了呀,可是我开了防火墙,NFS服务器的客户端和和服务器都无法工作呀,那位好心人帮我下呀,最好是有做的这方面的实例的高手呀,共享下你的成功经验呀转载于:h…

退信之550 5.7.1 Unable to relay for *@*.com
"550 5.7.1 Unable to relay for **.com"是常见的退信之一,今天我们就看看导致这个退信的真实原因,以及在mdaemon邮件服务器中遇到这个问题如何解决。接下来,我们看看来自真实环境退信截图。 退信分析:这是一封sh.com域…

“叽里呱啦”说英语,这家公司要用AI增值语言输出能力
11 月 29 日,在线英语启蒙教育品牌叽里呱啦在北京召开“让天赋发声”品牌发布会。叽里呱啦联合创始人兼 CEO 谢尚毅首次对外公开品牌战略,围绕内容、教研、科技三大教育内核,打造教育 IP,积蓄产品力,搭建英语启蒙教育的…

Windows 文件服务器升级跨林迁移(二)
迁移文件服务器登陆到ADMT迁移服务器上,打开ADMT管理控制台,邮件点击AD迁移工具,选择"计算机迁移向导"点击下一步选择源域为旧的控,目标域为新域控,点击下一步从域中选择计算机,点击下一步添加文…

mytag.class.php,织梦CMS/dedecms织梦模板留言板调用{dede:}标签的头部尾部的方法
织梦模板网站留言板调用网站的head.htm,footer.htm的方法二,好多人都想在留言本guestbook.htm里实现dede的标签调用,问题是在plus里不支持dede标签的应用。现在有一个简单的办法可以调用标签。拿在留言本调用head.htm实例一般我们在首页调用h…

用 GDI 操作 EMF 文件[2]: PlayEnhMetaFile、DeleteEnhMetaFile
创建 EMF 文件, 并同时绘制在窗体.unit Unit1;interfaceusesWindows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,Dialogs, StdCtrls;typeTForm1 class(TForm)Button1: TButton;procedure Button1Click(Sender: TObject);end;varForm1: TForm1;implem…

从Storm到Flink:大数据处理的开源系统及编程模型(文末福利)
本文节选自CCF大数据教材系列丛书之《大数据处理》,本书由华中科技大学金海教授主编,包括大数据处理基础技术、大数据处理编程与典型应用处理、大数据处理系统与优化三个方面。本教材以大数据处理编程为核心,从基础、编程到优化等多个方面对大…

mac软件全屏时候最顶上任务栏保留,MAC能不能做一个把程序放在顶部菜单栏的功能...
KochiyaOcean emmmm,我修改了ico为png在app.js 第 22 行const poiIconPath path.join(ROOT,assets,icons,process.platform linux ? poi_32x32.png : poi.png, 将箭头所指的poi.ico 被我修改成了poi.png (不知道你说的是不是修改这里,我看到的icon pa…

Nginx 虚拟主机配置及负载均衡
虚拟主机配置: 在现实中,公司为了充分利用服务器资源 , 一台 Nginx 服务器会同时挂多个站点,这些站点可以基于80端口配置 N 多不同域名的服务器,那么,怎样实现这一功能呢,接下来就让我们学习一下…

明晚8点直播 | 顺丰科技如何利用深度学习赋能智慧物流?
每年年底的双十一已成为盛大的购物节日。而有一个行业在这期间发挥着至关重要的作用——物流。近年来,深度学习已经应用到各行各业中,物流行业也不例外。智慧物流是“互联网”高效物流的重要内容,以智能化技术使物流具有学习、感知、思考、决…

matlab去雾算法论文,基于matlab的图像去雾算法详细讲解与实现-附matlab实现源代码.doc...
本文主要介绍基于Retinex理论的雾霭天气图像增强及其实现。并通过编写两个程序来实现图像的去雾功能。1 Rentinex理论Retinex(视网膜Retina”和大脑皮层Cortex”的缩写)理论是一种建立在科学实验和科学分析基础上的基于人类视觉系统(Human Visual System)的图像增强理论。该算法…

用电脑自带画图工具加字方法
其实加字的话是很简单的,每个电脑都可以,不需要下载什么特殊软件 电脑自带的画图工具就可以轻松加字 首先找到一张图片右击编辑——打开图片 然后我们点左边工具栏的A标志(这个就是加字的按钮) 点了之后我们用鼠标在你需要加字的位…

OCS 2007 聊天记录查看工具 OCSMessage
平时用SQL查看, 总感觉挺麻烦的, 而且里面的{\rtf1\ansi\ansicpg950\deff0\... 数据把我转的还头大 就像以前的WSUS数据, 手动查询忒麻烦,索性开发了这个工具 OCMessage, 也提供给那些想查询他人隐私的朋友一点方便(哈哈)当然, 目前的版本还…

学习笔记 九: DNS
一 DNS服务 Domain Name system,它是一个层级名称树解析网络主机和资源。 常用的解析命令: host dig /etc/resolv.conf host -v -t NS example.com DNS记录: TTL class PTR A cname MX TXT 二 DNS安装配置 caching nameservers unbound : s…

oracle web API,在Web API程序中使用Swagger做接口文档
#### 创建Web API程序在VS2019中创建一个ASP.NET Web应用程序,选择Web API来创建RESTful的HTTP服务项目,构选MVC和Web API核心引用。#### 安装Swashbuckle使用NuGet包管理器,查找安装Swashbuckle,也就是Swagger插件。#### 配置Swa…