打造 AI Beings,和微信合作…第七代微软小冰的成长之路
8月15日, “第七代微软小冰”年度发布会在北京举行。本次发布会上,微软(亚洲)互联网工程院带来了微软小冰在 Dual AI 领域的新进展,全新升级的部分核心技术,最新的人工智能创造成果,以及更多的合作与产品落地。其中,最引人瞩目的当属小冰与微信的合作,以及全新的 Avatar Framework 带来的 AI Beings 的无限可能。
核心技术突破:AI如何主动引导对话?
据介绍,第七代微软小冰升级了核心对话引擎、全双工语音及多模态交互感官等核心技术,在人工智能创造(AI Creation)方面也取得了多项技术突破,目前在文本、声音、视觉创造方面均发布了实际的线上产品。
全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达68%,比上一个版本的转化率提高21%。
全双工语音交互感官:微软小冰于2017、2018年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。
面向未来的多模态交互感官:是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。继去年宣布率先开始多模态感官的研发后,今年2月,微软日本小冰团队已邀请当地媒体进行了公开测试。该感官有望成为5G时代的全新交互形式。
此外,去年微软小冰团队发布了共感模型,它可以让AI在对话中察言观色,根据人类的不同反应制定出不同的对话策略,于是AI开始具有引导对话的能力,但是这样的引导能力还仅仅限于AI在当前这一轮对话之中,而对于未来对话的走向,AI是毫无概念的。今年的小冰不仅基于过去,还能着眼未来,也就是说小冰已经开始预先筹划整个对话未来可能出现的各种走向,在某些场合下真正主导对话的进程。
小冰团队技术负责人周力介绍称,「主导对话在历代微软小冰对话引擎中是很重要的分水岭,当我们拥有这个能力时,我们可以把她运用到各个垂直领域,并且都取得了非常好的效果。比如说在电商购物领域,如果大家参加过我们以前的发布会,可能有些朋友还记得,我们在日本和LINE、罗森进行的商业合作中,曾经实现过47%的优惠券转化率,今年我们把主导对话的新技术能力加入其中,让小冰在十轮对话之内,从在线货架中挑选出用户喜欢的商品并推荐出来,实际达到的转化率从47%增长到68%,这是我们在美国实际落地场景中的数字。」
推出 Avatar Framework,AI Beings 上线
在这次的大会上,微软还提出了一个新概念:AI Beings。
什么是 AI Beings,小冰团队总负责人李笛表示,「我们将来会发现今天我们对于人工智能产品的很多定义,比如说某某助手或者是某某机器人,未来会证明这样的定义可能是非常粗糙的。我们把人类叫做 Human Beings,所以为了说清楚问题,我们先姑且把这种类型的人工智能存在统一的定义为 AI beings。」
通过微软小冰,李笛团队不停地去尝试不同类型的 AI Beings,不过不管任何一个AI Beings定义多么具体,都需要有一种更加基础、底层、能够证明它的某种统一性的框架,才能使它得到支撑。
李笛表示,「人类也是一样,我们都有自己的职业,但是职业不能代表我们的全部,我们必须首先是一个人。Avatar Framework 所提供的就是类似这样的价值,能够让任何一个无论有还是没有明确定义的 AI beings,首先成为一个通用的 AI Beings。」
在这次发布会上,微软做出了一个重要的决定,将孕育出了小冰的一套完整框架开放了出来,这就是 Avatar Framework 工具。这套框架工具能够让每个人去打造属于自己的小冰,让更多 AI Beings 拥有类似的通用、完整框架的能力,他们可以有基于情感计算的对话引擎,有可以被定义为交流的感官,能听、能说、能看、能创造,也能像小冰这样无处不在。
Avatar Framework 由四部分构成,首先是Profile工具,它可以从IQ和EQ两个方面为AI beings定义人格,目前拥有27项参数;其次是一系列工具,为AI beings调整核心对话引擎、计算机语音、计算机视觉等能力;然后是一系列工具,让AI beings具有三观、知识、技能等;最后是驱动3D模型,让一个虚拟的AI beings拥有自己的形象。值得一提的是,所有这四个部分之间是相互关联的,任何性格、知识图谱等设定都会影响到AI beings的三观、创造力,甚至说话的语气。
在过去一年的时间里面,微软已经把工具包付诸实际的使用了,比如软银的 Pepper 机器人,在最新3.0的版本升级里面,正是使用Avatar Framework,才实现了在情感计算方面的长足进步,以及和阅文集团在《全职高手》方面的合作,也是用 Avatar Framework 工具包来实现5个主人公的AI实体化的工作。
据悉,Avatar Framework 已经开始向合作伙伴单位开放,面向个人用户的版本将于2020春季发布,真正做到 Avatar Framework for everyone。
与阅文、微信等深度合作,坚持「第三方平台」发展策略
微软小冰自去年开始执行Dual AI战略计划。目前,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。目前,在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在23轮。
本次发布会宣布了微软小冰与腾讯、小米、今日头条、vivo和OPPO等合作伙伴的共同项目。其中绝大部分产品均已随第七代小冰发布上线,包括与国产TOP5手机生产商共同完成的“召唤小冰”产品形态等。
此外,小冰还跟阅文集团的合作,把《全职高手》中5个主要的人物带入了现实世界,也就是说他的读者和观众可以跟他们进行开放域的交流。微软全球资深副总裁王永东介绍道,《全职高手》这个合作也只是微软和阅文集团合作的一小部分,其合作已经从一部小说的主人公,扩展到100部小说。
除与阅文集团的合作外,本次发布会正式宣布微软小冰上线了vivo和OPPO的手机系统,只要通过“召唤小冰”这个统一口令,就可以和她交互,其也实现了与国产TOP5手机生产商共同完成“召唤小冰”产品形态。
目前,微软也在不断地探索着如何深度融入主流社交平台网络,小冰已与微信AI团队就微信的对话开放平台以及微信AI所涉及的智能硬件产品展开合作。在内容和资讯平台上,继网易新闻和新浪新闻后,微软小冰和今日头条的合作也已经正式上线。
此外,微软宣布小冰将继续坚持「第三方平台」发展策略,而不推出独立的第一方产品形态。
相关文章:
感知机介绍及实现
感知机(perceptron)由Rosenblatt于1957年提出,是神经网络与支持向量机的基础。感知机是最早被设计并被实现的人工神经网络。感知机是一种非常特殊的神经网络,它在人工神经网络的发展史上有着非常重要的地位,尽管它的能力非常有限,…

不甘心只做输入工具,搜狗输入法上线AI助手,提供智能服务
8月19日搜狗输入法上线了新功能——智能汪仔,在输入法中引入了AI助手,这是搜狗输入法继今年5月推出“语音变声功能”后又一个AI落地产品。 有了智能汪仔AI助手的加持后,搜狗输入法能够在不同的聊天场景,提供丰富多样的表达方式从…
可构造样式表 - 通过javascript来生成css的新方式
可构造样式表是一种使用Shadow DOM进行创建和分发可重用样式的新方法。 使用Javascript来创建样式表是可能的。然而,这个过程在历史上一直是使用document.createElement(style)来创建<style>元素,然后通过访问其sheet属性来获得一个基础的CSSStyle…

模板方法模式与策略模式的区别
2019独角兽企业重金招聘Python工程师标准>>> 模板方法模式:在一个方法中定义一个算法的骨架,而将一些步骤延迟到子类中。模板方法使得子类可以在不改变算法结构的情况下,重新定义算法中的某些步骤。 策略模式:定义一个…

简单明了,一文入门视觉SLAM
作者 | 黄浴转载自知乎【导读】SLAM是“Simultaneous Localization And Mapping”的缩写,可译为同步定位与建图。最早,SLAM 主要用在机器人领域,是为了在没有任何先验知识的情况下,根据传感器数据实时构建周围环境地图,…
大主子表关联的性能优化方法
【摘要】主子表是数据库最常见的关联关系之一,最典型的包括合同和合同条款、订单和订单明细、保险保单和保单明细、银行账户和账户流水、电商用户和订单、电信账户和计费清单或流量详单。当主子表的数据量较大时,关联计算的性能将急剧降低,在…

Windows7上配置Python Protobuf 操作步骤
1、 按照http://blog.csdn.net/fengbingchun/article/details/8183468 中步骤,首先安装Python 2.7.10; 2、 按照http://blog.csdn.net/fengbingchun/article/details/47905907 中步骤,配置、编译Protobuf; 3、 将(2)中生成的pr…

鲜为人知的静态、命令式编程语言——Nimrod
Nimrod是一个新型的静态类型、命令式编程语言,支持过程式、函数式、面向对象和泛型编程风格而保持简单和高效。Nimrod从Lisp继承来的一个特殊特性抽象语法树(AST)作为语言规范的一部分,可以用作创建领域特定语言的强大宏系统。它还…

机器学习进阶-图像形态学操作-腐蚀操作 1.cv2.erode(进行腐蚀操作)
1.cv2.erode(src, kernel, iteration) 参数说明:src表示的是输入图片,kernel表示的是方框的大小,iteration表示迭代的次数 腐蚀操作原理:存在一个kernel,比如(3, 3),在图像中不断的平移,在这个9…

无需成对示例、无监督训练,CycleGAN生成图像简直不要太简单
作者 | Jason Brownlee译者 | Freesia,Rachel编辑 | 夕颜出品 | AI科技大本营(ID: rgznai100)【导读】图像到图像的转换技术一般需要大量的成对数据,然而要收集这些数据异常耗时耗力。因此本文主要介绍了无需成对示例便能实现图…

Git使用常见问题解决方法汇总
1. 在Ubuntu下使用$ git clone时出现server certificate verification failed. CAfile:/etc/ssl/certs/ca-certificates.crt CRLfile: none 解决方法:在执行$ git clone 之前,在终端输入: export GIT_SSL_NO_VERIFY1 2. 在Windows上更新了…

服务器监控常用命令
在网站性能优化中,我们经常要检查服务器的各种指标,以便快速找到害群之马。大多情况下,我们会使用cacti、nagois或者zabbix之类的监控软件,但是这类软件安装起来比较麻烦,在一个小型服务器,我们想尽快找到问…
Ubuntu下内存泄露检测工具Valgrind的使用
在VS中可以用VLD检测是否有内存泄露,可以参考http://blog.csdn.net/fengbingchun/article/details/44195959,下面介绍下Ubuntu中内存泄露检测工具Valgrind的使用。Valgrind目前最新版本是3.11.0, 可以从http://www.valgrind.org/ 通过下载源码…

数据为王的时代,如何用图谱挖掘商业数据背后的宝藏?
这是一个商业时代,一个数据为王的时代,也是一个 AI 迎来黄金发展期的时代。据史料记载,商业在商朝已初具规模。斗转星移,时光流转,到 2019 年,商业形式已发生翻天覆地的变化,但是商业的本质——…

旋转卡壳——模板(对踵点)
这东西学了我大概两天吧。。其实不应该学这么久的,但是这两天有点小困,然后学习时间被削了很多\(QwQ\) 说几个坑点。 - 对于题目不保证有凸包的情况,要选用左下角的点,而非单纯的最下边的点构造凸包。 - 对于凸包中只有\(1/2\)个点…

SNMP 协议 OID的使用
为什么80%的码农都做不了架构师?>>> SNMP 协议 OID的使用 SNMP(Simple Network Management Protocol简单网络管理)协议 是现在网络管理系统(NMS)监控网络设备状态的协议,是现在网管事实上的标准…

颜色空间YUV简介
YUV概念:YUV是被欧洲电视系统所采用的一种颜色编码方法(属于PAL,Phase Alternation Line),是PAL和SECAM模拟彩色电视制式采用的颜色空间。其中的Y、U、V几个字母不是英文单词的组合词,Y代表亮度,其实Y就是图像的灰度值…

基于RNN的NLP机器翻译深度学习课程 | 附实战代码
作者 | 小宋是呢来源 | CSDN博客深度学习用的有一年多了,最近开始NLP自然处理方面的研发。刚好趁着这个机会写一系列 NLP 机器翻译深度学习实战课程。本系列课程将从原理讲解与数据处理深入到如何动手实践与应用部署,将包括以下内容:…

trash-cli设置Linux 回收站
trash-cli 设置 Linux 回收站 trash-cli是一个使用 python 开发的软件包,包含 trash-put、restore-trash、trash-list、trash-empty、trash-rm等命令,我们可以通过这条命令,将文件移动到回收站,或者还原删除了的文件。 trash-cli的…

磁盘有时也不可靠
实验服务器的磁盘是最近买的,当卖家问我要普通的还是高级的, 我选择了普通,现在追悔莫及。今天的分析更加详细。首先发现每次实验,出错的文件都不一样,所以应该不是临界条件的问题。下表总结了出错的位置,原…

从原理到落地,七大维度详解矩阵分解推荐算法
作者 | gongyouliu编辑丨Zandy来源 | 大数据与人工智能 ( ID: ai-big-data)导语:作者在《协同过滤推荐算法》这篇文章中介绍了 user-based 和 item-based 协同过滤算法,这类协同过滤算法是基于邻域的算法(也称为基于内存的协同过…

libyuv库的使用
libyuv是Google开源的实现各种YUV与RGB之间相互转换、旋转、缩放的库。它是跨平台的,可在Windows、Linux、Mac、Android等操作系统,x86、x64、arm架构上进行编译运行,支持SSE、AVX、NEON等SIMD指令加速。下面说一下libyuv在Windows7VS2013 x6…

封装 vue 组件的过程记录
在我们使用vue的开发过程中总会遇到这样的场景,封装自己的业务组件。 封装页面组件前要考虑几个问题:1、该业务组件的使用场景 2、在什么条件下展示一些什么数据,数据类型是什么样的,及长度颜色等 3、如果是通用的内容,…
Service的基本组成
Service与Activity的最大区别就是一有界面,一个没有界面。 如果某些程序操作很消耗时间,那么可以将这些程序定义在Service之中,这样就可以完成程序的后台运行, 其实Service就是一个没有界面的Activity,执行跨进程访问也…
BP神经网络公式推导及实现(MNIST)
BP神经网络的基础介绍见:http://blog.csdn.net/fengbingchun/article/details/50274471,这里主要以公式推导为主。BP神经网络又称为误差反向传播网络,其结构如下图。这种网络实质是一种前向无反馈网络,具有结构清晰、易实现、计算…
AI应用落地哪家强?CSDN AI Top 30+案例评选等你来秀!
人工智能历经百年发展,如今迎来发展的黄金时期。目前,AI 技术已涵盖自然语言处理、模式识别、图像识别、数据挖掘、机器学习等领域的研究,在汽车、金融、教育、医疗、安防、零售、家居、文娱、工业等行业获得了令人印象深刻的成果。 在各行业…
安利Mastodon:属于未来的社交网络
我为Mastodon开发了一款安卓客户端,v1.0版本已经发布,欢迎下载使用 源码在这里:https://github.com/shuiRong/Gakki ??? 正文 Mastodon(长毛象)是什么? 是一个免费开源、去中心化、分布式的微博客社交网络,是微博、…

通过案例练习掌握SSH 的整合
1. SSH整合_方案01 ** 整合方案01 Struts2框架 Spring框架 在Spring框架中整合了Hibernate(JDBC亦可) 一些业务组件(Service组件)也可以放入Spring框架中迚行管理(昨天的例子) 1. 请求࿰…
tiny-cnn开源库的使用(MNIST)
tiny-cnn是一个基于CNN的开源库,它的License是BSD 3-Clause。作者也一直在维护更新,对进一步掌握CNN很有帮助,因此下面介绍下tiny-cnn在windows7 64bit vs2013的编译及使用。 1. 从https://github.com/nyanp/tiny-cnn下载源码࿱…

玩嗨的2亿快手“老铁”和幕后的极致视觉算法
作者 | Just出品 | AI科技大本营(ID:rgznai100)创立八年,短视频平台快手目前已经有超过两亿人在每天登陆使用,每天还有超过 1500 万条短视频被制作和上传,每天的累计观看数更是达到 150 亿。拥有如此庞大的用户数&…