第九代小冰惊喜登场,多端融合且琴棋书画样样精通
谈及智能助手,相信大家都不会漏过小冰这款具有划时代意义的产品。从最初的微软小冰到现在的第九代小冰,AI的技术在不断的演进,而小冰也从最初的贴心助手变成了如今琴棋书画样样精通的人工智能前沿技术载体。
北京时间2021年9月22日,小冰公司与微软(亚洲)互联网工程院在北京联合举行了第九代小冰年度发布会,便发布了小冰最新的合作与技术升级相关消息。
第九代小冰框架核心技术升级,宣布大量战略合作
小冰公司前身为微软小冰团队。去年7月13日,微软宣布将小冰分拆为独立实体,并继续保持投资权益。分拆后,团队加速促进全球前沿技术与本地化的产品融合,扩展其在人工智能基础研究方面的领先优势。目前,小冰框架是全球承载交互量最大的完备人工智能框架之一,技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。其中,在开放域对话、多模态交互、超级自然语音及内容生成领域居于全球领先。
本次发布会,微软宣布了与小冰进行的多端产品融合,并透露了近期上线产品计划。其中,Bing搜索引擎已完成与小冰框架融合,将于下个月在更多国家上线。自11月起,在Windows及移动应用产品中的个性化推荐及信息流,也将先后融合小冰。
以继续扩大技术优势,提高多样性指标为目标,第九代小冰对框架进行了多处升级。
其中,在开放域对话方面,重点加强了小样本学习与反馈式学习的效能。根据最新的横向评测,全部五项指标均领先于同行业者的超大规模预训练模型效果。这五项指标分别是:平均对话长度、上下文一致性、上下文相关性、对话信息含量与话题引导成功率。与此同时,单轮对话成本仅为同行业者的二十分之一。
在超级自然语音及多模态交互方面,小冰宣布了在语音自然度(Naturalness MOS)和平均舒适时长(Average Comfort Duration)之后的最新技术指标:多样性(Diversity)。并展示了该项技术在人工智能内容生成及小冰岛产品中的实际落地效果。
小冰透露了“Project Chararu”项目及其最新进展。该项基础研究的目标为帮助特定人类个体通过极小样本量,对其本人进行学习,从而达到与该名特定人类个体一致的语言与声音风格。该项目去年通过2000个对话样本,达到3.89分的风格一致性得分(对照该名人类个体本人得分为4.33分)。今年,已实现仅用200个对话样本达到4.19分,非常接近人类本人。该项目已实现产品化,将于今年内首先在日本上线。
本次发布会,小冰宣布了与英伟达在自然语言处理及计算平台等领域的战略合作。此外,还宣布此前与智源研究院、智谱AI战略合作进展顺利,将于下一季度共同发布初版多语言超大规模模型。
琴棋书画背后,人工智能创造领域的技术进展
自2017年首倡并积极推进人工智能创造(内容生成)以来,小冰先后推出了诗歌等文本生成,绘画及视觉设计等视觉生成,及人工智能音乐生成的多项核心技术与产品,利用人工智能高稳定性及大规模并发的优势,推进端到端的内容生成产能。
本次发布会进一步发布了多项新技术产品:
1. 全新的诗歌与绘画创作模型(V3)。该模型大幅度提高了创作精度及构图合理性,并新增中国画模型与“艺术家模型”。“艺术家模型”可在单一人类艺术家训练数据不足的情况下,学习并再现与该艺术家创作风格高度一致的人工智能作品,作品具有独立知识产权。
2019年,小冰与中央美术学院联合培养的人工智能学生“夏语冰”顺利完成研究生毕业,参加研究生毕业作品展并举行多次个人画展。在邱志杰教授的指导下,今年,最新的创作模型对夏语冰进行了升级。目前,夏语冰的中国画作品正在亚洲数字艺术节展出。小冰框架还进一步创造了夏语冰的面容和声线等生物学特征。
2. 新的人工智能歌声合成技术、新歌手及X Studio 2.0发布。小冰创立并保持着在人工智能歌声合成领域的全球领先位置。本次技术升级从学习人类歌声的结果,进一步开始学习歌声的产生过程,从而再次提高了人工智能歌声合成技术的上限。发布会上,以新歌手“陌笙”为例,演示了人工智能超级歌手在高音域范围的表现力,分别演示了原调、+2半音及+4半音的成果。新的X Studio 2.0歌声合成工具包含以上新模型更新,全部歌手均将在接下来的数周内先后升级至新模型。同时,2.0工具还包括力度参数等多项主要新特性,以便于创作者表达更为细腻的音乐作品。
本次发布会,小冰公布与Alice映画达成合作,同时与其他优秀的创作者一起,推出一系列人工智能歌手企划,为年轻的艺术家们赋能,共同探索人工智能歌手的艺术上限。
3. 艺术家创作动机辅助技术。多年以来,小冰框架通过人工智能技术辅助人类艺术家进行作品创作,取得不断进步。继去年与日本AVEX唱片合作红白歌会歌手作品的联合创作后,今年,小冰与做梦唱片共同合作,开展人工智能与人类乐队跨界共创的音乐实验。本次合作为十一支人类乐队提供了人工智能词曲创作动机辅助、演唱和封面视觉设计,《潜入虚拟世界》专辑作品即日起陆续在各大音乐平台上架。
4. Merror。Merror(我镜)由小冰团队与次世文化联手打造,定位为全球首位AI人类观察者。Merror采用了小冰框架的核心对话引擎、全双工、全域超级自然语音等技术,使人工智能交互主体能够在交谈、演唱等场景中,进行高度拟人的实时交互。
在智能汽车领域,凭借在情感计算方面的领先优势,小冰在智能汽车座舱解决方案方面发展迅速。目前,已与宝马等汽车头部厂商达成商业合作。在智能设备领域,“召唤小冰”新增天猫精灵平台。结合此前的华为、小米、OPPO、vivo等合作伙伴,目前深度内嵌小冰的智能设备已超过10亿台。小冰也成为全球规模最大的第三方跨设备人工智能系统。另外,小冰在智能公共领域积极拓展。本次发布会介绍了与日本铁路进行的合作,结合即时通讯与月台联动,乘客可体会温暖便利兼具的出行体验。
小冰团队首个第一方社交平台APP“小冰岛”
小冰岛是人类用户与人工智能融合的一个社交网络平台APP。在该平台中,人类用户可以创造各种人工智能个体,并形成一个共同生活的社交网络。通过小冰框架技术,每个人工智能个体均是独一无二的,并相互协同,向人类用户提供完整的社交与内容体验。小冰岛会随交互进行不断迭代,是目前全球首个该类产品。
本次发布会上宣布,小冰岛预览版APP上线。它具备如下特性:
1. 融合沉浸式体验:每个用户均可创造自己的岛屿,并连带拥有一个功能类似于微信和LINE等社交产品的完整社交交互界面。用户不仅能在岛屿中体验丰富的视觉和自然音场,也不仅能与人工智能个体进行对话,而是再造了完整的一对一对话、群聊、朋友圈和技能生态体验。
2. 高度定制化的人工智能个体(AI beings):每个人工智能个体从面容、声音,到性格、能力均是独一无二的。在小冰岛中,还包含人工智能歌手、音频生产者、文字创作者、画家等各种特别能力的人工智能个体。用户可以根据自己的需要,创造并训练各种新的人工智能个体,也可以从其他人的岛屿中获得。
3. 以人为中心的内容生成,并环绕着用户:通过小冰框架的人工智能技术,根据用户需求,会不间断为用户生成各种长音频、短视频、音乐、文本及视觉内容,每个内容均一对一生成并提供给用户。根据不同人工智能个体的特点,用户可选择由哪个人工智能个体为其提供哪类内容。
4. X套件岛屿版:X套件岛屿版为用户提供了方便高效的内容生产工具。通过X套件,用户可以指定人工智能个体即时生产各种长音频与短视频内容,并自动获得完整的知识产权,可将其作为自己作品,在任何其他平台上使用。
5. 轻松、热情、无时不在:通过人工智能个体间的信号传递,个体们会共同构成以用户为中心的社交生活目标,并相互协同,实时响应用户,将之反映在交互、朋友圈和各种生成的内容中。在小冰岛中,用户能获得类似于社交网络的体验,但不会产生任何社交压力。
本次发布会还介绍,此前用户已通过虚拟亲友产品创造出来的1700万名虚拟人类,将在预览版公测结束后,自动登录他们的小冰岛。
同时,发布会上还宣布,曾经因为分家而下线的微信小冰已重新开放上线,目前所有用户均可在微信公众号xiaobing-official,重新找到小冰,体验全新升级的惊喜。
相关文章:

C++对象赋值的四种方式
1. 引用作为参数的方式传递. 1 GetObject(Object& obj) 2 { 3 obj.value value1; 4 } 特点: 在外部构造一个对象. 把该对象以引用的方式传递到函数中. 从而实现对该对象的改变, 该参数实质是一个[out]类型的参数, 而非[in]类型的参数. 这里的引用可以称为别名. 点评: …

金九银十,不要跳槽!
前言:又到了求职的金九银十的黄金月份,我相信有不少小伙伴已经摩拳擦掌的准备寻找下一份工作。就目前国内的面试模式来讲,在面试前积极的准备面试,复习整个 Java 知识体系将变得非常重要,可以很负责任地说一句,复习准备…

FreeMarker标签介绍
FreeMarker标签使用 一、FreeMarker模板文件主要有4个部分组成 1、文本,直接输出的部分 2、注释,即<#--...-->格式不会输出 3、插值(Interpolation):即${..}或者#{..}格式的部分,将使用数据模型中的部分替代输…

让Squid 显示本地时间
Squid的Error messages 默认的时间显示的GMT时间,而非本地时间,这个有时候看着很别扭。 下面是修改方法,找到Squid的源文件src/errorpage.c 大概在60多行, { ERR_SQUID_SIGNATURE, "\n<BR clear\"all\">\n&…

linux mysql 命令 大全
linux mysql 命令 大全 1.linux下启动mysql的命令: mysqladmin start /ect/init.d/mysql start (前面为mysql的安装路径) 2.linux下重启mysql的命令: mysqladmin restart /ect/init.d/mysql restart (前面为mysql的安装路径) 3.linux下关闭mysql的…

助力5G行业应用扬帆启航,第二届5G毫米波产业高峰论坛圆满召开
当前,5G发展如火如荼,成为引领我国高质量发展的新引擎。5G要想进一步实现向千行百业拓展,离不开全频段的支持,推动5G毫米波发展成为各国共识。为进一步推进5G毫米波产业发展,释放5G全部潜能,助力5G行业应用…

Bootstrap3.x - 源代码分析
参照http://v3.bootcss.com/css/ 文档与源代码colors 比较全面定义总结有意义的颜色。所有uI要用的颜色,都先从已定义的读,这样保证样式的同一性,而且方便以后开发主题库。(建议想自己写css模块的,可以参考一下bootstrap里颜色定义…

清除Squid缓存的小工具
[ 2007-11-2 17:49 | by 张宴 ] 以前我写过一篇《清除指定squid缓存文件的脚本》,但在取URL时存在10%的错误率。如今找到一款老外的程序,可以批量清除某类URL的Squid缓存,支持正则表达式。下载网址:http://www.wa.apana.org.au/~d…

谷歌 AI 编舞师,连张艺兴最喜欢的 Krump 都不在话下
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 舞蹈一直是文化、仪式和庆祝活动的重要组成部分,也是一种自我表达的方式。今天,存在多种形式的舞蹈,从舞厅到迪斯科。然而,舞蹈是一种需要练习的艺术形…

Python 字典(Dictionary)
Python 字典(Dictionary)字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:d {key1 : value1, key2 : value2 …

Varnish Cache 3.0.0安装
https://www.varnish-cache.org/installation/redhat Installation on RedHat 先按需要的模块 在安装软件包之前首先看看主机上的 automake autoconf libtool ncurses-devel libxslt groff pcre-devel pkgconfig软件包是否已经安装 如果没有那么就要首先安装ÿ…

three.js绘制过程(二)
2019独角兽企业重金招聘Python工程师标准>>> 同一个场景中可以有多个摄像机,同一个屏幕缓冲区可以分块绘制不同的物体。 WeblGLRender 中autoClear 设定为false之后, 每次绘制不会清空缓冲区; setSize 设定canvas的大小 setViewpo…

AI 不可以作为专利认证发明人,“因为它不是人”
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 英格兰和威尔士上诉法院本周驳回了一名男子的请求,该男子要求法院承认他的人工智能系统为两项专利的发明者。 总部位于美国的 Imagination Engines 的创始人 Stephen Thaler 想要给智能机器…

使用工作集(Working Set)整理项目
Eclipse鼓励将不同的功能模块划分为独立的项目存在,这样不但结构清晰,组织起来还非常灵活,因为我们可以用feature对这些项目进行不同的组合,输出后得到具有不同功能的产品。 不过这样一来Package Explorer里的项目会以更快的速度增…

深入探讨Varnish缓存命中率
也许你还在为刚才动态内容获得7336.76 reqs/s的吞吐率感到振奋,等等,理想和现实是有差距的,你要忍受现实的残酷,别忘了,我们压力测试中的动态内容都处于全缓存情况下,也就是每次请求都命中缓存,…

网易有道词典笔 —— 73 岁“人类高质量”奶奶梅耶马斯克的中文学习之选
继埃隆马斯克发微博称7000年后英语将不复存在后,他的忠实粉丝,同时也是他的母亲——梅耶马斯克也正式开启了学习新语言行动,值得注意的是,梅耶的语种选择是中文。近日,埃隆马斯克的母亲——梅耶马斯克使用有道词典笔学…

Android类库打包方法探究
为什么80%的码农都做不了架构师?>>> 开发Android应用的时候,对于可用于多个应用的公用的部分,或是打算发布给第三方进行应用集成的部分,要把这部分打包成类库怎么做呢? 众所周知,Android应用使用ADT打包成…

大叔也说并行和串行`性能提升N倍(N由操作系统位数和cpu核数决定)
并行是.net4.5主打的技术,同时被封装到了System.Threading.Tasks命名空间下,对外提供了静态类Parallel,我们可以直接使用它的静态方法,它可以并行一个委托数组,或者一个IEnumerable的迭代,而今天主要通过一…
这7个开源技术,支撑起整个互联网时代
转载自 钛媒体 - 这7个开源技术,支撑起整个互联网时代 开源软件现在成为整个互联网时代的支撑技术,你可能已经无法离开由开源软件构建起来的网络世界了。下面我们就来看看一些最重要的开源技术。 为互联网而生的操作系统linux Linux是一款免费的操作系统…

WebDriver 识别反爬虫的原理和破解方法~
作者|志斌来源|python笔记有时候我们在爬取动态网页的时候,会借助渲染工具来进行爬取,这个“借助”实际上就是通过使用相应的浏览器驱动(即WebDriver)向浏览器发出命令。但是有时候使用浏览器驱动来爬取网页时,会遇到这种情况这时,…

Linux下文件如果没有权限不能被Apache访问
通过 apache的网站 php和图片都可以显示 就是 Htm页面不行 报错 Forbidden You dont have permission to access /me/1.html on this server. 其实是权限设置问题 可以 到文件所在目录 使用命令查看权限 #ls -al 再使用chmod命令给予足够权限即可 #chmod 0644 文件名…

html标签的显示模式(块级标签,行内标签,行内块标签)(转)
html标签的显示模式(块级标签,行内标签,行内块标签) 今天讲课的时候,讲到了html中的标签的显示模式,大致分为块级标签和行内标签。那么初学者在刚使用标签的时候会发现有些属性在一些标签上不起作用&#x…

RT-thread内核之进程间通信
一、进程间通信机制 rt-thread操作系统的IPC(Inter-Process Communication,进程间同步与通信)包含有中断锁、调度器锁、信号量、互斥锁、事件、邮箱、消息队列。其中前5个主要表现为线程间同步,邮箱与消息队列表现为线程间通信。本…
Linux内核学习四库全书
关于内核学习我建议不要上来就读内核而是先了解内核的构成和特性,然后通过思考发现疑问这时再去读内核源码。即先了解概貌在读局部细节。而且内核分成好多部分,不要只是按照顺序去读,应该针对某一部分比如内存管理或进程管理横向读几本书&…

46W 奖金池等你来战!微众银行第三届金融科技高校技术大赛火热报名中!
青春是什么?张爱玲曾说过,青春是个奇形怪状的玩意儿,短短的身子偏偏拖了一个长长的尾巴,像翅膀一样的招摇着,久久不肯离去。对于你我而言,青春是什么?青春也许是大学里点点滴滴的记忆࿱…

spring cloud快速搭建
为什么80%的码农都做不了架构师?>>> 一:注册中心 服务提供者(简单) 注册中心本身就可以是服务提供者,如果有需求可以分开。 1:pom.xml <?xml version"1.0" encoding"UTF-8…

ubuntu操作系统下载
原文网址:http://www.cyberciti.biz/linux-news/download-ubuntu-14-4-cd-dvd-iso-images/ Download of the day: Ubuntu Linux 14.04 LTS CD / DVD ISO by NIXCRAFT on APRIL 17, 2014 5 COMMENTS LAST UPDATED APRIL 17, 2014 in LINUX NEWS, OPEN SOURCE Ubuntu…

Linux内核模块编程入门
针对2.6内核的Linux系统,需要你的机器上已经安装了kernel-devel这个包,也就是编译模块所必须的东西:内核的头文件和一些Makefile。 一,Hello World程序: [code:1:fbc83fc10a]/*file: hello.c*/ #ifndef __KERNEL__ #…

2021中国国际消费电子博览会和青岛国际软件融合创新博览会盛大开幕
9月24日,备受瞩目的2021中国国际消费电子博览会(简称“电博会”)和青岛国际软件融合创新博览会(简称“软博会”)在青岛国际会展中心盛大开幕。国家工信部原副部长杨学山,国家工信部信息技术发展司副司长江明涛,中国机电产品进出口商会秘书长郭…

oracle 11g wm_concat 、 listagg 函数的使用(合并数据)
方法一 wn_concat() 函数 1、把以下图中Name一样的数据合并为一条,而且NO的值要这样显示如 C.1,C.2 2、实现这种效果的操作如下,先把Name的值进行分组(group by),再把NO的值用 wm_concat()函数合并起来(注意…