当前位置: 首页 > 编程日记 > 正文

阿里发布AliGenie2.0系统,“百箱大战”用上视觉武器

天猫精灵X1的升级版X2没有预期出现,而人机交互系统AliGenie升级到最新的2.0版本,功能强大。

3月22日,阿里巴巴人工智能实验室总经理浅雪(陈丽娟)发布AliGenie2.0系统,它最大的改进是在1.0的基础上增加了视觉能力,并引入多模态交互能力,只需要另外增加一些辅助设备,就能让天猫精灵具备视觉能力。同时,浅雪还宣布,天猫精灵销量已经超过200万台。

四年前,亚马逊推出Echo,将AI音箱大战引发;去年,亚马逊又推出带屏幕的音箱Echo Show,音箱视觉化、屏幕化成为一种趋势。除了AliGenie2.0外,京东叮咚Play以及百度即将发布的“小度在家”都具备视觉能力,AI音箱终于要拼视觉了。

AliGenie2.0:增加图像识别、物体检测、人脸识别能力

去年5月,阿里人工智能实验室(AI Labs)发布天猫精灵X1,内置AliGenie1.0系统。

AliGenie1.0已经建立了超强的知识体系,在这个知识体系当中拥有1个亿的实体理解能力,构建了近10亿的关系。同时AliGenie1.0算法也在升级,阿里AI Labs发布了一个全新的序列标注模型,这个序列标注模型能解决有自动纠错的能力,可以帮助语音理解有更强的容错性。AliGenie还具备主动学习能力,每一次跟用户的交互过程当中,系统都会自动完善。

浅雪发布的AliGenie2.0系统,是在1.0的基础上形成具备视觉、语音等多模态交互能力的新一代的人机交流系统。它不仅会具备听觉能力,还有视觉能力和情感反馈能力。

其中,视觉能力中又分为图像识别、人脸识别、物体检测三大技术。

e59071efed5b5b0cf4ea5e8f30bc877f2dc78665

同时,阿里AI Labs还把语音能力和视觉能力进行了融合,形成多模态交互的过程,从而构建一个更聪明的人机交流系统。

浅雪认为,人机交互远远不仅语音,“我们觉得在未来人机交互不仅有听觉,还有视觉、嗅觉,以及有更强的情感反馈能力。”

阿里AI Labs去年在自然语言理解等方向投入诸多,并在去年10月宣布引入微软亚洲研究院首席研究员聂再清博士、谷歌 Tango 和 DayDream 项目技术主管李名杨博士。目前聂再清负责阿里AI Labs北京研发中心的各项研发工作,并重点突破知识图谱和自然语言理解这两个领域。李名杨任 AI Labs 机器视觉杰出科学家。

9a7dadc93b2dda0e8da0eb3c1f3786a480402f50

阿里AI Labs北京研发中心负责人聂再清

在接受专访时,聂再清表示,天猫精灵具备情景感知、主动学习能力。自然语言理解很大的难点是因为自然语言的多样性,一句话可能有无数的意思,这就需要通过大数据,让开发人员跟大数据的交互主动进行挖掘,主动找到路径让开发人员跟用户一起交互,把语言的各种意思都完善了,才能让机器听懂,这也是阿里AI Labs 技术上的优势。

阿里AI Labs做硬件的逻辑:亲手打造更懂跨界,AliGenie系统将来或开放

虽然天猫精灵X2没有发布,但更小巧尺寸的天猫精灵曲奇、天猫路由器、天猫魔屏 S1 无屏电视以及周边配件等诸多硬件同时亮相。

7c30bd12d2800b36971c4f188b46207f6912d1cf

623fcf1414fb7ac0760d3483bc1a6c3edcf87e13

阿里最擅长做平台,这次一口气发布多款硬件产品,并非要转变路线,其背后的逻辑非常现实:做硬件比软件难的多。

浅雪说,阿里AI Labs在做天猫精灵之前,就已经尝试跟行业的一些合作伙伴共同研发硬件,但在合作过程中碰到了非常多的挑战,毕竟软硬件这两个不同领域跨界合作,相互之间并不清楚里面存在的问题。

一般来说,如果自己只做服务、系统,交给第三方做硬件的话,不容易掌握品控、制造周期等环节,这也是AI Labs去年自己着手打造硬件的原因。

不过,阿里做平台的基因没有变。浅雪希望AliGenie这个系统将来做的更好,让硬件的合作伙伴可以做(相关产品),应用AliGenie这套技术。

013bcdd9481dd72ab5fd3a82804a56f68c79321b

此外,浅雪还宣布,现在天猫精灵的销量已经突破200万台。

百箱大战继续升级:增加视觉能力,实现更多场景

2014年亚马逊的Echo问世,点燃了AI音箱大战的导火索,谷歌Home、苹果的Home Pod以及国内的阿里天猫精灵、小米的小爱同学、猎豹AI音箱等纷纷入场;去年亚马逊发布带屏幕的音箱Echo Show,将AI音箱带入另一个竞争阶段:视觉化。

虽然这次天猫精灵并没有推出带屏幕的音箱,但AliGenie 2.0将视觉能力落地,推出了“精灵火眼”:外置一台XHolder(类似手机支架),放置装有天猫精灵手机APP的手机后,能够让天猫精灵具备视觉认知能力。

79b6e11ff56b3d3a078baf97e7e00768046647f6

这种做法类似当年谷歌在推出VR产品时,外设的Google Cardboard,能够在实现视觉功能的同时,最大限度节省成本。

但“友商”们更激进。在今年CES上,京东智能音箱叮咚Play亮相,这款产品配备了8英寸的液晶显示屏,能够实现视频通话、人脸识别等功能。百度近日也宣布,将在下周发布“小度在家”智能视频音箱。

进入2018年,视觉化、屏幕化让“百箱大战”进入到新的竞争阶段。与单纯的语音音箱而言,加入了视觉功能的音箱能够实现更多场景。以“精灵火眼”为例,阿里与出版业合作,通过图像识别书本后,“精灵火眼”能够实现智能语音互动、声音朗读,帮助儿童读书、识字,商业化空间巨大。


原文发布时间为:2018-03-23

本文作者:张乾

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:阿里发布AliGenie2.0系统,“百箱大战”用上视觉武器

相关文章:

Centos5.6 VNC安装配置【无错版】

不严格按本步骤就会出现VNC桌面花屏,就是桌面分离为一层一层的。。。 ---------------------------------------- 先装X window http://blog.csdn.net/21aspnet/article/details/6997549 ---------------------------------------- Centos5.6 VNC安装配置 一、检查是…

关于IOS的屏幕适配(iPhone)——资源适配

IOS的屏幕适配几乎不需要大量的代码操作,更多的时间我们只是动动鼠标选择一下就搞定。可以苹果在这方面做的还是比较人性的,解放了开发者。 首先来说说Iphone这几种屏(由于最近做的是iPhone APP还未涉及到iPad,将来涉及到iPad时会…

Go modules基础精进,六大核心概念全解析(下)

Go 语言做开发时,路径是如何定义的?Go Mudules又为此带来了哪些改变?本文将会全面介绍Go Modules六大核心概念,包括了设计理念与兼容性原则等,掌握这些技术点对于管理和维护Go 模块有重要价值。 在上篇中,我…

京东区块链白皮书解读, 做“链接器”,一次技术宣言

前天,京东对外发布了《京东区块链技术白皮书(2018)》。 昨天,京东金融发布了旨在帮助中小银行提升零售信贷效率的产品“北斗”。目前,“北斗”已经接入包括江苏银行、南京银行、包商银行在内的近30家银行。京东金融还与近30家商业银行共同发起…

xauth: (stdin):1: bad display name LSPPC-Lenny:1 in add command

启动vnc4server之后出现如下错误提示:LSPPC-Lenny:~# vnc4serverxauth: (stdin):1: bad display name "LSPPC-Lenny:1" in "add" command New ‘LSPPC-Lenny:1 (root)’ desktop is LSPPC-Lenny:1 Starting applications specified in /root/…

使用 Python 和 OpenCV 构建 SET 求解器

作者 | 小白来源 | 小白学视觉小伙伴们玩过 SET 吗?SET 是一种游戏,玩家在指定的时间竞相识别出十二张独特纸牌中的三张纸牌(或 SET)的模式。每张 SET 卡都有四个属性:形状、阴影/填充、颜色和计数。下面是一个带有一些…

Delphi XE5 常用功具与下载

1.Delphi XE5 正式版http://altd.embarcadero.com/download/radstudio/xe5/delphicbuilder_xe5_win.isohttp://altd.embarcadero.com/download/radstudio/xe5/delphicbuilder_xe5_upd1_win.iso2. cnpack 助手工具http://www.cnpack.org/download/unstable/CnWizards_1.0.1.665_…

maven学习(4)-Maven 构建Web 项目

紧接着上一节(3)&#xff0c;现在maven新建web项目&#xff0c;user-web。模拟一个用户登录的需求&#xff1a; 工程结构&#xff1a; pom.xml: <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance&qu…

如何查看linux版本

1. 查看内核版本命令&#xff1a; 1) [rootq1test01 ~]# cat /proc/version Linux version 2.6.9-22.ELsmp (bhcompilecrowe.devel.redhat.com) (gcc version 3.4.4 20050721 (Red Hat 3.4.4-2)) #1 SMP Mon Sep 19 18:00:54 EDT 2005 2) [rootq1test01 ~]# uname -a …

存储过程由结构表生成表

结构表 CREATE TABLE JGTB5001( ZDM VARCHAR2(30 BYTE), HZM VARCHAR2(100 BYTE), LX VARCHAR2(50 BYTE), JD VARCHAR2(20 BYTE), WBKLX VARCHAR2(100 BYTE), FUNCTIONNAME VARCHAR2(50 BYTE), FUNCTIONPARAMETER VARCHAR2(50 BYTE)); 生成的TB表CREATE OR REPLACE PROCEDURE P…

好礼相送|CSDN云原生 Meetup 成都站报名热烈启动,12.18见!

伴随着容器、Kubernetes及微服务等技术热度的持续攀升&#xff0c;云原生正以不可撼动之势&#xff0c;剑指云计算的下一个十年。12月18日&#xff0c;CSDN将在成都举办第三场云原生线下Meetup。在这里&#xff0c;您可以了解各大领先企业的云原生落地实践&#xff0c;与众多云…

vue-music 音乐网站

在学习完vueJS,一直想做个项目来锻炼一下,选来选去&#xff0c;还是做个网易云音乐&#xff0c;其间遇到了很多坑,也逐渐接受了vue这种组件化的思想以及从Dom操作转换为用数据去驱动视图。并且在某部分基础组件上借鉴(搬运)了elementUI的源码(不过elementUI写的是真好) 技术栈 …

shell环境变量

shell环境变量 环境变量 还记得上一章里面﹐我曾经提到过﹕当我们登入系统的时候﹐首先就获得一 shell﹐而且它也占据一个行程&#xff08;进程&#xff09;﹐然后再输入的命令都属于这个 shell 的子程序&#xff08;子进程&#xff09;。如果您学习够细心﹐不难发现我们的 sh…

apache用户认证

先创建一个“用户认证”目录&#xff08;设为abc&#xff09;[rootLAMPLINUX ~]# cd /data/www[rootLAMPLINUX www]# mkdir abc进入abc目录[rootLAMPLINUX www]# cd abc拷贝一个文件&#xff08;作用&#xff1a;验证配置是否生效&#xff09;[rootLAMPLINUX abc]# cp /etc/pas…

20个经典函数细说 Pandas 中的数据读取与存储,强烈建议收藏

作者 | 俊欣来源 | 关于数据分析与可视化大家好&#xff0c;今天小编来为大家介绍几个Pandas读取数据以及保存数据的方法&#xff0c;毕竟我们很多时候需要读取各种形式的数据&#xff0c;以及将我们需要将所做的统计分析保存成特定的格式。我们大致会说到的方法有&#xff1a;…

fastlane自动打包--详细介绍

fastlane--Packaging 自动化打包&#xff0c;通过fastlane自动发布Fastlane安装不在这里详细罗列&#xff0c;参照一下链接流程 https://www.jianshu.com/p/0a113f754c09操作步骤 1.检查Fastlane是否正确安装。输入以下命令&#xff1a; fastlane --version 复制代码可以看到Fa…

【Big Data】HADOOP集群的配置(一)

Hadoop集群的配置&#xff08;一&#xff09; 摘要: hadoop集群配置系列文档&#xff0c;是笔者在实验室真机环境实验后整理而得。以便随后工作所需&#xff0c;做以知识整理&#xff0c;另则与博客园朋友分享实验成果&#xff0c;因为笔者在学习初期&#xff0c;也遇到不少问题…

C语言 条件编译详解

预处理过程扫描源代码&#xff0c;对其进行初步的转换&#xff0c;产生新的源代码提供给编译器。可见预处理过程先于编译器对源代码进行处理。在C 语言中&#xff0c;并没有任何内在的机制来完成如下一些功能&#xff1a;在编译时包含其他源文件、定义宏、根据条件决定编译时是…

凝聚406万开发者 飞桨十大发布提速产业智能化

12月12日&#xff0c;由深度学习技术及应用国家工程实验室主办的WAVE SUMMIT2021深度学习开发者峰会在上海召开。百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰公布飞桨最新成绩单&#xff1a;凝聚406万开发者、创建47.6万模型、服务15.7万企事业单位&#xff0…

环境变量,cp,mv,查看文档命令

2019独角兽企业重金招聘Python工程师标准>>> 一、环境变量PATH echo $PATH 打印当前的环境变量 PATH$PATH:路径 自定义环境变量 which查找某个命令的绝对路径&#xff0c;也可以查看某个命令的别名&#xff0c;which查找的范围就在PATH下的几个目录下查找&#xff1…

Linux中errno使用

当linux中的C api函数发生异常时,一般会将errno变量(需include errno.h)赋一个整数值,不同的值表示不同的含义,可以通过查看该值推测出错的原因&#xff0c;在实际编程中用这一招解决了不少原本看来莫名其妙的问题。但是errno是一个数字&#xff0c;代表的具体含义还要到errno.…

工程师文化:BAT 为什么不喊老板

BAT员工之间不喊老板&#xff0c;也不喊真名&#xff0c;而是用同学、花名&#xff0c;这是虚情假意&#xff1f;还是弘扬武侠文化&#xff1f;还是另有隐情&#xff1f;为什么欧美公司不这么做&#xff1f;本文将带大家走进科学&#xff0c;探索真相。 BAT 的称呼方式 腾讯&am…

SVN常见问题

2019独角兽企业重金招聘Python工程师标准>>> 目录[隐藏] 1. 提示SVN证书过期&#xff1f; 2. 用户名密码校验失败&#xff1f; 3. SVN提交文件时提示文件冲突怎么办&#xff1f; 4. SVN提交文件时提示失败&#xff1f; 1. 提示SVN证书过期&#xff1f; 问题描述&…

2017海克斯康拉斯维加斯美国大会 精彩即将开始

海克斯康集团与遍及全球行业用户的故事已经证明&#xff0c;海克斯康先进的解决方案影响着世界各行各业的发展&#xff0c;并为他们带来了颠覆性的科技变革...... 通过海克斯康集团与遍及全球行业用户的故事&#xff0c;已经证明海克斯康先进的解决方案影响着世界各行各业的发展…

Linux环境编程--waitpid与fork与execlp

waitpidwaitpid(等待子进程中断或结束)表头文件#include<sys/types.h>#include<sys/wait.h>定义函数 pid_t waitpid(pid_t pid,int * status,int options);函数说明waitpid()会暂时停止目前进程的执行,直到有信号来到或子进程结束。如果在调用 wait()时子进程已经结…

C# 批处理制作静默安装程序包

使用批处理WinRAR制作静默安装程序包 echo 安装完窗口会自动关闭&#xff01;&#xff01;&#xff01; echo off start /wait Lync.exe /Install /Silent start /wait vcredist_x86/vcredist_x86.exe /q /norestart start /wait DotNetFx40/dotNetFx40_Full_x86_x64.exe /q /…

程序员是复制粘贴的工具人?还是掌握“谜底”的魔术师?

作者 | David Heinemeier Hansson译者 | 弯月出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;编程世界在经历了“Imposter Syndrome(冒充者症候群/负担症候群&#xff09;”和“gatekeeping&#xff08;守门人理论&#xff09;”两方的激战之后&#xff0c;最终以“…

Josephus Problem的详细算法及其Python, Java语言的实现

笔者昨天看电视&#xff0c;偶尔看到一集讲述古罗马人与犹太人的战争——马萨达战争&#xff0c;深为震撼&#xff0c;有兴趣的同学可以移步&#xff1a;http://finance.ifeng.com/a/20170627/15491157_0.shtml . 这不仅让笔者想起以前在学数据结构时碰到的Josephus问题&a…

SlightPHP

SlightPHP是一个轻量级的php框架&#xff0c;支持php5&#xff0c;和php模块方式使用&#xff0c;和apc使用性能更高&#xff01;项目地址&#xff1a;http://code.google.com/p/slightphp/源码地址&#xff1a;http://slightphp.googlecode.com/svn/trunk/你有两种方法使用Sli…

bzoj1178

题目&#xff1a;http://www.lydsy.com/JudgeOnline/problem.php?id1178 看ppthttp://wenku.baidu.com/link?urldJv6LNme7syiLGM-TzbEEKXwx36JWEnI5HFrIlzfmzUXXg4HG8FDggj5WQS3EKL3k3p-sUYeJ268jCvN4t_kq2YPo3I4GXvaGulQjXrO3d7#include<cstdio> #include<cstdlib&…