不只翻译机,搜狗将在半年内推数款智能硬件产品
10月24日已是昨日,但属于开发者的1024一直都在——2018 AI开发者大会就是你的1024。11月8-9日,现场聆听国内外AI大牛的深知灼见,与工业界AI应用思维紧密同步,收获60+技术大咖的干货分享。扫码填写大会注册信息表,就有可能获得专属定制版门票(含主会+任一半天分论坛),仅限10人。
毫无疑问,搜狗的大部分 AI 技术已嵌入到搜索和输入法这两大“拳头”产品中。
语音技术最大的一个落地产品当属搜狗输入法,它集成了搜狗的语音输入功能、语音翻译功能。而在搜索上,主打搜索直达功能背后的智能匹配技术可以在用户提出问题后在首条就直接给出最为匹配的答案,而不再单纯给出多种结果。
除了在双引擎上落地 AI 技术,搜狗也在发力 B 端政企领域,打造相应的 AI 解决方案,比如为一些行业提供定制的输入法以及智能客服产品。
当然,与其他诸多互联网巨头一样,搜狗也开始发力 AI 硬件。比如搜狗的翻译机,其中结合了语音识别功能、拍照翻译功能。翻译机只是个开始,搜狗 AI 事业部总经理张博告诉AI科技大本营,搜狗接下来会推出几款不同的智能硬件,这些智能硬件都是搜狗 AI 技术的大集成、大载体,并且也会着力在 AI 硬件上做一些拓展,争取让硬件成为搜狗接下来收入的一个重要来源。
9 月初,在浪潮集团承办的 2018 人工智能计算大会(AICC )上,张博接受了 AI科技大本营的采访,讲述了搜狗在翻译机等 AI 硬件上的技术、产品认知和发展战略,以下为对话内容:
▌翻译机是搜狗做 AI 硬件的起点
AI科技大本营:无论是翻译机还是会务翻译系统的离线翻译效果都不太好,与在线翻译相比主要有哪些技术挑战?
张博:离线翻译确实不好做,它在没有网络的情况下,不能调用云端的 API 推理接口,只能在终端实现所有计算。
我们知道,翻译机使用的其实是跟手机类似的 SoC 芯片,而在手机端上要实现一套完整的语音识别、语音合成、机器翻译和 OCR 这套流程,计算量是非常大的,这种情况下效果一定是比在线要差,因为数据、算法都会有一些裁减,包括本身的算力也会低一些。
有了专用 AI 芯片后,离线的翻译技术是不是更好?其实不是这样的,目前国内外主流的 AI 芯片公司第一步做的是与图像相关的 AI 加速,但没有跟语音和 NLP 相关的加速。语音这块其实是有一些坑的,比如所有 AI 芯片厂商目前都久攻不下 CNN。
那离线情况下怎样实现更好的结果?比如一代搜狗翻译机的手段是专注于旅行这个场景,其实就是我们把数据裁减成(与旅行相关的)数据集,就可以得到比较好的结果。
接下来其实就是拼算法能力,相当于在更小的空间复杂度和时间复杂度里去做更好的效果,这就看算法工程师的能力了,我们也可以做产学研的道路,跟学校做联合研发和攻关把这件事做好。
提问:现在做翻译机的企业都强调说自己的神经网络翻译技术多么好,支持的语音翻译种类是最多、准确率最好。但这套说辞太泛了,关于具体实现条件和使用环境好像没有一个比较统一的标准?
张博:这个问题问的很专业。目前大部分人工智能技术都没有一个标准的评测规范和手段,可能像人脸检测这种安防领域公安部做了一些标准,比如在一个什么样的条件下,输入多少张图片,这些图片中有多少男、女,多少戴眼镜。但以语音技术为核心的领域,目前国内没有什么权威的评测的机构。这个问题正在得到一步一步解决,中国人工智能产业发展联盟也在推动这种标准的建立,标准的建立有利于整个行业发展。
提问:现在翻译机功能有离线翻译还有拍照翻译,甚至嵌入了语音助手等功能,对这款硬件产品来说,以后的发展走向是更多功能集于一身,还是根据细分应用场景做出适当的硬件产品?
张博:这跟整个社会、整个用户的使用习惯有关系,我们知道移动互联网之所以能打败 PC 互联网,跟智能手机的普及有很大关系。在智能手机普及之前,大家也没有意识到手机竟然成了我们人生最关键的一部分。现在其实就已经有这样的争论,我们已经有手机了,为什么还要再去做一个翻译机。有翻译机了为什么还要加语音交互,你就会发现越做越大,越做越乱。
退一步想,如果拿一个翻译硬件来解决所有交互方式是不是最合理的?我觉得不一定,所以搜狗也在致力于解决这个问题,接下来会推出一系列新的爆款的智能硬件,很有可能就能解决交互的方便性,以及解决到底是再来一个翻译机还是再来一个手机的问题,结果就是可能不同的场景有不同的硬件。
提问:一代翻译机和翻译笔销量大概是多少?有道翻译蛋说卖了 10 万个。
张博:差不多也是这个数量,因为这个市场其实目前处于一个早期市场,大家的宣传还没有完全打开。
▌比智能音箱体验要好的智能硬件?
提问:刚刚您提到搜狗会做其他的智能硬件,为什么搜狗到现在都没有推出智能音箱?
张博:搜狗在某些方面有特立独行的点,我们既然要发展智能硬件,肯定会做一些比智能音箱体验还要好的产品,因为智能音箱从根源上来讲毕竟还是跟风因素更多一些,大家可能看智能音箱很火,目前国内不说上百家也有几十家智能音箱产品了。但现在智能音箱的发展情况看起来不是那么乐观,太乱了。
提问:搜狗认为的不乐观具体指的是什么?
张博:主要是这个产品感觉上用起来其实不一定那么自然、那么爽,它的使用场景有局限。毕竟这里面涉及到的远场交互、方言这些东西并不一定能得到很好的解决,包括个人隐私也都存在一些问题。
提问:可以介绍一下新的智能硬件?
张博:这个不方便透露,但肯定是跟搜狗核心语音相关,其次它会大幅提升交互的方便性和自然性,翻译机提升的不够大,还可以更大。
提问:大概什么时候会发布?
张博:不超过半年时间。
2018 AI开发者大会
◆
只讲技术,拒绝空谈
◆
2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会!是一场以技术落地为导向的干货会议!大会设置了10场技术专题论坛,力邀15+硅谷实力讲师团和80+AI领军企业技术核心人物,多位一线经验大咖带你将AI从云端落地。
大会日程以及嘉宾议题请查看下方海报
(点击查看大图)
推荐阅读
《深度学习500问》,川大优秀毕业生的诚意之作
来呀!AI喊你斗地主——首个搞定斗地主的深度神经网络
程序员入错行怎么办?
流行插件 jQuery 被曝存在漏洞达三年之久!
那些一毕业就选择华为的人,后来都怎么样了
“双十一”即将来临,先来看看快递物流企业的大数据
十年币圈尘归土,七神论剑无兴衰
相关文章:

Windows Embedded Standard开发初体验(四)
添加文件、依赖组件、注册表 接下来我们就要进入创建组件最重要的一环了,添加文件。为什么说重要,因为这里有一个大坑,我在Windows Embedded Standard产品组施卫娟老师的指导下,花了两周的时间才勉强爬出来,可见该坑之…

Windows 2003 + ISA 2006+单网卡×××配置(4)
(接上)图13 然后下一步,用户集默认所有用户,不用改变,直接下一步,完成,然后会出现如图14图14照样还是点击应用。。。好了,都配置完了,下面我们做个测试。。。我本机的IP地…

科大讯飞全新1024:3大计划,200项A.I.能力,全链路驱动应用场景创新!
10月24日,2018届科大讯飞全球1024开发者节在合肥奥林匹克体育中心综合馆如约举行,重磅发布了全新升级的科大讯飞《1024计划》!原中国科学技术部副部长张来武、科大讯飞董事长刘庆峰、科大讯飞轮值总裁胡郁、讯飞听见事业部总经理王玮分别发表…

SQL基本语句
掌握SQL四条最基本的数据操作语句:Insert,Select,Update和Delete。练掌握SQL是数据库用户的宝贵财 富。在本文中,我们将引导你掌握四条最基本的数据操作语句—SQL的核心功能—来依次介绍比较操作符、选择断言以及三值逻辑。当你完…

【TP3.2】路由匹配和规则
TP3.2框架的路由匹配和规则处理: 包括:静态路由,动态路由,多参数路由、正则路由 <?php return array(//配置项>配置值/* * 路由开启和匹配。首先开启路由匹配,然后根据相应的路由规则进行匹配* 1、静态路由* 2、…

soul一直显示正在登录聊天服务器,soul这个软件,为什么有些人在玩的时间很久以后(两百天以上),就不会再主动和其他人打招呼了?...
起首,说一下我本人接触soul的那些年。记得玩soul是17年开端,最初这个软件的营销目标是为了让人们更好地交换,停止跨时空的深度聊天,寻求魂魄的朋友,而不是皮郛的一时好感。可能说当时soul是打着"丢脸的皮郛千篇一…

构建插件式的应用程序框架(八)----视图服务的简单实现(ZT)
我在前一篇文章里提到,对于停靠工具栏或者是视图最好是不要将实例放到词典中,而是将工具栏或者视图的类型放到词典中,因为视图类型会经常的被重用,并且会经常被关闭或者再打开。当实例被关闭后,资源就被释放了…

服务器怎么设置网站写入权限,如何设置服务器写入权限设置方法
如何设置服务器写入权限设置方法 内容精选换一换将用户组添加至企业项目中,并为其设置一定的权限策略,该用户组中的用户即可拥有策略定义的对该企业项目中资源的使用权限。本小节指导您如何为企业项目添加用户组并授权。分辨率低的情况下单击页面右上方的…

CSDN蒋涛提出技术社区三倍速定律,称下一个20年全球开发者数量将过亿
10 月 24 日,科大讯飞 1024 开发者节在合肥举行,中国 IT 技术社区 CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛受邀发表了主题演讲。 在演讲中,蒋涛提出了“技术社区三倍速定律”,如何理解? 2013 年 CSDN 上关于…

可穿戴医疗设备火爆背后的困境
目前在电商平台搜索可穿戴手表、手环等可穿戴产品,品牌不下百种。市场调研机构IDC发布的最新报告显示,今年第一季度全球可穿戴设备发货量达到1140万部,同比增长200%,连续第八个季度实现增长。但是目前的可穿戴医疗设备基本停留在外…

【华为AI十强应用·上卷】官宣!这里的AI应用“神了”……
现在大火的AI,从概念落地到成为人们普遍接受的现实,度过了将近70年的时间。而当下,AI正在以最切实的方式影响着人们的生活,无论是工作还是娱乐,所以眼前的2018年正是AI为主流“代言”的关键一年。别说,还真…

JavaScript类——鼠标点击下笑脸变化
2019独角兽企业重金招聘Python工程师标准>>> <!DOCTYPE html> <html> <head> <meta charset"UTF-8"> <title>动态笑脸</title> <style> * { box-sizing: border-box; } .container { width: 400px; min-height…

VS2005字符串资源不能识别转义字符
在做LED媒体播放室多语言版本的时候,遇到这么一个问题, 检查office2003是否存在,如果不存在则弹出一个警告窗体。由于是多语言版本,所以弹出的信息来源于资源文件。 如果对提取的资源字符串不做任何处理,则弹出如下的对…

大掌柜商业管理系统服务器地址,大掌柜软件通用版操作说明.doc
大掌柜软件通用版操作说明PAGEPAGE 157系统应用基础内容提要:大掌柜软件专业版对系统的要求数据库SQL server2000的安装大掌柜软件专业版服务器端与客户端的安装加密狗的安装1.1系统运行环境系统运行环境的配置无疑是确保软件正常运行的重要条件之一,软件…

r语言remarkdown展示图_使用R语言包circlize可视化展示blast双序列比对结果
circlize这个包还挺强大的,R语言里用来画圈图还挺方便的。 今天这篇文章记录用circlize这个包画圈图展示blast双序列比对结果的代码植物线粒体基因组类的文章通常会分析细胞器基因组间基因转移情况,基本的分析方法就是blast比对。可视化展示可以选择用这…

吴恩达说“将引领下一波机器学习技术”的迁移学习到底好在哪?
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。 如果你是某个AI技…

获取系统相关属性
uname -a uname -r cat /etc/issue cat /etc/redhat-release #进入centos后忘记自己安装的是6还是7,可以从这里查看 转载于:https://www.cnblogs.com/biaopei/p/7730684.html

双水泵轮换工作原理图_「物业管理工作」水泵维护保养规程
1 目的为规范水泵维护保养程序,特制定本规程。2 适用范围适用于公司管辖范围内水泵(包括生活水泵、消防水泵及集水坑潜水泵)及其相关设施的维护保养。3 职责3.1 给排水维修工负责水泵的维护保养。3.2 值班锅炉工或电梯工负责晚间协助对水泵房设备运转情况的巡查。3.…

Dropbox如何使用机器学习从数十亿图片中自动提取文字
参加 2018 AI开发者大会,请点击 ↑↑↑作者 | Leonard Fink译者 | 刘旭坤整理 | Jane出品 | AI科技大本营【导读】提到 Dropbox,大家可能都知道这是一个文件同步、备份、共享的云存储软件。其实 Dropbox 可以实现的功能远不止这些。今天就为大家介绍 Dr…

001_性能压测工具
一、 Jmeter

SharePoint Server 2007 页面模型
虽然SharePoint Server 2007使用了ASP.NET 2.0的基础页面模型,SharePoint页面基本上也是基于标准的aspx技术来构建,但SharePoint Server 2007的页面模型仍然要比普通的ASP.NET应用复杂很多。对于一个SharePoint开发人员(和设计人员࿰…

oracle存储过程的常用语法
记录一下,主要方便自己以后查找: createorreplaceproceduresp_test(aa invarchar,bb innumberdefault0) isv_pos varchar(50);v_num number;begin---字符串查找和替换selectSUBSTR(PARAMETER, 1, INSTR(PARAMETER,branchId)-2) ||SUBSTR(PARAMETER, INST…
机器学习大神迈克尔 · 乔丹:我讨厌将机器学习称为AI
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。 如果你是某个AI技…

es6箭头函数(=)与展开特性运算符(...)的使用
2019独角兽企业重金招聘Python工程师标准>>> 箭头函数的几个写法 //当含有固定个参数的时候,es5写法 function test(a,b){ ..}//es6写法(es6参数可以设置默认值) let test (a,b) > {..}当函数体中仅有一行的时候,可以省略掉return与外部的…

华为atn980传输设备_在头发丝中实现每秒1000张高清DVD传输
这是近日央视《对话》栏目“超高清视频带来的产业诱惑”节目中,提到的随着4K、8K超高清视频发展,顺应时代发生的变化之一。超高清视频将为消费者带来全新的、超乎想象的体验。在这其中,黑科技的涌现更是对产业快速发展起着不可磨灭的推动作用…

李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程,你收集全了吗?
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。 如果你是某个AI技…

2 拖拽模型_3Dmax插件 | 螺丝钉、挖洞、网格模型等可以分分钟搞定
今天给大家带来3Dmax插件Mesh Insert v1.14Mesh Insert是一款3dsmax建模插件,灵感来自Polystein for Modo。它通过替换库中模型资源快速插入到模型表面。非常适合硬表面和有机建模!1大纲1、安装说明2、插件功能3、视频讲解2过程步骤1安装说明1、关闭max,…

谈谈职业规划——CSDN对我的采访
职业规划就像软件工程电信、银行等行业一直是许多人非常向往的工作单位,清差厚禄,旱涝保收,陈皓却不以此为然。所以当记者采访他的时候,他连用了两个“最”字来形容他离开银行的成就感。陈皓毕业后的前两年就职于云南省工商银行&a…
最实用的机器学习算法优缺点分析,没有比这篇说得更好了
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。 如果你是某个AI技…