微软推出智能语音评测服务,注重解决四大技术障碍
今年5月,在微软开发者大会上,他们宣布推出智能语音评测服务。基于Azure云的认知服务平台,该服务涵盖语音识别、语音合成等技术,主要应用于各种教师评估、作业练习和语言学习等教学场景。
通过市场调研和反馈,他们将语音评测的重点放在解决以下四大问题上:专业性、实时性、稳定性和(能够给予用户一定的)可定制性。
以专业性为例,语音评测对比的是与母语专家评测的一致性。微软云计算与人工智能事业部资深产品经理马莉莎解释,业内普遍采用皮尔森相关系数来反映两个序列线性相关程度,范围在-1到1之间。1表示完全相关,0.5以上为强相关,-1则表示完全相反,0表示乱序无关,数值越大表示相关度越高。与市场上的主流技术对比评测,微软语音评测在一致性上达到了0.75。
马莉莎称,要解决上述问题,语音评测系统除了做要好多语言识别的问题,还要针对不同打分场景,做到包容性和鲁棒性的平衡。
“在客户真实的场景中要尽量贴近真实的用户使用习惯,用户习惯中的误读、少读都能包容得很好,且精准地进行打分。”马莉莎表示,与其他提供语音评测技术的企业相比,她认为微软的语言模型的抗噪能力,以及在垂直领域上针对不同场景的收音需求,都做得比较深入。
数据是语言模型优化的基石。据介绍,微软智能语音评测扩展到了40多种语言,每种语言分别积累了数十万小时以上的母语数据进行学习,在此基础上,模型能够适配实时的线上线下应用。微软Azure云则提供了算力保障,能够支撑大规模用户的计算需求,并保证用户数据安全性。
也就是说,除了优化模型做好语音识别外,还要做到动态、高实时性地调用大模型,这就要求在总体要平衡多点性能。
目前,微软已将智能语音评测服务落地到相关教育公司的产品中。马莉莎称,微软与客户的合作是灵活多样的模式,简单的调用API进进行评测是免费的,但在生产环节的集成会按评测音频的时长计费。
当然,语音评测只是微软在教育解决方案中落地的一个维度,关于老师声音的定制化以及有声课件制作方面,微软正在积极探索。
未来微软的语音评测应用场景也不仅限于教育领域。近期,微软与国内的NGO合作联合,利用语音技术为视障学生合成制作了有声书。马莉莎称,语音评测也可以用来评估合成声音语料本身的质量好坏以及发音是否标准,“凡是和语音质量,发音有关的需求,都可以用到。”
微软云计算与人工智能事业部产品总监丁秉公表示,作为一家平台公司,微软语音评测希望与垂直领域的客户合作,为独立软件开发商、系统集成商等二次开发解决方案商提供充分的灵活性,以此把个性化服务推到不同的客户群,打造相应的语音生态。
相关文章:

这些编程语言程序员工资最高!Java才第四
在众多行业中,程序员属于高薪职业。无论是在国外还是国内,程序员的薪金水平普遍高于其他行业的工作岗位。 高薪的诱惑和充满挑战性的工作,令程序员一直成为备受欢迎的职业。在今年年初,Glassdoor发布的一份调查报告指出ÿ…

仔细选择会话状态提供程序
ASP.NET 为存储应用程序的会话数据提供了三种不同的方法:进程内会话状态、作为 Windows 服务的进程外会话状态和 SQL Server 数据库中的进程外会话状态。每种方法都有自己的优点,但进程内会话状态是迄今为止速度最快的解决方案。如果只在会话状态中存储少…

10.VMware View 4.6安装与部署-view clint和view for ipad连接测试
安装基于 Windows 的 View Client,最终用户需要从物理机打开 View Client 来连接其虚拟桌面。您可以运行基于 Windows 的安装程序文件来安装 View Client 的所有组件。如果 View 管理员启用了某些显示选项,那么除了通过 View Client 访问虚拟桌面外,最终…
免费直播:主流深度框架对比:总有一款适合你~
常常有小伙伴在后台反馈:想了解深度学习该怎么学?自学难度大又没有效果,该怎么办?CSDN为了解决这个难题,联合唐宇迪老师为大家带来了一场精彩的直播【一节课掌握深度学习必备框架】。本次直播将带大家了解在开始深度学…

QCon2016旧金山大会焦点分享者确认
QCon旧金山大会是由InfoQ举办的连续十年的最大的英语会议,它将在今年11月7-9日在旧金山湾区举行。\\在QCon大会涵盖了一系列深入的技术,架构师、资深开发者所关注的国际事件,聚焦创新领域和软件发展趋势,QCon大会每年在美国、中国…
Git 看这一篇就够了
作者 |码农田小齐责编 | Carol封图 | CSDN 下载自视觉中国今天简单讲下 Git 的实现原理,知其所以然才能知其然;并且梳理了日常最常用的 12 个命令,分为三大类分享给你。本文的结构如下:作者和开发原由Git 的数据模型常用命令资源推…

当不使用会话状态时禁用它
并不是所有的应用程序或页都需要针对于具体用户的会话状态,您应该对任何不需要会话状态的应用程序或页禁用会话状态。 若要禁用页的会话状态,请将 Page 指令中的 EnableSessionState 属性设置为 false。例如,<% Page EnableSessionState&…

jepg图像的存储 转
先把代码贴上: extern "C" { #include "jpeglib.h" #pragma comment(lib,"libjpeg.lib") //把无压缩的图像数据(纹理)存储成jepg bool appSaveJpegRGB(char *filepath,unsigned char * data,int width,int hei…

使用Spring进行统一日志管理 + 统一异常管理
统一日志和异常管理配置好后,SSH项目中,代码以往散落的log.info() 和 try..catch..finally 再也不见踪影! 统一日志异常实现类: [java] view plaincopy package com.pilelot.web.util; import org.apache.log4j.Logger; impor…

避免到服务器的不必要的往返过程
虽然您很可能希望尽量多地使用 Web 窗体页框架的那些节省时间和代码的功能,但在某些情况下却不宜使用 ASP.NET 服务器控件和回发事件处理。 通常,只有在检索或存储数据时,您才需要启动到服务器的往返过程。多数数据操作可在这些往返过程间的…

OPPO和微软合作,开放“召唤小冰”
6月24日,OPPO与微软共同宣布,OPPO手机智能助理Breeno语音开放“召唤小冰”能力一年之际,双方合作再次深化。微软小冰与OPPO Breeno团队加速合作,不断打造和更新更符合OPPO生态的AI技能,提升微软小冰在Breeno语音中的产…

如果你即将死去
如果你即将死去,你是否能够安息; 如果你即将死去,你是否还有事情不能放弃; 如果你即将死去,你的事业是否有人继续; 如果你即将死去,你的生平是否还有人惦记; 死亡是所有生命的终点&a…

设计模式(行为型模式)——备忘录模式(Memento)
2019独角兽企业重金招聘Python工程师标准>>> 本章讲讲第三类和第四类。 备忘录模式(Memento) 主要目的是保存一个对象的某个状态,以便在适当的时候恢复对象,个人觉得叫备份模式更形象些,通俗的讲下…

当你累了,准备放弃时,看看这个吧!!!
当你累了,准备放弃时,看看这个吧!!! 在朋友空间看到这篇文章,送给所有还在坚持的朋友~~每个人都背负着一个沉重的十字架,在缓慢而艰难地朝着目的地前进。途中,有一个人忽然停了下来。…

只在必要时保存服务器控件视图状态
自动视图状态管理是服务器控件的功能,该功能使服务器控件可以在往返过程上重新填充它们的属性值(您不需要编写任何代码)。但是,因为服务器控件的视图状态在隐藏的窗体字段中往返于服务器,所以该功能确实会对性能产生影…
超越英伟达的,不会是另一款GPU!中国公司发布首款数据流AI芯片
2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6…

vim打开多窗口、多文件之间的切换
打开多个文件:一、vim还没有启动的时候:1.在终端里输入 vim file1 file2 ... filen便可以打开所有想要打开的文件2.vim已经启动输入:e file可以再打开一个文件,并且此时vim里会显示出file文件的内容。3.同时显示多个文件::sp …
图灵奖得主Judea Pearl:从“大数据革命”到“因果革命”
整理 | 智源社区,龚鹤扬&高亦斌2020年6月21日,在第二届北京智源大会开幕式及全体会议上,图灵奖得主、贝叶斯网络奠基人Judea Pearl 做了名为《The New Science of Cause and Effect with reflections on data science and artificial int…

美国两政府网站被挂马 以性丑闻女星为诱饵
据安全厂商趋势科技称,美国两个政府网站近日发现被挂木马,这两家被挂马的网站都是以性丑闻女性为诱饵欺骗用户访问其它恶意网页。 圣伯纳迪诺县的宣传页面被发现感染了恶意木马,用户访问该网站时被重定向到域名Videosdivx.net下的一个网站…

除非有特殊的原因要关闭缓冲,否则使其保持打开
禁用 Web 窗体页的缓冲会导致大量的性能开销。
[React Native Android安利系列]搭建React Native Android环境
欢迎大家收看react-native-android系列教程,跟着本系列教程学习,可以熟练掌握react-native-android的开发,你值得拥有https://segmentfault.com/blog... (PS,和聊一聊系列写在一起也实在是没辙, 谁知道如何新建专栏&am…

继承QTreeWidgetItem发生error: 'staticMetaObject' is not a member of 'QTreeWidgetItem' 错误
点击打开链接 #ifndef QQUSERITEM_H就发生下列错误 #define QQUSERITEM_H #include <QTreeWidgetItem> class QQUserItem :public QTreeWidgetItem { Q_OBJECT public: explicit QQUserItem(QQUserItem *parent 0); signals: public slots: }; #endif // QQUSERITEM_H d…

使用 HttpResponse.Write 方法进行字符串串联
该方法提供非常有效的缓冲和连接服务。但是,如果您正在执行广泛的连接,请使用多个 Response.Write 调用。下面示例中显示的技术比用对 Response.Write 方法的单个调用连接字符串更快。 [C#] Response.Write("a"); Response.Write(myString); …
倒计时 8 天 | 完整议程大揭秘!来 20 个 AI 论坛,与百名大咖携手玩转人工智能...
2020年7月3—4日,由 CSDN 主办的第三届 AI 开发者大会(AI ProCon 2020)(大会官网:https://aiprocon.csdn.net/)将以线上直播的形式与大家相见。本次大会历时2天,一次性设立6大主题、20大精彩分论…

关于分页的解决方案收集
分页的html样式,可分为两种,pc和移动端 pc端的解决方案(既有json版本又有get参数版本): http://laypage.layui.com/ 移动端的上拉刷新,下拉加载解决方案:(个人建议还是老实用会iscroll.js吧) ht…

MVC3+EF4.1学习系列(一)-------创建EF4.1 code first的第一个实例(强转)
文章索引和简介 基于EF4.1 code first 简单的CRUD 园子中已经有很多了 ~~ 真不想再写这个了 可是为了做一个完整的小demo 从开始 到后面的一些简单重构 还是决定认真把这个写出来 争取写些别人没写到的东西~~ 好了 开始~~ 这次要做的是个学校管理的demo(通俗些&…
超越英伟达的,不会是另一款GPU?这家深圳公司发布全球首款数据流AI芯片
2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6…

不要依赖代码中的异常
因为异常大大地降低性能,所以您不应该将它们用作控制正常程序流程的方式。如果有可能检测到代码中可能导致异常的状态,请执行这种操作。不要在处理该状态之前捕获异常本身。常见的方案包括:检查 null,分配给将分析为数字值的 Stri…

MySQL5.7配置日志
之前使用MySQL 5.1版本的时候,修改my.cnf,在[mysqld]下添加"log/data/mysql/query.log",重启服务就ok了 但是在5.7会出现 Starting MySQL... ERROR! The server quit without updating PID file (/data/mysql/mysql.pid).原因是5.7…

Linux下新增硬盘处理过程
1、Linux的硬盘识别 在/dev/下建立相应的设备文件。如 sda 表示第一块SCSI硬盘 hda 表示第一块IDE硬盘(即连接在第一个IDE接口的Master口上) scd0 表示第一个USB光驱 通过fdisk -l 查看当前的设备和分区信息。注意,新硬盘没有…