当前位置: 首页 > 编程日记 > 正文

机器模拟共情,情感AI正踏足诸多行业


作者 | 平凡

来源 | CSDN

作者简介:平凡,诺桑比亚大学计算机科学博士

情感AI是一个跨学科领域,涉及计算机科学、 心理学和认知科学,旨在研发能够识别、解释、处理、模拟人类情感的系统。[虽然该学科最早可追溯至早期的哲学研究,即人们对情绪的剖析,但真正使其成为现代计算机科学分支的,则是1995年罗莎琳·皮卡德发表的关于情感计算的论文。人们研究情感计算很大程度上是为了能够模拟共情——机器应该能够解释人类的情绪状态,做出相适应的行为,对情绪给予恰当的回应。

情感AI技术的基础在于心理学层面的情感识别分析技术,在该技术出现前,人类的情感只能用语言去描述,属于纯粹主观经验判断。而情感识别和量化技术由美国心理学家保罗·艾克曼教授创立,其最大的学术贡献是面部动作编码系统(FACS)[2]。通过该技术,人类第一次可以通过科学标记计量的方法将高兴、伤心、害怕、愤怒、厌恶、惊讶、轻蔑等七种基本情绪进行科学定性定量分析。

技术实现

尽管人类目前可能在情感识别方面占上风,但是机器正在利用自己的优势在不断进步。麻省理工学院斯隆(MIT Sloan)教授Erik Brynjolfsson解释说,机器非常擅长分析大量数据,他们可以聆听声音变化,并开始识别这些变化与情绪变化的关系。同时机器可以分析图像并在人类面部微表情中识别出细微之处,速度比人类甚至还要快[3]。

情感AI现在主要通过视频、 声音文本展开。

  • 视频或图片的情感AI主要通过深度神经网络训练模型然后进行情感预测。

人类的表情丰富多样,种类大致有7类,但微表情种类则异常丰富,主要表情+微表情可以很好的反映受试者的情感状态即变化。

比如下图,预测结果:最有可能:安静,次之: 高兴。

  • 对于声音情感AI,一般采用音频情绪识别等方法。

人类处理声音的方式异常复杂,从音频剪辑中感知情感的方式涉及很多因素。一个人的性别,其语气变化,甚至所用词语的类型都会影响我们理解所说内容的方式。

梅尔频率倒谱[4](MFC)是数据的短期功率谱,对语音分析特别有用。人发出的声音会受到声道形状(包括声带,喉,舌头,牙齿等)的影响。从最基本的意义上说,梅尔频率倒谱在数字上代表了这种声音通道。梅尔音阶的目的是模仿低频的人耳对声音的感知,方法是在较低频率下更具判别力,而在较高频率下则具有较少判别力。它可以缩放频率,使其与人耳听到的声音紧密匹配(人类更擅长识别低频下语音的细微变化)。

  • 对于文本级别的情感AI分析,一般采用的是文本情感分析

文本情感分析[5](也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。通常来说,情感分析的目的是为了找出说话者/作者在某些话题上或者针对一个文本两极的观点的态度。这个态度或许是他或她的个人判断或是评估,也许是他当时的情感状态(就是说,作者在做出这个言论时的情绪状态),或是作者有意向的情感交流(就是作者想要读者所体验的情绪)。

进展

十多年来,一些大公司以及规模较小的初创公司已经在情感AI方面进行了投资,它使用计算机视觉或语音分析来识别人类情感。这些公司中的许多公司开始专注于市场研究,抓取和分析人类对产品反应。其中一些进展包括:

  • 医学诊断。该软件可以通过语音分析帮助医生诊断诸如抑郁症和痴呆症等疾病。

其中2018年一项研究[6],对来自30名来自不同文化背景下的儿童视频研究,通过深度学习对于视频的处理,对于自闭症儿童的个体和文化差异的影响进行了实证研究,为自闭症的进一步研究提供了数据基础。

  • 员工安全。情绪AI可以帮助分析工作量很大的员工(例如急救人员)的压力和焦虑程度。

位于阿姆斯特丹的Koninklijke Philips Electronics NV和ABN AMRO Bank NV开发的技术[7],目的降低金融市场的交易风险。研究表明,处于情绪高涨状态的交易者将为资产和轻描淡写的风险支付过多的费用,这种情况被称为“竞价热”或“竞标狂潮”。为了解决这个问题,两家公司共同开发了一种称为Rationalizer的工具,该工具具有两个部分:连接在交易者手腕上的手环,该手环通过皮肤电活动(类似于测谎仪的工作方式)来测量情绪,而显示屏则显示手腕的力量。研究人员发现,当用户意识到自己情绪高涨时,他们更有可能重新考虑自己的决定。

  • 视频游戏。游戏机/视频游戏使用计算机视觉,在游戏过程中通过面部表情检测情绪并适应性调整。

Facebook的“情绪检测自拍滤镜”专利,这个想法是根据照片中检测到的情绪自动选择合适的自拍“面具”。例如,如果自拍者看起来很悲伤,则过滤器默认为卡通泪滴;如果看起来很开心则会得到“Happy Panda”。

  • 教育。已经开发了学习软件原型以适应孩子的情绪。当孩子由于一项任务太困难或太简单而感到沮丧时,该程序会适应该任务,从而使任务变得或多或少。

  • 病人护理。“护士机器人”不仅提醒长期医疗计划中的老年患者服用药物,而且每天与他们交谈以监控他们的总体健康状况。

  • 汽车安全。汽车销售商可以使用计算机视觉技术来监视驾驶员的情绪状态。极端的情绪状态或嗜睡可能会触发驾驶员警报。

  • 自动驾驶汽车。未来,自动驾驶汽车的内部将配备许多传感器,包括摄像头和麦克风,以监视发生的情况并了解用户驾驶体验的反馈。

  • 欺诈识别。保险公司使用语音分析来检测客户在提交索赔时是否在说真话。根据独立调查,高达30%的用户承认向其汽车保险公司撒谎以获取保险。

  • 呼叫中心智能路由。可以从一开始就发现生气的客户,并将其路由到训练有素的业务代表,后者还可以实时监控对话的进行和调整。

  • 公共服务。情感AI技术供应商和监控摄像头提供商之间已经建立了合作关系。阿拉伯联合酋长国公共场所的摄像机可以检测人们的面部表情,因此可以了解人们的总体情绪。

  • 零售。零售商已开始研究在商店中安装计算机视觉情感AI技术,以获取人口统计信息以及访客的情绪和反应。

总结

现在情感AI已经慢慢渗透到我们生活的方方面面了,虽然可能我们感知不到,但它实实在在的在帮助我们构建一个更安全,更友好,更intelligent的世界,现在的应用大多数只是基于单个数据维度,未来融合技术对于情感AI或是一个契机。

参考链接:

1.https://zh.wikipedia.org/wiki/%E6%83%85%E6%84%9F%E8%AE%A1%E7%AE%97

2.https://mitpress.mit.edu/books/affective-computing

3.https://mitsloan.mit.edu/ideas-made-to-matter/emotion-ai-explained

4.https://zh.wikipedia.org/zh/%E6%A2%85%E5%B0%94%E9%A2%91%E7%8E%87%E5%80%92%E8%B0%B1%E7%B3%BB%E6%95%B0

5.https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90

6.https://www.media.mit.edu/publications/culturenet-a-deep-learning-approach-for-engagement-intensity-estimation-from-face-images-of-children-with-autism/

7.https://sloanreview.mit.edu/article/how-emotion-sensing-technology-can-reshape-the-workplace/

更多精彩推荐
  • Python画出心目中的自己

  • 清华、北大教授同台激辩:脑科学是否真的能启发AI?

  • 用Python分析5000+抖音大V,粉丝最喜欢的视频类型是它

  • Julia 创始人访谈:简单机器学习任务可与 Python 媲美,复杂任务胜过 Python

  • 一年加班几百小时,我是二胎宝妈,更是敢拼的女程序员

相关文章:

SQL Server 中各个系统表的作用

sysaltfiles 主数据库 保存数据库的文件syscharsets 主数据库 字符集与排序顺序sysconfigures 主数据库 配置选项syscurconfigs 主数据库 当前配置选项sysdatabases 主数据库 服务器中的数据…

“批判”按劳取酬

“批判”按劳取酬<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />Jack zhai按劳取酬的意思就是付出多少劳动&#xff0c;就获得多少报酬&#xff1b;这曾经是我认为最为合理的老板与员工之间的合约关系。然而近几年&#xff0c;…

《编译与反编译技术实战 》一2.3 编译器的设计与实现概述

本节书摘来自华章出版社《编译与反编译技术实战 》一书中的第2章&#xff0c;第2.3节&#xff0c;庞建民 主编 &#xff0c;刘晓楠 陶红伟 岳 峰 戴超 编著&#xff0c;更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3 编译器的设计与实现概述 根据不同的用…

U^2-Net跨界肖像画,完美复刻人物细节,GitHub标星2.5K+

来源 | Jack Cui头图 | CSDN下载自视觉中国今年提出的 U^2-Net 显著性检测算法&#xff0c;刷爆了 reddit 和 twitter&#xff0c;号称是 2020 年「地表最强」的静态背景分割算法&#xff0c;可以看下效果&#xff1a;你以为今天要讲分割&#xff1f;错&#xff01;U^2-Net 这两…

使用sourceInsight 提高代码编写效率

source Insight是一个强大的程序编写器和代码浏览器&#xff0c;它拥有内置的对C/C,C#和Java等程序的分析。本文总结了常用的快捷键&#xff0c;重要的宏的应用&#xff08;可以多行注释&#xff0c;自动补全&#xff0c;自动生成头文件和函数说明&#xff0c;修改说明……&…

php几个预定义变量$_SERVER['DOCUMENT_ROOT']

<?php echo documentroot:.$_SERVER[DOCUMENT_ROOT].<br>; //根目录,在apache的配置文件里定义&#xff1a;httpd.conf 比如&#xff1a;DocumentRoot "D:/work/php_root" echo httphost:.$_SERVER[HTTP_HOST].<br>; //域名&#xff0c;比如&#…

《用于物联网的Arduino项目开发:实用案例解析》—— 3.4 小结

本节书摘来自华章出版社《用于物联网的Arduino项目开发&#xff1a;实用案例解析》一 书中的第3章&#xff0c;第3.4节&#xff0c;作者&#xff3b;美&#xff3d;安德尔杰韦德&#xff08;Adeel Javed&#xff09;&#xff0c;更多章节内容可以访问云栖社区“华章计算机”公众…

HttpClient学习

HttpClient学习 &#xff08;1&#xff09;下面列举几个主要的Http相关概念的类 类名描述HttpClient建立请求客户端HttpGet代表请求方法&#xff0c;类似的还有HttpHead, HttpPost, HttpPut, HttpDelete, HttpTrace, HttpOptions等HttpResponse表示请求的响应&#xff08;包括…

赠书 | 新手指南——如何通过HuggingFace Transformer整合表格数据

作者 | Ken Gu翻译| 火火酱~&#xff0c;责编 | 晋兆雨出品 | AI科技大本营头图 | 付费下载于视觉中国*文末有赠书福利不可否认&#xff0c;Transformer-based模型彻底改变了处理非结构化文本数据的游戏规则。截至2020年9月&#xff0c;在通用语言理解评估&#xff08;General …

在HTML网页中巧用URL

http://www.cnbruce.com/blog/showlog.asp?cat_id5&log_id657 首先&#xff0c;先放出一个地址给大家测试http://cnbruce.com/test/htmlpro/?namecnbruce&emailcnbruce126.com 1&#xff0c;时下流行的&#xff08;可能是吧&#xff0c;因为最近问的人比较多&#xf…

《iOS 8应用开发入门经典(第6版)》——第1章,第1.6节小结

本节书摘来自异步社区《iOS 8应用开发入门经典&#xff08;第6版&#xff09;》一书中的第1章&#xff0c;第1.6节小结&#xff0c;作者 【美】John Ray&#xff08;约翰 雷&#xff09;&#xff0c;更多章节内容可以访问云栖社区“异步社区”公众号查看 1.6 小结iOS 8应用开发…

用Visual C#创建Windows服务程序

一&#xff0e;Windows服务介绍&#xff1a; Windows服务以前被称作NT服务&#xff0c;是一些运行在Windows NT、Windows 2000和Windows XP等操作系统下用户环境以外的程序。在以前&#xff0c;编写Windows 服务程序需要程序员很强的C或C功底。然而现在在Visual Studio.Net下&a…

poj 3321 Apple Tree

树状数组 题意&#xff1a;一个树&#xff0c;以树枝连接两个点的形式给出&#xff0c;固定以1为整棵树的根。苹果长在树的节点上&#xff0c;节点上只可能0或1个苹果&#xff0c;一开始每个节点都有1个苹果 有两种操作&#xff0c;C表示更改某个节点的苹果数&#xff0c;0变1,…

人工智能在网络贷款中鲜为人知的事

作者 | Laksh Mohan翻译| 火火酱~&#xff0c;责编 | 晋兆雨出品 | AI科技大本营头图 | 付费下载于视觉中国现在&#xff0c;科技已经成为推动企业发展壮大的基本要素之一。人工智能&#xff08;AI&#xff09;就是一个证明此类技术在商业领域走红的好例子&#xff0c;比如网络…

《HTML5与CSS3实战指南》——2.5 构建The HTML5 Herald

本节书摘来自异步社区《HTML5与CSS3实战指南》一书中的第2章&#xff0c;第2.5节,作者&#xff1a; 【美】Estelle Weyl , Louis Lazaris , Alexis Goldstein 更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.5 构建The HTML5 Herald 我们已经介绍了页面结构的基础以及…

用.NET创建Windows服务

用.NET创建Windows服务 译者说明&#xff1a;我是通过翻译来学习C&#xff03;的&#xff0c;文中涉及到的有Visual Studio.NET有关操作&#xff0c;我都根据中文版的VS.NET显示信息来处理的&#xff0c;可以让大家不致有误解。作者&#xff1a;Mark Strawmyer 我们将研究如何…

BGP local-preference MED属性实验

实验拓扑 实验配置 建立两个AS 65001、65000 AS65000内跑OSPF&#xff0c;并在R1上发布三个网段100.1.1.1 100.1.2.1 100.1.3.1 在R3 R5上聚合后发布给R4。 每台路由器都有一个对应的loopback地址。 实验过程 <R1>dis bgp ro Total Number of Routes: 10 BGP Local route…

加速产业生态算力升级,华为鲲鹏展翅福州

11月20日&#xff0c;为了让更多开发者了解鲲鹏计算生态体系&#xff0c;并且助力行业人才培养&#xff0c;由福建鲲鹏生态创新中心、福州市大数据基地开发有限责任公司联合举办的鲲鹏开发者训练营圆满完成。此次活动现场吸引到了大量的开发者参与&#xff0c;产、学、研各界人…

《CCNP TSHOOT 300-135认证考试指南》——2.2节故障检测与排除及网络维护工具箱

本节书摘来自异步社区《CCNP TSHOOT 300-135认证考试指南》一书中的第2章&#xff0c;第2.2节故障检测与排除及网络维护工具箱&#xff0c;作者 【加】Raymond Lacoste , 【美】Kevin Wallace&#xff0c;更多章节内容可以访问云栖社区“异步社区”公众号查看 2.2 故障检测与排…

在linux系统下实现音视频即时通讯的部分代码

由于使用习惯,Linux在中国受欢迎程度远不如windows&#xff0c;相应的软件也比较少&#xff0c;尤其是音视频类的软件&#xff0c;但是&#xff0c;这并不代表就完全没有。下面介绍一款强大的音视频即时通讯平台给大家&#xff0c;它就是——Anychat for Linux SDK。AnyChat是一…

文本分类六十年

作者 | Lucy出品 | AI科技大本营文本分类是自然语言处理中最基本而且非常有必要的任务&#xff0c;大部分自然语言处理任务都可以看作是个分类任务。近年来&#xff0c;深度学习所取得的前所未有的成功&#xff0c;使得该领域的研究在过去十年中保持激增。这些文献中已经提出了…

web service 和 remoting 有什么区别

其实现的原理并没有本质的区别&#xff0c;在应用开发层面上有以下区别&#xff1a;1、Remoting可以灵活的定义其所基于的协议&#xff0c;如果定义为HTTP&#xff0c;则与Web Service就没有什么区别了&#xff0c;一般都喜欢定义为TCP&#xff0c;这样比Web Service稍为高效一…

《实施Cisco统一通信管理器(CIPT1)》一2.4 使用分布式呼叫处理的多站点WAN部署模型...

本节书摘来异步社区《实施Cisco统一通信管理器&#xff08;CIPT1&#xff09;》一书中的第2章&#xff0c;第2.4节&#xff0c;作者&#xff1a; 【美】Dennis Hartmann译者&#xff1a; 刘丹宁 , 陈国辉 , 卢铭 责编&#xff1a; 傅道坤, 更多章节内容可以访问云栖社区“异步社…

【转】 LDA必读的资料

时间总是不够用&#xff0c;这里就不自己写了&#xff0c;摘自一篇转发的博客&#xff0c;感觉挺有用&#xff01; 一个大牛写的介绍&#xff0c;貌似需FQ http://tedunderwood.wordpress.com/2012/04/07/topic-modeling-made-just-simple-enough/David M.Blei主页&#xff1a;…

sizeof 操作符详解

1. 定义&#xff1a; sizeof是何方神圣&#xff1f; sizeof 乃 C/C 中的一个操作符&#xff08;operator&#xff09;是也。简单说其作用就是返回一个对象或者类型所占的内存字节数。 MSDN上的解释为&#xff1a; The sizeof keyword gives the amount of storage, in bytes, a…

石锤!谷歌排名第一的编程语言,死磕这点,程序员都收益

日本最大的证券公司之一野村证券首席数字官马修汉普森&#xff0c;在Quant Conference上发表讲话&#xff1a;“用Excel的人越来越少&#xff0c;大家都在码Python代码。”甚至直接说&#xff1a;“Python已经取代了Excel。”事实上&#xff0c;为了追求更高的效率和质量&#…

《关系营销2.0——社交网络时代的营销之道》一T表示Technology(技术)

本节书摘来异步社区《关系营销2.0——社交网络时代的营销之道》一书中的第1章&#xff0c;作者&#xff1a; 【美】Mari Smith 译者&#xff1a; 张猛 , 于宏 , 赵俐 责编&#xff1a; 陈冀康, 更多章节内容可以访问云栖社区“异步社区”公众号查看。 T表示Technology&#xff…

jquery拖拽实现UI设计组件

想做一个UI设计的组件&#xff0c;左侧是控件列表&#xff0c;右边是编辑区域&#xff0c;左侧的控件可以重复拖拽到右侧然后进行编辑。 效果草图&#xff1a; 部分js代码&#xff1a; function domop(){//set drag and drop $( "#compls .component" ).each(functi…

六年磨一剑,全时发布音视频会议平台TANG,多款新品亮相

作者 | 高卫华出品 | AI科技大本营时隔六年&#xff0c;全时于11月26日在北京举办了“时间的力量2020新产品发布会“。发布会现场&#xff0c;全时创始人&CEO陈学军回顾了全时近年来的发展历程&#xff0c;并正式推出了全时云会议2020版&#xff0c;全时小智和全时云直播三…

考察新人的两道c语言题目

1> 如何判断一个板子的cpu 是big-endian 还是 Little&#xff0d;endian的&#xff1f;用c实现非常简单&#xff0c;10行左右&#xff0c;就可以判断了&#xff0c; 关键考察新人是否了解了什么是endian &#xff0c;big-endian与little-endian的区别在哪里&#xff0c; 如果…