懂语言者得天下:NLP凭什么被称为人工智能的掌上明珠?
受访者 | 简仁贤,竹间智能创始人&CEO
记者 | 邓晓娟
出品 | AI科技大本营(ID:rgznai100)
随着技术的发展,大数据、云计算、人工智能、区块链都慢慢地为人熟知。2016 年 Google 推出 AlphaGo,让人工智能走进了大众的视线,市场热度也被推向了一个小高潮。
而就在 AlphaGo 推出的前一年,前微软(亚洲)互联网工程院副院长简仁贤,回国创办了竹间智能并推出一站式的企业服务的情感人工智能开放平台——Bot Factory™。
而在今年,竹间智能自研的Bot Factory™再度升级,于 5 月 29 日正式发布。据了解,Bot Factory™ 赋能于全行业,适用于多场景多渠道,旨在打造更易用、更多功能多场景的对话式机器人的机器人工厂,主要为企业解决人力成本、客户服务、企业数据及效率等问题。
竹间智能创始人& CEO 简仁贤于 2006 年加入了微软,主要负责的工作内容更偏向于自然语言理解、搜索、算法和品牌研发。而在微软最后的几年主要负责整个亚太地区的搜索技术、合作生态以及全球移动研发,主要赋能于企业。在微软工作的经历,使得简仁贤对于全世界企业的需求及解决企业需求中遇到的问题接触比较多,对于 to B 企业、软件与 to B 服务的经验十分丰富。
竹间智能创始人&CEO 简仁贤
在人工智能领域的时间算起来已经有 20 多年经验的简仁贤,对于行业的看法与国内市场现状都有着独到的见解。令笔者欣喜的是,简仁贤非常友善且健谈,从人工智能行业的理解,到自然语言处理技术的应用,再到国内 AI 企业的发展方向,相关问题都一一做出详尽的回答。
“服务经济时代,打铁还需自身硬”
2015 年,从微软离开后,简仁贤回国创办了竹间智能,在人工智能领域已经有 20 多年的经验的简仁贤,创办竹间智能对于他来说是一件水到渠成的事情。“把人工智能普及在生活和企业上”——这个想法已经在脑海里沉淀了很多年。
简仁贤谈到,人工智能已经在美国发展得比较久了,但国内还在起步中。直到 2015 年,无论从资源、人才、资本、市场接受度来说,时机才算比较成熟。随后的 2016 年,AlphaGo 的横空出世将市场的热度推向一个小小的高潮,让更多人认识了人工智能,也算是人工智能打开国内市场的第一步。
但国内大的企业对于人工智能的拓展速度比较慢,加上人工智能项目落地的时间也比较久,所以直到 2020 年,经过疫情和新基建推动,才能说市场已经完全接受了人工智能。
从竹间智能的主要业务上来看,简仁贤一直坚持做自主底层平台,致力于 AI 底层技术开发。而他们以 6 大技术为核心:自然语言处理、知识工程、深度学习&AutoML、文本数据中台、视觉计算、语音辨识,研发出 4 个成熟的平台型产品和6大行业解决方案,也拥有了多个标杆客户的业务落地。
这给了简仁贤深耕自然语言处理、并且聚焦在底层平台的自信。
自然语言处理,也就是 NLP,是未来所有人工智能技术的基础和根本,所以有人称 NLP 是人工智能科技的一个掌上明珠。在此,简仁贤借助了其老上司的一句话:“懂语言者得天下”。在他看来,语言能帮助进化所有 IT 业务,可以说是未来 IT 的基础。
中国从制造业走到互联网,再发展到移动端,未来要走的就是以人为本的服务经济路线。而企业的服务在发展的过程中,唯一不变的追求的是「降本增效」与「提质」。
举例来说:在这次的疫情中,企业要考虑如何降低人力压力、减少接触、还要保证服务质量。而为「人」服务一定会产生交互,如今的交互多数来源于互联网 App 的点击、发送指令等方式,但人最原始的交互方式是言语交流,最后无论是服务还是技术,也是会追求和回归到这个本质上。
而想要理解人的交互,必须要懂得人讲话的意图与情绪/情感。不理解意图和情绪/情感,就无法理解言语的真正含义,在自然语言处理上就无法达到流畅。所以这时候企业需要的,是可以在降低成本的同时还能把服务做到位的解决方案和工具,来达到「降本增效」的作用,这些都要靠 NLP 来做。这也是未来服务经济需要优化现状的部分。
“科技公司的底气是技术自研”
谈到坚持做底层技术的研究与开发,简仁贤表示,在过去 20 年,国内大部分 to B 的企业服务公司都着重于工具系统集成,如 OA 系统,ERP 系统,工具型的产品可以帮助企业优化一些固有的工作方式和流程,但受制于技术的不足,天花板较低,很难去不断往前优化、进化和迭代。
简仁贤指出,如今很多人开始用开源,但开源没办法做到「最优化」和「最佳化」,拥有自己的底层技术,可以针对一个大的问题进行最优化,直接改底层技术,从根本去优化,不会出现底层技术限制而导致上层功能无法优化的情况。简仁贤坚定地表示,从一开始,竹间智能就坚持从底层到上层全部自研,包括训练数据制造、算法等都是从 0 开始做的,因为他要做的是科技公司,不是 IT 集成商。
不仅如此,简仁贤还告诉我们,微软虽然对外宣称支持开源,可微软卖的 Soft产品里面源代码也是自研。 再如Google ,所有的源代码都是从 0 开始写的,但会开源出来。实际上包括 Facebook、百度、华为也一样。竹间智能受到众多投资者青睐,也是因为国内除了竹间智能外,少有的 NLP 公司能拥有百分之百自研底层技术的能力。
谈到自研的重要性,简仁贤给出了一个很实际的解释:企业软件做小了,没有人理,等做大了就会有人看中你的知识产权。如果没有自己的底层技术,本身的产品和平台的扩展力就会非常小,天花板会很快崩掉,企业的竞争力就很低了。拥有可控的底层技术,拥有专业领域的专利,拥有端到端的优化能力,才能达到未来解决方案的最大化和最佳解,在竞争当中才能做出整体解决方案,这就是科技企业的底气与壁垒所在。
深扎 NLP ,在自己的领域做到独当一面
简仁贤告诉我,竹间智能的自然语言处理主要用于解决人与人的交互问题、企业的交互问题、硬件与人的交互问题。而文本数据中台技术,结合了自然语言处理、深度学习等技术,具有处理多个不同来源的异构数据,如音频、文字、图像等,都可以做文本审核、比对、提取、分析、解读、预测、纠错、检索等。这些功能可以帮助人把业务做了。作为竹间智能的客户,新华社也使用 NLP 去做校正、查重、比对、校对文档的工作,并且借助 NLP 功能,可以检测到整篇文章的情感语境,判断这篇文章读起来的感受是正面还是负面等等。
那么,“情感智能”到底发挥哪些具体的作用?
举个例子,在网上购物时我们对于服务的满意度、对商品的喜欢度,才是情感。在这些场景中,人工智能可以通过动作、反应、表情来判断顾客的紧张程度。
此外,情感智能还可以应用在文字交互、语言交互等场景中。目前,竹间智能可以判断 25 种细分的情绪。
在所有应用场景中,简仁贤认为人工智能只有应用到以下三种模式中,才可以真正帮助企业创造价值。
提高用户体验。如提高客户满意度、提升交互体验、包括帮助企业更好地洞察客户的需求与情绪情感等;
提高效率。如缩短业务流程、业务自动化(审核文档、校正、发邮件审理等);
降低运营成本。包括减低获客成本、人工成本等。
“AI技术落地,没有弯道超车可言”
20多年在人工智能领域的经验,简仁贤深知技术之路的修炼并非易事。他表示,在这件事情上,没有捷径,也没有弯道超车,所有的经验和成功必须基于一步一个脚印的尝试,通过不断地尝试和不断地优化的出来的。
没有任何成功的大企业是和别人一样的,无论从创始人、到团队、到商业模式、技术研发、甚至到方法论和经验,都没有一样的。
竹间智能从 2015 年开始以 to C业务起步,之后调整转型落地to B业务,一直到现在已经发展了200多家大客户。所谓的转型也是亦步亦趋,每一年都会推出新的不同的策略和产品,根据企业发展而去制定的,制定好后就会去执行,大概每一年都会经过不一样的蜕变。
这当中最大的经验就是:不用去Copy 别人,不用管别人在做什么,关键是自己能否在不断地尝试当中找出自己的一条路,避开跟别人直接碰撞的局面。自己要去找到蓝海在哪里,不是由别人画出蓝海的领域你就闯进去,得自己找。
蓝海找到后,要看自己的基本功是否扎实,这取决于你是否会被后来者居上。竹间智能坚持做 NLP 、情感计算,底层技术扎实,所以竞争对手从来不是入局的创业公司,而是大型的 to B 服务企业。这当中,其他的一些企业可能已经从 做NLP 、知识图谱转到RPA的领域,RPA 是按键精灵的工具,并不是正真意义上的人工智能。
归结起来就是:找到一个细分领域深扎,在自己的领域里坚守,做到最好。
人工智能未来还有更大的空间
通过这次疫情,大众对于人工智能接受度有所增加。原本持观望态度的企业,也向人工智能的应用领域迈进了一步。对于企业来说,这是一个契机,也是一个挑战。
随着复工复产的推进,未来还会有很多新的大行业出现,无论是新旧结合、还是从这次疫情中崛起的新型行业,都值得我们拭目以待!
6月2日20:00,CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛携手全球顶级开源基金会主席、董事,聚焦中国开源现状,直面开发者在开源技术、商业上的难题,你绝不可错过的开源巅峰对谈!立即免费围观:
推荐阅读
追忆童年,教你用Python画出儿时卡通人物
如何用NLP辅助投资分析?三大海外机构落地案例详解
What?! Python一行代码,能玩这么多童年的游戏?
我只是追个直播,结果被拉进大咖们的群面对面群聊……
借助大数据进行社交媒体营销,企业们得这么玩!
力挺比特币的世界第2交易员:仅次于索罗斯,连续25年无亏损
你点的每个“在看”,我都认真当成了喜欢
相关文章:

[转]SIFT特征提取分析
SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配࿰…

博客大事记之迁移博客到香港主机
个人博客:https://rebootcat.com/2020/11/10/move_blog_hk/ 前言 之前其实已经写过一篇博文: 迁移博客到香港虚拟空间,那为什么又要写这篇博客呢? 上次其实是把我的博客迁移到一个香港的虚拟空间里,但是不到半年的时…
限时福利:腾讯高级专家手把手教你打造 OCR 神器!
OCR,英文全称即 optical characters recognition(光学字符识别),通过服务器把图片上的文字识别出来,以供大家编辑使用,比如进出火车站的时候,已经可以自动识别的身份证;在道路行驶中…

C++与.net的编译方式
C和.Net程序采用了两种不同的编译方式。 通常一个C编写的程序,都是一次编译成二进制的代码,在相应的操作系统平台上直接执行即可。 而.Net程序采用两次编译的方式,用C#,VB.Net等语言写成的程序被编译成IL代码,通过CLR在…

awk (一)
示例文件:[rootorclsrv ~]# catsample Heigh-ho! sing,heigh-ho! unto the green holly: Most friendship isfeigning, most loving mere folly: Then, heigh-ho, theholly!使用感叹号(!) 作为字段分隔符(FS)打印示例数据的第1 个字段:[rootorclsrv~]# …

TCP全连接和半连接的问题探讨
个人博客: https://rebootcat.com/2020/11/14/tcp_accept/ 从何说起 说起 tcp 的连接过程,想必 “3次握手4次挥手”是大家广为熟知的知识,那么关于更细节更底层的连接过程也许就很少人能讲清楚了。 所以本文会先简单回顾一下 tcp 的 3次握手…

[转] ASP.NET MVC3 路由和多数据集的返回
1.ASP.NET MVC3 中的路由 同前边一样本篇并不会过多的介绍理论知识,我们在Global.asax.cs文件中可以看到如下代码: routes.MapRoute("Default", // Route name"{controller}/{action}/{id}", // URL with parametersnew { controlle…
给Python代码加上酷炫进度条的几种姿势
作者 | 刘早起来源 | 早起Python(ID: zaoqi-python)大家好,在下载某些文件的时候你一定会不时盯着进度条,在写代码的时候使用进度条可以便捷的观察任务处理情况,除了使用print来打印之外,今天本文就介绍几种…

(转)mongodb分片
本文转载自:http://www.cnblogs.com/huangxincheng/archive/2012/03/07/2383284.html 在mongodb里面存在另一种集群,就是分片技术,跟sql server的表分区类似,我们知道当数据量达到T级别的时候,我们的磁盘,内…

深入浅出paxos
原文 https://rebootcat.com/2020/12/05/paxos/
Uber 前无人驾驶工程师告诉你,国内无人驾驶之路还要走多久?
受访者 | Graviti 创始人&CEO 崔运凯记者 | Aholiab,编辑 | Carol出品 | AI科技大本营(ID:rgznai100)经过数年的发展,现在的人们谈到“AI”已经不再像过去一般感到遥不可及。但 AI 在国内发挥的作用仍然只是冰山一角ÿ…

oracle服务
OracleOraDb11g_home1ClrAgent服务,在网上查找到了资料 http://download.oracle.com/docs/cd/B19306_01/win.102/b14306/install.htm Configuring Extproc Agent Using Windows Service As part of Oracle Database Extensions for .NET installation, a Windows se…

B00009 C语言分割字符串库函数strtok
切割字符串是常用的处理。 这里给出一个使用函数strtok切割字符串的例子。 使用C语言的库函数strtok来切割字符串的好处在于,可以指定任意字符作为分隔符来切割单词。使用该函数,切割字符串的分隔符可以同时指定多个,放在一个字符串数组中。 …

WEB打印大全
1、控制"纵打"、 横打”和“页面的边距。 (1)<script defer> function SetPrintSettings() { // -- advanced features factory.printing.SetMarginMeasure(2) // measure margins in inches factory.SetPageRange(false, 1, 3) // ne…
漫画 | 程序媛小姐姐带你一次了解什么是排序算法
来源 | 小齐本齐封图 | CSDN 付费下载自视觉中国插入排序借用《算法导论》里的例子,就是我们打牌的时候,每新拿一张牌都会把它按顺序插入,这,其实就是插入排序。齐姐声明:虽然我们用打牌的例子,但是可不能学…

POJ 1207 The 3n + 1 problem
题目链接:http://poj.org/problem?id1207 题目大意:给你一个数x,规定一个函数F(x),如果x为1则F(x)1,否则如果x是偶数,F(x)F(x/2),x为奇数F(x)F(3*x1)计算给定x到变换到1的步数。 注意点&#x…

PopupWindow响应返回键的问题
假设情景是这样的:在一个Activity中弹出一个PopupWindow,要求在按返回键时关闭该PopupWindow。 如果该PopupWindow是无焦点的(默认情况),那么可以在Activity中响应返回键(onBackPressed)&#x…

Unix / Linux世界里的4-2-1
Unix / Linux世界里的4-2-1 在Unix / Linux世界里,4代表可读( r ),2代表可写入 ( w ),1代表可执行 ( x ) 如果拥有7 421 的权限,即代表这个人可以对档案完全控制。 以0777为例: 去掉0,第一个7代表着拥有者…
深度学习概述:NLP vs CNN
作者 | Manish Kuwar译者 | 苏本如,责编 | 郭芮头图 | CSDN 下载自视觉中国出品 | CSDN(ID:CSDNnews)以下为译文:当今,人工智能已经不仅仅是一个技术术语了。这项技术在过去十年的时间内几乎将其影响扩展到…

oracle 求A中不存在于B的记录
oracle 求A中不存在于B的记录 select * from a minus select * from b 是求A中不存在于B的记录select * from a union select * from b 是求A和B的DISTINCT的并集select * from a union all select * from b 是求A和B的冗余并集那么A和B的交集是什么函数来的?交集是 INTERSE…

正则表达式grep、egrep--already
第一式 grep是什么 #man grepgrep(global search regular expression(RE)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。UNIX的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令…
万字长文综述目标检测领域,你要的都在这里
来源 | AI专栏(ID: pursue-Y-future)目标检测是计算机视觉中的一个重要问题,近年来传统检测方法已难以满足人们对目标检测效果的要求,随着深度学习在图像分类任务上取得巨大进展,基于深度学习的目标检测算法逐渐成为主…

ASP.net随机数应用实例
家可能都用过Chinaren的校友录,不久前它的留言簿上加了一个防止灌水的方法,就是系统每次产生一个由随机的数字和字母组成的图片,每次留言必须正确地输入这些随机产生的字符,否则不能添加留言。这是一个很好的防止恶意攻击的方法&a…

PreferenceActivity是什么?
我们看到Android系统本身就大量用到了PreferenceActivity来对系统进行信息配置和管理,那么它是怎么保存数据的呢,如何创建PrefenceActivity的呢?创建Android项目,并添加一个pref.xml文件(先建一个xml名的Folder)。注意,这次选择的…
坑系列 --- 时间和空间的平衡
这是坑系列的最后一弹了,这篇文章非常长,希望你能看完,要是看完有很酣畅的感觉就最好了。这一篇的坑主要来说说架构中时间和空间的平衡吧,这里的时间指代比较广,可能是开发时间,但大部分指的是执行时间&…

C#中调用Windows API的要点
在.Net Framework SDK文档中,关于调用Windows API的指示比较零散,并且其中稍全面一点的是针对Visual Basic .net讲述的。本文将C#中调用API的要点汇集如下,希望给未在C#中使用过API的朋友一点帮助。另外如果安装了Visual Studio .net的话&…
线上直播丨Hinton等6位图灵奖得主、百余位顶级学者邀你群聊AI
Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。在这波澜壮阔的11…

ServerSocket
ServerScoket 这个类用于与 Socket 进行通信。 在实例化ServerSocket 的时候,服务器相当于已经开始了,但是还需要通过socket来accept (socket serverSocket.accept())以使服务器选择性与某一Client进行连接。如果有指定了允许连接…

NDK开发 - C/C++ 访问 Java 变量和方法
上一篇有提到 JNI 访问引用数组,涉及了 C/C 访问 Java 实例的方法和变量。虽然在之前的开发中,并没有用到 C/C 范围 Java 层数据,但是这部分内容还是很有用的。传送门:NDK开发 - C/C 访问 Java 变量和方法 C/C 访问 Java 层的方法…

在C#中应用哈希表(Hashtable)
一,哈希表(Hashtable)简述 在.NET Framework中,Hashtable是System.Collections命名空间提供的一个容器,用于处理和表现类似key/value的键值对,其中key通常可用来快速查找,同时key是区分大小写;value用于存储对应于key的…