当前位置: 首页 > 编程日记 > 正文

一览群智胡健:在中国完全照搬Palantir模式,这不现实

640?wx_fmt=png

作者 | Just
出品 | AI科技大本营(ID:rgznai100)
神秘的硅谷大数据挖掘公司 Palantir 是国内众多创业公司看齐的标杆,其业务是为政府和金融领域的大客户提供数据分析服务,帮助客户作出判断,甚至“预知未来”,它已于近期寻求 IPO,估值在 360 亿美元到 410 亿美元之间。

现在来看,那些试着将其“Copy to China”的初创公司没看错,Palantir 看上去是一种成功的商业模式范例。不过作为追随者之一,一览群智在摸索一段时间后,发现完全照搬这种模式在中国走不通,即便中国的类似需求更为旺盛。

640?wx_fmt=jpeg
一览群智 CEO 胡健分析,由于 Palantir 是偏项目型公司,客单价很高,低于500 万美元一般不接,这样一年大约做 20 个项目就收工。但在中国,大项目全在系统集成商手里,客户也不太敢将大单项目中标给创业公司,初创公司只能成为其中一个技术提供者。
显然,他们反思了这一发展模式,胡健表示,“正如中国滴滴不能完全照搬 Uber 一样,在中国完全照搬 Palantir 模式,是不现实的。”
1.搜索基因

Palantir 是一个很好的 To B 模式样板,但当你认为以自然语言处理和知识图谱等认知智能技术为核心,为客户提供一站式AI 产品和行业解决方案的一览群智公司的成立,只是因为看上这一商业模式,那就小看它了。
事实上,创业已 4 年的一览群智,其创业动机源自技术基因——搜索。搜索在 Palantir 的架构中非常重要,其核心是整合和查询大型企业所有相关数据,涵盖知识图谱动态本体论以及现实对象、实体映射和关系挖掘,与互联网搜索引擎的索引技术相比,进行了深度扩展。
管理团队中,首席科学家文继荣、研究院院长窦志成以及 CEO 胡健都曾是微软亚洲研究院的老兵,他们的交集都在互联网搜索与挖掘组(WSM)。
胡健讲述了关于微软做搜索的故事片段。
文继荣曾是写国内国产数据库人大金仓早期核心人员之一,博士毕业后就去微软做数据挖掘工作,后来李开复牵头创建微软中国研究院(微软亚洲研究院前身),提出要做搜索,当时找了后来在 AI 领域享有盛誉的四个人,文继荣也是其中之一。
但在跟微软总部开会讨论过后,由于认为搜索没有商业模式,微软最终在 2000 年 4 月停掉了搜索项目,成为其重大战略失误。随后 Google 找到了广告推广的商业模式,微软也于 2003 年再次开启搜索项目,但用的是数据库的方式来做,这种方法效果并不好。2007 年,时任微软亚洲研究院院长的沈向洋被调去美国做搜索,文继荣作为 WSM 团队核心架构师研发支持了 Bing 搜索的架构。
后来搜索市场的格局就很明朗了,“面向 C 端的搜索是一场已经结束的战争。”
另一场技术革新很快扑面而来。人工智能技术的兴起,让他们开始思考新一代智能搜索的机会在哪里?
一种表现形式是个人智能信息助手,同时担任北京智源人工智能研究院首席科学家的文继荣认为,它将取代搜索引擎成为连接人与信息的新工具,用存储、计算和智能拓展人的能力,构建具有超级记忆力、知识能力和分析能力的“超级助手”,能够随时、随地方便地获取高质量相关信息和知识。这个目标当然还很遥远,并不足以为此成立一家商业公司。
但别忘了,搜索引擎整合的是互联网上海量多源异构数据理解网页内容和用户查询,然后进行匹配,但其简单的交互形态和对网页的理解,不能够直接告知用户想要的答案。某种程度上,胡健认为搜索的本质是一个比较“傻瓜化”的通用决策引擎,而客户需要一个智能系统帮助其作出决策。
所以搜索技术能否先阶段性落地在 B 端企业和行业?答案是肯定的。
2.智能决策系统
企业内的搜索形态与通用搜索引擎大不相同。胡健提到,如今大部分企业沉淀了包括邮件、OA 以及聊天信息等多元数据,如果把数据进行结构化,并与业务流程进行关联,使用自然语言处理、知识图谱以及机器学习等技术,最终是能够帮企业做出智能决策的 AI 辅助系统。
一览群智智能决策平台就是承载其不同业务场景的底座系统,目前包括四大产品“武器”。
具体而言,“智语”自然语言处理平台是具备完整的 NLP 智能一体化构建能力,能够帮助用户快速完成数据处理、模型训练及发布的全流程;“智图”知识图谱平台基于知识图谱技术,是“黏合剂”的角色,使用动态本体技术快速实现知识的建模、推理、走向、挖掘,有效支持情报、风控等强烈依赖于实体、属性、关系模型的应用场景;“智慧”机器学习平台是一款智能高效的机器学习平台,它能有效降低机器学习的门槛;“智策”可视化智能决策平台则提供非常强大的分析推理能力。
简单来说,一览群智的底座系统要完成的功能是感知、理解、关联和决策。

今年以来,以知识图谱为代表的认知智能技术成为AI 发展的一大高频词。人脸识别、语音识别等感知智能技术解决了机器看和听的问题,问题是看不懂、听不懂。人工智能要形成闭环,感知智能和认知智能的融合才会产生更大的价值。
其中,要突破的关键技术是自然语言理解和知识图谱。NLP 领域的 Bert,XLnet 等新模型层出不穷,这使得机器的阅读理解能力超过人类,即便这是“大力出奇迹”的结果,难以实现人机对话;其次,数据在线化、大数据规模和算力的提升,让原来人工构建知识图谱转向机器自动构建知识图谱成为可能。
胡健强调知识对于 AI 技术发展的重要性,“要通过构建大知识形成更好的推理,从而形成更好的对话。”
现实落地不会像他话语中表现出的那般轻易。胡健告诉AI科技大本营,目前知识图谱的框架信息密度不够,关联密度还很低,最好还需要像深度学习中能进行降维操作,让知识能够衔接,不断进行关联。其次,信息的干净度不够,所以想通过完全开放领域的知识图谱做应用不太可能可能落地。
通用组件跟行业业务场景如何具体连接的问题也让人痛苦,由于目前行业没有形成智能化生态,若客户没有技术底座或技术底座与产品之间有鸿沟,还需要技术提供方自己去填坑。
一览群智目前杀入的金融、公安、医疗三大领域要好得多。它们的共同点是有数据、信息化程度高且不缺钱,这三点是他们寻找落地领域的重要评判因素。
与云计算行业兴起时的那样,目前人工智能行业的落地也在探索当中,很多项目都偏定制化,但这胡健并不在意,因为随着产品不断迭代,没有生命力的自然会淘汰,而一小部分最后会成为标杆应用。“先变大,然后变小,再不断去扩充产品。”
3.个人智能信息助手
正如滚雪球一般,无论搜索还是智能决策系统,随着技术持续发展,其中一个发展方向是文继荣正在推进的个人智能信息助手。
尽管传统信息检索与挖掘算法已有广泛应用,但总体而言,搜索技术的架构和交互界面已经 30 年未变,搜索的核心技术已经 10 年没有重大进步。用关键词检索的方式,表达能力有限,获得的信息是千人一面。从更基础的技术来分析,传统信息检索与挖掘算法缺乏对底层数学与认知基础的理解。文继荣则把“智能信息检索与挖掘”看做搜索在未来的发展方向。
有些改变正在发生。在今年百度 Q2 财报内部信中,李彦宏提到百度正在用AI 重新定义搜索,目前搜索结果首条满足率已经达到 51%。10 月 26 日,将 BERT模型应用于搜索排名之后,Google 称可以帮助搜索引擎更好地理解美国(英文)10% 的搜索内容。
胡健形容人工智能还是个 12 岁的孩子,可它脑容量特别大,记忆力特别好,而且搜索特别快,这在某种意义上就具备一定推理能力。因此他认为,五年之内智能决策系统能够替代一些偏重复式或半重复式的规则比较明确的中等脑力劳动者。
而在未来五到十年间,他们要让机器更好的理解网页,更好的构建知识,更好的做匹配,做更好的交互形式。
那未来新一代智能搜索的会具备什么能力?
“第一,必须具备像人一样的沟通和理解能力;第二,有多轮对话能理解和形成整个对话逻辑。另外还要去做知识构建、推理、关联分析,去理解底层知识的构建体系。”胡健说。
看了电影《Her》后,他笃定以后不会有手机这种形态,人机对话也不会像微软小冰现在所呈现的效果,未来搜索的形态是人们通过一种代理机制发出指令,从而获取精准信息。“这个代理就是信息助手,这才是搜索的未来。”

(*本文为AI科技大本营原创文章,转载请微信联系 1092722531


精彩推荐



快年末啦!年初立的Flag实现了吗?升职了吗?加薪了吗?都没有的话,快来补补课!2019嵌入式智能国际大会,8.3折限时优惠票,最高可省499元!学生票仅售399元!戳链扫码买起来。

640?wx_fmt=jpeg

推荐阅读

相关文章:

ImageNet图像数据集介绍

ImageNet图像数据集始于2009年,当时李飞飞教授等在CVPR2009上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文,之后就是基于ImageNet数据集的7届ImageNet挑战赛(2010年开始),2017年后,ImageNet由Ka…

cocos2dx 场景的切换

我们知道cocos2dx中可以由多个场景组成,那么我是如何来切换场景的呢首先我们先新建一个新的场景类,我推荐的方式是,在你工程的目录中找到一个classes的文件夹,里面有AppDelegate.cpp和AppDelegate.h还有HelloWorldScene.cpp和Hell…

IOS 后台挂起程序 当程序到后台后,继续完成定位任务

// 当应用程序掉到后台时,执行该方法 - (void)applicationDidEnterBackground:(UIApplication *)application { } 当一个 iOS 应用被送到后台,它的主线程会被暂停。你用 NSThread 的 detachNewThreadSelector:toTar get:withObject:类方法创建的线程也被挂起了。 我…

任正非:华为5G是瞎猫碰死老鼠

喜欢话糙理不糙的任正非,又飙金句。11月6日,在和彭博社记者对话时,谈到华为5G,他说:“回顾这个过程,我们也没有什么必胜的信心,有时候也是瞎猫碰上了死老鼠,刚好碰上世界是这个需求。…

网络文件系统(NFS)简介

网络文件系统(Network File System, NFS)是一种分布式文件系统协议,最初由Sun Microsystems公司开发,并于1984年发布。其功能旨在允许客户端主机可以像访问本地存储一样通过网络访问服务器端文件。NFS和其他许多协议一样,是基于开放网络运算远…

JAVA Static方法与单例模式的理解

最近用sonar测评代码质量的时候,发现一个问题,工程中一些util类,以前写的static方法都提示最好用单例的方式进行改正。为此,我仔细想了想,发现还是很有道理的。这里谈谈我个人对static方法与单例模式的理解。所谓单例模…

程序员的自我修养--链接、装载与库笔记:目标文件里有什么

编译器编译源代码后生成的文件叫做目标文件。目标文件从结构上讲,它是已经编译后的可执行文件格式,只是还没有经过链接的过程,其中可能有些符号或有些地址还没有被调整。其实它本身就是按照可执行文件格式存储的,只是跟真正的可执…

swift 中拨电话的实现

//MARK:_一键报警设置//MARK: - 弹出视图func createView() {var alertView : UIAlertView?alertView UIAlertView(title: "110", message: "", delegate: self, cancelButtonTitle: "取消", otherButtonTitles: "呼叫")alertView?…

T5,一个探索迁移学习边界的模型

作者 | Ajit Rajasekharan译者 | 夕颜出品 | AI科技大本营(ID:rgznai100)【导读】10月,Google 在《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》这篇论文中提出了一个最新的预训练模型 T5&#xff…

【Chat】实验 -- 实现 C/C++下TCP, 服务器/客户端 多人聊天室

本次实验利用TCP/IP, 语言环境为 C/C 利用套接字Socket编程,以及线程处理, 实现Server/CLient 之间多人的聊天系统的基本功能。 结果大致如: 下面贴上代码(参考参考...) Server 部分: 1 /* TCPdtd.cpp - main, TCPdayt…

TeamViewer介绍:远程控制计算机

TeamViewer是一个可以远程控制计算机的程序,它也可以进行远程文件传输。TeamViewer支持的平台比较多,如Windows, Mac, Linux, ChromeOs, Android, iOS等,最新发布版本为14.x,它有个人免费和商业付费两种。只要对方告诉你他的TeamV…

PyTorch攻势凶猛,程序员正在抛弃TensorFlow?

来源 | The Gradient译者 | 夕颜出品 | AI科技大本营(ID:rgznai100)自 2012 年深度学习重新获得重视以来,许多机器学习框架便争相成为研究人员和行业从业人员的新宠。从早期的学术成果 Caffe 和 Theano ,到背靠庞大工业支持的 PyT…

swift 错误集合 ------持续更新中

从今天开始凡是在用swift中遇到的错误都会在本博客持续更新 便于自己学习和快速开发 2017.7.20 如果你的程序写的有进入后台的方法,例如我的博客中点击home进入后台持续定位的那篇文章,发信进入后台后定位没有按得定时器规定的时间走,这…

【转载】【贪心】各种覆盖问题

1、独立区间问题 在N个区间里找出最多的互不覆盖的区间 对结束点进行排序,然后从结束点最小的区间开始进行选择即可 2、覆盖区间问题 给一个大区间,再给出N个小区间,求出最少用多少个区间可以把大区间覆盖完 先选出开始的一个,然后…

使用Python3发送邮件测试代码

SMTP(Simple Mail Trasfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,用它来控制信件的中转方式。Python3对SMTP的支持有smtplib和email两个模块,smtplib负责发送电子邮件, email负责组织邮件内…

swift 通知中心 进入后台多久会通知用户关闭此功能

//添加本地通知 func addLocalNotification() { //定义本地通知对象 let notification : UILocalNotification UILocalNotification() //设置调用时间 notification.fireDate NSDate.init(timeIntervalSinceNow: 1800.0)//通知触发的时间,10s以后 notification.…

Python之父退休,C语言之父与世长辞,各大编程语言创始人现状盘点

作者 | 年素清 编辑 | 伍杏玲 来源 | 程序人生(ID:coder_life)从世界上第一台计算机(ENIAC) 于1946年2月在美国诞生至今的七十多年里,涌现出了许多优秀的计算机编程语言。程序员们在使用它们编写程序的时候,一定很好奇…

linux修正系统错误指令fsck和badblocks

fsck [-t文件系统][-ACay]装置名称-t 指定文件系统-A 扫描需要的装置-a 自动修复检查到有问题的扇区-y 与-a类似-C 在检查过程中,显示进度********************************************************** EXT2/EXT3额外选项功能:-f 强制检查-D 针对文件系…

Ubuntu定时任务crontab命令介绍

通过Linux上的crontab命令,我们可以在规定的间隔时间执行指定的系统指令或脚本。时间间隔的单位可以是分钟、小时、日、月、周及以上的任意组合。 crontab默认在Ubuntu上是已经安装的,若未安装,则可执行以下命令进行安装: sudo …

swift 进入后台或者点击home键是程序进入后台后,持续定位

进入后台的方法 import UIKit UIApplicationMain class AppDelegate: UIResponder, UIApplicationDelegate,CLLocationManagerDelegate { var locationManager : CLLocationManager? var window: UIWindow? var notificationDict NSDictionary() func applicationDidEnterBa…

求助:我有一辆机器人小车,怎么让它跑起来,还会避障、目标跟踪、路径规划?...

也许,你曾见过能灵活地绕开障碍物的它在桌子边缘“疯狂试探”的它它是谁?没错,它就是是英伟达推出的一款入门级人工智能小车——Jetbot ,估计对机器人,尤其是对车械感兴趣的朋友们一定对它不陌生。组装完成后能够通过摄…

Python-常用字符串转换实例

当字符串是:\u4e2d\u56fd >>>s[\u4e2d\u56fd,\u6e05\u534e\u5927\u5b66]>>>strs[0].decode(unicode_escape) #.encode("EUC_KR")>>>print str 中国 当字符串是: >>>print unichr(19996) 东 ord()支持unicode&…

什么是静态UItableView

iOS开发UI篇—简单介绍静态单元格的使用 iOS开发UI篇—简单介绍静态单元格的使用 一、实现效果与说明 说明:观察上面的展示效果,可以发现整个界面是由一个tableview来展示的,上面的数据都是固定的,且几乎不会改变。 要完成上面的…

Python3中PyMongo使用举例

MongoDB是一个基于分布式文件存储的开源数据库,由C语言编写,与平台无关,旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库中功能最丰富,最像关…

PyTorch踩过的12坑 | CSDN博文精选

作者 | hyk_1996 来源 | CSDN博客1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差异无论是对于模型还是数据,cuda()函数都能实现从CPU到GPU的内存迁移,但是他们的作用效果有所不同。对于nn.Module:model model.cuda() model.cuda() 上面两句能够达到…

解决ubuntu14.04下Qt 5.3.1下的QtCreator fcitx,ibus不能输入中文

2019独角兽企业重金招聘Python工程师标准>>> ubuntu 14.04从Qt官网下载的最新版qt,安装过程很顺利,但却发现没办法输入中文(我用的是 fcitx), 即使下载了fcitx-frontend-qt5和fcitx-frontend-qt4也还是没用。 想必是qt版本的原因吧…

实战:基于技术分析的Python算法交易

译者 | Tianyu 出品 | AI科技大本营(ID:rgznai100)本文是用 Python 做交易策略回测系列文章的第四篇。上个部分介绍了以下几个方面内容:介绍了 zipline 回测框架,并展示了如何回测基本的策略导入自定义的数据并使用 zipline评估交…

深度学习中的Dropout简介及实现

在训练神经网络模型时候,如果模型相对复杂即参数较多而训练样本相对较少,这时候训练出的模型可能对训练集中的数据拟合的比较好,但在测试集上的表现较差,即出现了过拟合的情况。这种情况下可以使用Dropout来降低过拟合的可能性进而…

swift中字符串截取方法(substring)

下面介绍2种swift的字符串截取方法,实际上用到了substringFromIndex,substringToIndex,substringWithRange 1.将String转化为NSString再截取,代码如下: var s"1234567890"var ns1(s as NSString).substringFromIndex(5) var ns2(s as NSString).substrin…

设置IE兼容模式

文件兼容性用于定义让IE如何编译你的网页。此文件解释文件兼容性,如何指定你网站的文件兼容性模式以及如何判断一个网页该使用的文件模式。 前言 为了帮助确保你的网页在所有未来的IE版本都有一致的外观,IE8引入了文件兼容性。在IE6中引入一个增设的兼容…