易观的大数据中台之路
作者 | 易观CTO郭炜
出品 | AI科技大本营(ID:rgznai100)
本文为CSDN即将推出的《新战场:决胜中台》专刊的第 2 篇文章。
什么是数据中台?
中台的定义来自于投资银行,简单说来,投行当中前台是赚钱的、后台是做支持赚钱的,而中台是支持更快赚钱的。而建设大数据中台的本质在于把过去在后台的工作挪到中台,进一步支持前台更高效的做数据分析。
整体说来,数据中台可以分成两种建设模式:广中台和深中台。
广中台:大部分大厂使用这种模式,在IaaS之上有大数据组件组成的PaaS中台,可以帮助各业务团队的研发,快速申请资源、快速研发数据相关应用,满足业务团队用户需求。广中台的用户基本上是各业务部门的技术人员。
深中台:大部分小厂或者创新团队使用这种模式,在IaaS之上,根据数据的“主题域“或者业务领域,分别建立直接给业务人员使用的PaaS,让业务人员可以直接操作数据、进行实时计算、用户分群、用户营销等等。深中台的用户基本上是该业务主题域的业务运营或者产品人员。
用一个不恰当的比喻,广中台有点像当年的数据仓库,以整合计算算力、共享数据资源为目标,需要技术人员再次加工来提供业务应用模型,深中台有点像当年的数据集市+ACRM,以直接驱动业务、业务用户直接使用数据为目标。
为什么要建立大数据中台
数据中台就是企业从传统信息化到数字化演进过程中的必然产物。大数据平台过去几年内非常火爆,几乎所有数字化企业都启动了相关的大数据项目,但是,建设大数据平台时有各种各样的痛点:
大数据项目启动难:大数据平台建设周期长,成本高、人员互联网运营经验不足;
大数据项目效果体现难:大数据如何解决互联网运营问题、大数据系统建设结果是更多的BI报表、大数据建设ROI无法衡量;
大数据项目执行难:数据源纷繁复杂、原有系统涉及到多部门协调沟通、以及数据治理问题;
往往一个大数据平台建设完成后,带来了大量的运维工作,而业务支持能力被业务部门质疑,到底如何衡量大数据的ROI是一个行业的痛点。
在这个背景情况下大数据中台营运而生,数据中台的目标就是:
1、把业务分析还给业务,让业务人员、数据科学家直接使用数据,而不是传统软件提需求出报表的方式;
2、实时数据分析,即时满足运营人员的各种推测和分析需求。
3、数据治理要在业务端进行,而不是在技术端进行梳理。
从大数据平台到数据中台是一次从大数据从技术到业务的飞跃,过去我们只看技术,到中台时期,是从业务端看技术。
如何建设大数据中台
易观在建设大数据中台过程中,主要从这三个方面来进行:面向业务、开放连接、共享共建。
面向业务
易观的大数据中台是一个“深中台“模式,也就是中台的目标是定位在直接赋能业务用户使用,减轻大数据人员重复劳动上下功夫。因此,易观的数据中台产品“方舟”是以智能用户数据中台为目标,定位在于用户数据为中心的相关业务。深入业务用户的使用场景,提供留存、转化等等实际的业务场景,让业务人员使用。同时,根据业务人员反馈的需求、基于开放的用户数据PaaS快速打磨迭代上面的场景和应用。
易观智能用户数据中台——方舟
开放连接
如果要支持上述提到的快速迭代,底层的大数据PaaS就需要非常灵活,开放接入各种组件、支持多种灵活的二次开发方式,还要支持多云,这里易观采用的是“大数据IOTA”架构的数据PaaS:
大数据IOTA架构
它的基本思路就是把数据计算分布在所有节点上,从数据采集开始就进行边缘计算,这样一来定义数据采集原子口径,将业务口径归还业务部门,更加快速的支持业务调整:
统一格式/口径的数据接入(前后端采集、数据上传)方式
抽象为“主-谓-宾”数据标准化模型数据计算
秒算引擎满足实时多维度多模型数据查询
支持业务系统数据接入,整合企业数据
支持外部系统导出数据,满足更多应用场景
得益于IOTA架构,易观的用户数据中台,支持4大类、10小类、近百个API,还支持JDBC接口,让业务人员和技术人员都可以快速根据自己的实际情况进行二次开发——授人以鱼不如授人以渔,最了解业务的还是业务用户自己,数据中台就是帮助它实现自主完成相关业务分析和数据驱动的工具。
数据中台还要选择具有联通型的组件,这样可以快速和企业内部的各种组件对接,易观选取的是Presto,它具有的特性是可以快速链接多种大数据组件的能力,天然支持Mysql,HDFS和Cassandra,而易观又扩展了它的能力,开源了自主研发的Kudu Connector,Hbase Connector等,让企业可以快速通过易观的数据中台联通自己的内部大数据组件。
开放性还体现在多云支持上,目前,公有云、私有云多种形态并存,大数据中台组件要适配当前的多种云方式,目前易观自己的用户数据中台方舟采用了IOTA架构中“计算-存储分离”的模式已经支持了阿里、AWS、腾讯等主流云厂商,这样可以帮助企业顺利使用多云模式。
共享共建
大数据平台组件繁多,如何可以让数据中台与大数据平台有效配合,易观的思路是从开放API、开放组件到开源布局,下图是易观免费的用户数据中台Argo和大数据平台生态布局的关系。
免费的用户数据中台Argo与大数据平台的关系
作为免费用户数据中台,Argo帮助初创企业和创新团队建立自己的用户行为中台,完成业务分析部分,但是大的企业有自己的大数据平台,直接如何方便互联互通。这个情况非常复杂,很难通过一家企业来完成所有的生态,易观的思路是开源,共享共建。大数据平台中的核心ETL调度组件,易观3月份正式开源了分布式易扩展的可视化DAG工作流任务调度系统Dolphin Scheduler,在众多用户期待和全球技术专家投标的肯定下,8月底正式加入Apache孵化器,成为国内唯一的一家Apache大数据调度引擎,10月底A10峰会上,易观正式开源了“可视化埋点SDK”,旨在帮助企业解决数据埋点这个痛点。
数据中台作为一个可内聚的产品,周边的组件是要通过开源、共建生态来完成的,无论是甲方的企业还是乙方的专业公司,中台的建设都需要开放心态,共享使用场景、经验,共同打造开源社区,共享行业资源才可以真正做好。
数据中台的未来展望
每一个技术架构的升级,其实背后是管理思路的变革,数据中台将过去数据决策迭代周期从数月到数天乃至数天,是“精益”理论和敏捷开发在数据行业里的具体实现。更多的让业务用户可以直接使用数据、利用数据进行运营、测试,形成精益闭环是未来大势所驱。
技术上,大数据中台的发展,也对大数据平台工程师提出了更高的业务需求,最终会形成一个新的工程师种类——大数据中台工程师,他们是了解业务、懂得数据分析,还会使用大数据技术来实现大数据中台的技术人员。
大数据中台,只是数据从后台走向前台的过渡阶段,最终在IOT、5G、AI的助力下,数据技术会成为一个公司的“前台”业务,最终让数据和人工智能替代前台人员直接为业务变现。
《新战场:决胜中台》专刊文章链接:
平安科技智能认知的“中台战事”
(*本文为AI科技大本营约稿文章,转载请微信联系 1092722531)
◆
精彩推荐
◆
推荐阅读
钢铁侠“变身”AI布道师?小罗伯特·唐尼这次推出一部AI科普纪录片
提高建模效率,改变手工作坊式生产,AutoML的技术研究与应用进展如何了?
2019年上万篇论文发表,这14篇备受瞩目的论文,你都了解吗?
迁移学习前沿研究亟需新鲜血液,深度学习理论不能掉链子
俄罗斯“扎克伯格”:创建区块
链版“微信”,27 岁身价达 2.5 亿美元
什么是数字孪生?
6 个重要模块,带你编写一个基于Golang的区块链公链demo!| 博文精选
抗住 60 亿次攻击,起底阿里云安全的演进之路 | 问底中国 IT 技术演进
你点的每个“在看”,我都认真当成了AI
相关文章:

WMI技术介绍和应用——查询系统信息和补丁包信息
本文使用了《 WMI技术介绍和应用——使用VC编写一个半同步查询WMI服务的类》中代码做为基础。本节只是列出了WQL语句,具体使用参看前面的例子。( 转载请指明出于breaksoftware的csdn博客)本文主要知识点是Win32_OperatingSystem和Win32_Quick…

Winform与Webform中的对话框
参考MSDNDialogResult result MessageBox.Show("见过打劫的没?", "打、打、打劫", MessageBoxButtons.OKCancel, MessageBoxIcon.Information, MessageBoxDefaultButton.Button1);switch (result){case DialogResult.OK:MessageBox.Show("你按了确定…
启动Genymotion时报错Failed to initialize backend EGL display
在启动Genymotion的时候报错: video card说的是显卡,你的显卡可能不支持 OpenGL2.0,或者你装的驱动有问题。解决办法:将驱动重新安装一下。可直接下载一个如“驱动人生“一样的驱动软件,把你的显卡驱动更新一下。转载…

新年新方向-斩获新职位
^_^上个星期斩获公司内部竞聘职位:项目管理部总经理,高兴,发展方向变了,以后我会多写一些项目管理的文章和大家分享。WPF的学习和分享也不会停下来,我要全面发展,做社会主义的接班人!YE!项目管理部总经理职…
清华官宣:前百度总裁张亚勤正式加盟清华大学
整理 | Jane出品 | AI科技大本营(ID:rgznai100)12月31日,2019 年的最后一天,在大家沉浸在「总结过去」、「展望未来」之时,清华大学刚刚官宣了一则消息:前百度总裁张亚勤正式加盟清华大学&#…

WMI技术介绍和应用——查询时间信息
本文使用了《WMI技术介绍和应用——使用VC编写一个半同步查询WMI服务的类》中代码做为基础。本节只是列出了WQL语句,具体使用参看前面的例子。(转载请指明出于breaksoftware的csdn博客) 本文主要介绍Win32_LocalTime和Win32_UTCTime。 如何使…

问题-[VMware Workstation]断电后,重启电脑,之后就提示“内部错误”
问题现象:突然断电后,重启电脑,再打开VMware Workstation,启动不了。之后就提示“内部错误”。问题原因:希望高人指点。问题处理:关闭VMware Workstation,在快捷方式上,右击…

FC SAN与IP SAN的比较
SAN(Storage Area Network,存储区域网络)是一个由存储设备和系统部件构成的网络。所有的通信都在一个与应用网络隔离的单独的网络上完成,可以被用来集中和共享存储资源。SAN不但提供了对数据设备的高性能连接,提高了数…
“数学不行,干啥也不行!”骨灰级程序员:其实你们都是瞎努力
编程圈一直都流传着一个段子:一流程序员靠数学,二流程序员靠算法,末端程序员靠百度,低端看高端就是黑魔法。懂的人其实都知道,这不是段子,其实就是程序员的真实写照。想一想,我们日常学习、求职…

WMI技术介绍和应用——查询系统服务
本文使用了《 WMI技术介绍和应用——使用VC编写一个半同步查询WMI服务的类》中代码做为基础。本节只是列出了WQL语句,具体使用参看前面的例子。( 转载请指明出于breaksoftware的csdn博客)本文主要介绍Win32_Service类。 如何使用WMI枚举系统中…
送书 | 2020年新一天,用这本书开启你的NLP学习之路!
本文选自电子工业出版社博文视点新书《大数据智能:数据驱动的自然语言处理技术》。本书作者:清华大学刘知远、薄言RSVP.ai崔安颀、腾讯张开旭、清华大学韩文弢、中国人民大学赵鑫、厦门大学苏劲松、罗格斯大学张永锋、北京大学严睿、哈尔滨工业大学&…

如何在父进程中读取子(外部)进程的标准输出和标准错误输出结果
最近接手一个小项目,要求使用谷歌的aapt.exe获取apk软件包中的信息。依稀记得去年年中时,有个同事也问过我如何获取被调用进程的输出结果,当时还研究了一番,只是没有做整理。今天花点时间,将该方法整理成文。ÿ…

Ruby环境的安装(In Ubuntu 7.10)
今天开始学习Ruby。准备的图书呢,就是《Programming Ruby - 2nd》。为了准备一个实验的环境,于是要给我的Ubuntu上安装Ruby的环境。1、安装解释器:sudo apt-get install ruby 2、安装一个即时执行工具irb:由于第一部安装的结果…

基于animation.css实现动画旋转特效
分享一款基于animation.css实现动画旋转特效。这是一款基于CSS3实现的酷炫的动画旋转特效代码。效果图如下: 在线预览 源码下载 实现的代码。 html代码: <div class"wrap"><div class"mod_bg"><div class"bg…

VC:CString用法整理(转载)
1.CString::IsEmpty BOOL IsEmpty( ) const; 返回值:如果CString 对象的长度为0,则返回非零值;否则返回0。 说明:此成员函数用来测试一个CString 对象是否是空的。 示例: 下面的例子说明了如何使用CString::IsEmp…

WMI技术介绍和应用——查询本地用户和组
本文使用了《 WMI技术介绍和应用——使用VC编写一个半同步查询WMI服务的类》中代码做为基础。本节只是列出了WQL语句,具体使用参看前面的例子。( 转载请指明出于breaksoftware的csdn博客)本文主要介绍Win32_Group和Win32_UserAccount类。 如何…
AAAI 2020 | 时间可以是二维的吗?基于二维时间图的视频内容片段检测
作者 | 彭厚文、傅建龙来源 | 微软研究院AI头条编者按:当时间从一维走向二维,时序信息处理问题中一种全新的建模思路由此产生。根据这种新思路及其产生的二维时间图概念,微软亚洲研究院提出一种新的解决时间定位问题的通用方法:二…

UITextField的代理方法
- (void)textFieldDidBeginEditing:(UITextField *)textField 当textField开始编辑的时候调用,可用完成如下的需求:点击textField可以使页面往上滑动 必须加上这句代码 [UIView animateWithDuration:.25 animations:^{ _scrollView.contentOffset CGPo…

以金山界面库(openkui)为例思考和分析界面库的设计和实现——问题
随着物质生活的丰富,人们的精神生活也越来越丰富。人们闲暇的时间也相对变多,于是很多人就开始寻找打发时间的方法。其中电视便是其中一种非常重要的消遣方式。假如我们打开电视机,看到了一个电视台正在播一部我们之前没看过的,正…
知识图谱,下一代数据中台的核心技术
作者 | 杨威,明略科技技术中心负责人 编辑 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 本文为CSDN即将推出的《新战场:决胜中台》专刊的第 3 篇文章。 【导读】数据中台火的十分突然,似乎年前还在炒概念,年…

StoneAge Dict 技术方案的可行性[1]
上次和项目经理讨论了技术选型的事,现在简单地说一下,等下次开会再系统地讲。1. 平台环境:Java1.52. 用户接口:Web: JSP, JSFSpring2.5xDesktop: JavaFX3. 技术:dictzip(解析StarDict词库), XML因为StarDict是目前很受…

using的几种用途
using 常用来引用命名空间 1 using System; 2 using System.Data; 3 using System.Data.SqlClient; 4 using System.Collections.Generic; 5 using Model; 6 using IDAL; 7 using DBUnititly; using另一个用途是给类和命名空间指定别名 1 using spacename system.io2 3 using…

以金山界面库(openkui)为例思考和分析界面库的设计和实现——资源读取模块分析
按照软件的执行流程,我们首先遇到《以金山界面库(openkui)为例思考和分析界面库的设计和实现——问题》中提出的最后一个问题:界面描述文件的放置位置。我们曾提出一种方案:将界面描述文件打包后放在资源文件中&#x…
开发者如何赶上5G风口?
随着5G正式步入商用,5G 技术引发广泛关注。据信息通信研究院《5G经济社会影响白皮书》预测,2030年,5G将直接带动的总产出、经济增加值、就业机会分别为6.3万亿元、2.9万亿元和800万个。据BOSS直聘 《2019年5G相关人才数据观察》报告指出&…

使用C# 3.0编译器编译 Asp.Net 项目代码
只需要在 web.config 里添加这样的一段设置就OK了:<configuration><system.codedom><compilers><compiler language"c#;cs;csharp"extension".cs"type"Microsoft.CSharp.CSharpCodeProvider,System, Version2.0.0.0, Cultureneu…

java 它 引用(基本类型的包装,构造函数和析构函数c++不同)
一个:java 和c参考控制 他提到引用,我们会想到java它不喜欢c里面的指针。当然java内引用和c里面的引用是不同的。 比如: 比方C中,我对某一个函数的声明。int a(int &b),b即为引用类型,函数内b的改动能够…

使用程序解决一道逻辑推理题
今天看朋友发了一个老问题,一道很有意思的推理题:(转载请指明出于breaksoftware的csdn博客) 小明和小强都是张老师的学生,张老师的生日是M月N日,2人都知道张老师的生日是下列10组中的一天: 3月4…

AjaxControlToolKit之DragPanelExtender用法
1、将控件ToolkitScriptManager拖至页面中...2、定义3个Panel,用于实现窗体拖动效果,代码如下:1<body>2<form id"form1"runat"server">3<div>4<cc1:ToolkitScriptManager ID"ToolkitScriptMan…
自带数据线的迷你数显充电宝,旅途必备
还有20多天就过年了有件极其考验情商的事情也来临了就是我们这群90后过年最怕的事情——相亲但是在尴尬的场合手机可是一个缓解气氛的好东西不管是想要选择看电影,还是找附近的游玩只要有手机,就可以从容不迫的应对但是带手机最尴尬的事情莫过于结账的时…

SpringJDBC的简单应用
此处写上应用JdbcTemplate的dao操作数据库的一些代码(含基本的增删改查,注:重点是查询出多条语句的写法): package org.sakaiproject.zhaorui.dao.impl;import java.sql.ResultSet;import java.sql.SQLException;impor…