专访中国移动钱岭:大数据更像是一种“倍增器”
记者 | 杨丽
出品 | AI科技大本营(rgznai100)
为把握时代特征,2016 年中国移动确定并大力推动“大连接”战略,并制定了“十三五”时期做大连接规模、做优连接服务、做强连接应用的三个目标。如今,这家企业已经拥有 9.16 亿移动端用户、1.47+ 亿家庭宽带用户、300+ 万基站,带来的是每天超过 60PB 的网络数据和运营管理数据。
考虑到数据的价值,早在 2013 年,中国移动就开始了企业级大数据平台规划与建设,在这个基础上,2016 年中国移动启动统一的大数据 Hadoop 平台建设,总体目标是搭平台、聚数据、强管控、建生态。具体来讲,有以下四方面:搭平台,依托资源池建立集中化分布式集群;聚数据,把中国移动各省数据融合,也融合外部行业的优质数据;强管控,数据不出系统,系统不出移动;建生态,面向社会各界提供开放平台服务,共同建设面向“大连接”的大数据开放生态。
在此背景下,中国移动云计算、大数据和 IT 支撑系统的研发中心——中国移动苏州研发中心(下称“中移苏研”),从 2014 年 3 月注册成立至今,已成长为集团内部最重要的云计算和大数据软件服务平台供应商。目前,中移苏研内部大数据业务主要包含两方面:
一是为总部的 IT 系统集中化提供服务;
二是服务于中国移动省公司和专业公司,提供包括大数据咨询、建设方面的服务;同时还会将已在公司内部落地、经过检验的产品和解决方案对外输出。
在近日召开的 2018 中国大数据技术大会(BDTC)上,中移苏研首席科学家兼战略技术部总经理钱岭作为交通与旅游大数据分论坛主席出席参会,并接受了 CSDN AI 科技大本营的采访。
关于钱岭:首席科学家,中国敏捷开发十大贡献者之一。现任中国移动苏州研发中心战略技术部总经理,中国移动技术咨询委员会 IT 专家组成员。同时,兼任工信部数据中心联盟大数据促进委员会副主任委员,中国计算机学会大数据专家委员会通信委员,苏州人工智能和大数据产业联盟副主任委员。
中移苏研将为公司承建超过 2 万节点的大规模 Hadoop 数据集群,并将新型硬件用于大数据平台,以提升大数据处理速度;同时,希望通过 IT 系统自建,将总部和各省的 IT 系统做到一定程度的协同,构建全集团 1+N 大数据协同计算平台。
以下为专访内容:
1)公司对您的定位是怎样的?
钱岭:从今年起我开始担任首席科学家的职位,公司对我个人的定位是不止做管理,还要在技术方面有一些新的进展。一方面要领导公司所有部门的产品方向和战略研究方向,包括云计算、大数据、IT 支撑系统的研发与集成服务,这是公司的三个核心部门,大约有 1000 多人;同时我负责的战略技术部,也是公司战略、研发管理的重要部门。
此外,公司还有技术咨询委员会,我也参与其中。
谈商业模式:大数据更像是一种“倍增器”
2)作为电信运营商,在数据的量上掌握了一定优势。您之前提到业务模式的不同,大数据平台的应用没有得到大规模发展,那么苏州研发中心如今构建的大数据处理架构有哪些变化?
钱岭:大概在 2017 年前后,很多业界大数据领域的公司转型成为人工智能公司。一个原因就是其原先的大数据业务发展受限,数据本身不可以做交易了。
以近年来的两起重要案件——某单位销售数据被查案件、以及今年的某单位数据营销事件为例,可以看到至少有两个业务领域是不能涉足的:一是数据直接销售模式;二是用个人隐私数据做精准营销的模式。
自从 2017 年 6 月 1 日的《网络安全法》以及两高对个人隐私的司法解释出来以后,表明关于大数据的很多业务是不能做的。中国移动数据的一个特点就是会跟个人隐私相关,所以很难开展这类业务。
我们会从其他角度去思考大数据的应用出口问题:
一类是类似于为政府或行业如旅游局、国家统计局提供服务,此类应用不会非得精准到个人的隐私数据上,因此一定是可以大力发展的;
第二类数据应用就是物联网,如智慧交通。随着明年 5G 的到来,如视频、统计类的数据,涉及物体的某些信息是可以进行使用的。当然,这也要看法律的解释。
大数据未来怎么发展?为什么需要人工智能?现在“实时处理+人工智能”现在变成了数据处理的一个核心途径。
3)此前联通大数据部负责人赵越女士也提到了“海量数据处理难”的问题,结合中国移动“大连接”战略,物联网建设带来的数据量激增,对咱们的具体落地有哪些影响?
钱岭:中国移动“大连接”战略进展得很好,部分省份新增连接数实现了“物超人”,这说明物联网的连接数量发展是非常惊人的。
“物超人”之后,接下来要做的一个事情叫做“下一代网管”。这里面的第一个业务就是窄带物联网(Narrow Band Internet of Things, NB-IoT)管理系统,该项目大概做了一年,今年可以交付一个试商用版本,明年就可以商用。随着明年 5G 实验网建设的启动,像人工智能、自动驾驶、智能工厂的业务就可以接入了。
这时,数据量的激增就会比原来的窄带物联网更多,基本的趋势也是数据量会持续加大。所以我们对计算能力、数据安全、自动化智能化处理的需求是非常大的。
4)对于大数据商业模式的思考,您认为除了为公司自身业务起到降本增效的作用之外,还有哪些可以跟外部数据进行结合的点?
钱岭:我们在 2010 年就总结过大数据的几个主要应用场景,包括网络优化、决策支持、精准营销,此外还有智慧审计等应用于企业管理的场景。
如果大数据本身作为一种业务进行销售的话,风险越来越高,以后物联网可能会好一些。但大数据本身应用于业务,就是需要跟其他东西结合在一起。我们当时的一个方案叫“移动大数据+”,就是您本来已经有行业应用了,加上移动大数据的分析结果会更有用。
5)可以说中国移动当前大数据的主要应用方向是旅游和交通行业吗?
钱岭:移动的大数据应用是全行业的,不过总部大数据平台的第一项应用是旅游和交通行业。因为中国移动的大数据主要是位置类的,它的最好应用就是旅游和交通,这也是我们位置类数据的一个优势。
此外,中国移动很早就联合招商银行成立了征信公司“试金石”,服务于个人业务数据;还与德国电信成立了车联网公司“中移智行”,后来因德电撤资成为中国移动全资的专业公司。
总结起来,移动数据的独特性其实是两方面:一是位置类,二是个人的通信信息,前者可用于交通旅游,后者可面向征信。
6)那么是否可以将中国移动称为一家大数据公司?
钱岭:其实中国移动是一家“大连接”公司,因为它的主营不是大数据。马云曾给阿里定了一个目标,他说“我们现在是一家电商公司,那么我们接下来要做金融,未来可能是在大数据。”这个说法背后实际上就是看它未来带动收入的方式是否一种“倍增器”的方式。只有当一家公司的很多业务模式已经极度依赖于大数据时,它可以称之为是一家大数据公司,但前提是您的主营业务要变成这样。
目前中国移动的核心业务还是网络和通信。
7)具体到 2B 业务这块,在您看来中国移动会大致是怎样的发展模式?
中国移动的政企客户大概有几百万的数量。我们也在积极思考当中,即如何将中国移动的优势网络和通信资源和云计算、大数据融合在一起,形成粘性更强的业务。
谈人才建设:本科阶段不太适合教得太深
8)之前中移苏研的王宝晗老师也透露咱们大数据部门下设的有一个组是 AI 方向的,能否讲讲中国移动在包括 AI 等前沿技术研发方面的落地情况?
钱岭:中国移动通过研发改革,这几年成立了很多专业公司。其中,中移苏研是做基础的云计算、大数据平台和人工智能应用。这种业务模式跟以前面向省级运营的方式不同,是一种横向业务能力的打通。
目前上述所有提到的专业研发机构都会涉及到人工智能领域,包括自然语言处理、知识库、图像识别、语音识别、网络优化等。
除了完善现有的核心算法之外,更重要的是把成熟 AI 算法应用到我们的各种业务里,比如基站天线的矫正。
9)为什么选择苏州?选址上有哪些考虑?
钱岭:主要跟当地政府的优惠政策相关,苏州政府在对企业、对个人方面均提供了很好的政策,包括用地、交税、对核心员工的激励政策、购房政策等等。当然中移苏研也在帮助政府向高科技方面转型,例如,正在支持苏州申报软件名城。
同时,人才也是重要因素,尽管相比北京、南京等城市,苏州的高等院校并不多,但是苏州人杰地灵,像中移苏研就吸纳了很多来自上海、杭州、南京、北京等地想要回本地发展的人才。
10)南京大学的周志华和清华大学的孙茂松老师有过对开设 AI 课程的意见之争,放在大数据领域,您会如何鼓励学生/从业人员去学习大数据?
钱岭:我自己在清华大学求学时,本科曾上过《人工智能导论》课程,但当时还是一个比较年轻的状态,对这个技术的应用是仍是懵懂无知的。就本科阶段而言,其实是不太适合去教授过深的东西。《人工智能导论》这本书里面的几个主要算法其实还是很不错的,开拓了学生的视野。学生往往是为了考试而学,而非应用创新而学习,真正重要的想法形成,其实是在硕博期间。
在大数据领域,金字塔底部的和顶尖的人才我们都需要,关键看培养目标是什么。本科阶段教授的东西是为了让他形成固化思维,但不会有创新;更高阶段上,通过筛选,我们才把他培养成我们想要的人才。
11)中国移动是否缺乏这样的顶尖人才?我们可能会看到科学家们都去做研究、待在实验室里,反而不在企业中。
钱岭:开发人员实际上不属于科学家这个行业,但一定是培养科学家的一种很好的途径。只是互联网的泡沫经济把开发人员的价值高估了,导致软件企业无人可用。说到底,互联网永远是商业模式的创新,它没有解决核心的关键技术创新。
科学研究可以由院校承担,但是成果转化必须通过企业开展,可以看到中国被美国限制的几个领域如 CAE、工业软件、航空软件、机器人软件,为什么这么难做?因为开发人员不能只会编程,还要懂业务,懂算法和模型。这种人才无论是云计算、大数据、人工智能、边缘计算都是一样,不懂行怎么做?
中国移动正在通过研发改革,成立公司化运作的专业公司,吸引和培养顶尖大数据、人工智能人才。
12)您从 2008 年就开始参加 BDTC 大会,对此您什么想说的?
钱岭:大数据依然是个热点。重点正在朝着更多的方向发展。
回顾往期,您会发现从 2017 年起 BDTC 大会开始筹备一些比较细分的行业分论坛。其中一个变化在于,它是跟行业应用相结合的,这跟我们的关注方向也比较吻合。另一个变化则是,2014 年前后大数据主要探讨还是偏“数据湖”等技术概念的应用,这是因为当时的大数据应用还不成熟,Hadoop 能不能用还是个问题。
所以接下来会怎么走?现在已经倾向于数据管理、人工智能、数据安全等新的问题。
(*本文为AI科技大本营原创文章,转载请联系微信1092722531)
相关文章:

创业者应该如何看待金钱
什么是真正的赢?一个高智商、高情商的商人,经营企业追求的终极目标就是一个赢字:金钱、地位、豪宅、名车、美女、权利、荣耀,为了赢得这些,很多人曾不择手段,曾不断地苦苦寻找“如何以最小的投入快速获得最…

Exchange与ADFS单点登录 PART 2:部署和配置ADFS
在第一篇文章完了之后,我们就可以在我们的服务器上部署ADFS了,安装的方法很简单,直接在服务器管理器中添加功能角色即可,选择当前服务器并在服务器角色中选择ADFS。 完成之后我们需要对ADFS进行详细的配置,在服务器管理…

路由器和交换机的综合实验
路由器和交换机的综合实验<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />主要目标:1. 跨交换机(二层交换机)的相同VLAN 之间的通讯2. 不同VLAN之间的通讯1) 通过路由器实现不同VL…

如何写出符合Python审美的代码风格?
作者 | Rocky0429来源 | Python空间本文为 AI科技大本营投稿文章(欢迎给我们投稿,投稿请联系微信1092722531)写在之前每个人都有自己的代码风格,随着写的行数增加,自己对于代码的审美也会变的不一样,这就像…

程序员都该懂点 HTTP
作者:developerHaozGithub 地址:developerHaoz说明:本文主要是对 HTTP 基础知识进行总结和归纳,毕竟做 IT 的,网络这一块还是很重要的 本文的主要内容HTTP 是什么URL 详解HTTP 之请求篇HTTP 之响应篇一、HTTP是什么1、…

谁的青春不迷茫,其实我们都一样
如果你为人生画一条浅浅吃苦底线,就别妄想跨越深邃的幸福极限。在熠熠生辉前,总要捱过一段孤独不安的日子。唯有担得起厚重的经历,才能禁得起岁月推敲。记住:一定要努力,但别着急。加油! 很庆幸你能以这样好…

关于Iframe在IE6下不显示的bug
IE都出到IE8了,用IE6的人渐渐少了..但还是存在的.例如QAMM们在用. 所以,IE6下存在的问题也必须解决.这两天,我就遇到一个了: html<table> <tr> <td id"tdTest" runat"server"> <iframe id"ifrTest" h…

腾讯优图吴永坚:迈向深度学习,我们面临模型训练与推荐的双重考验
整理 | 琥珀出品 | AI 科技大本营对腾讯优图的发展历程,吴永坚表示,优图是非常幸运的,幸运的同时也知道优图选对了方向,只要坚持,还是会有收获的。12 月 15 日,以"新趋势、新技术、新应用"为主题…

JS子窗口调用父窗口中的函数
很简单只需要一句话就可以了: window.opener.changeColor(); 这里的changeColor()就是父窗口中JS的一个函数 本文转自sucre03 51CTO博客,原文链接:http://blog.51cto.com/sucre/377011,如需转载请自行联系原作者

父亲节遇上端午节,你难道不回家吗?
创业者是孤独的 他们选择了更加艰险的人生。 同时,他们又是幸运的 因为他们背后有一位伟大的父亲。 决定创业时 他说:“大胆去闯吧,有爸爸在” 创业失败时 他说:“累了就回家,有爸爸在” 简单朴实的话语包含的是无私广…

蜘蛛爬虫网络高像素图片抓取工具[搜索引擎]
ZSpider—— 是一款Photo crawler工具。主要功能:免费抓取网络高像素图片,并下载到本地。使用说明:1. 软件环境:Windows XP, 20003, Vista, 2008, Windows 7.NET Framework 3.52. 双击Spider.exe,选择菜单,…

技术流 | 手把手教你用Python设计一个命令行界面
作者 | Yannick Wolff 译者 | 刘旭坤 整理 | Jane出品 | Python大本营对 Python 程序来说,完备的命令行界面可以提升团队的工作效率,减少调用时可能碰到的困扰。今天,我们就来教大家如何设计功能完整的 Python 命令行界面。对 …
送给那些还在迷茫的人
在现在这个高节奏的高效率的时代,两级分化特别厉害。有钱的会越来越有钱,没钱的要么安于现状,要么就越来越穷。 这种思维的产生根源就是不懂得把握机会,其实机会这个东西很奇妙,有时候我们自己也能发现有个机会就摆…

cisco路由器与QOS技术
1 前言随着因特网的普及,网络和人们生活的关系愈加密切,多样化的业务(数据、语音、视频等)应运而生。通常,这些业务对于通信条件的要求各不相同:数据业务对传递的可靠性要求非常高,误码率是最重…

shell介绍,命令历史,命令补全和别名 ,通配符, 输入输出重定向
2019独角兽企业重金招聘Python工程师标准>>> shell介绍 shell是一个命令解释器,提供用户和机器之间的交互; 支持特定语法,比如逻辑判断、循环; 每个用户都可以有自己特定的shell; CentOS7默认shell为bash (…

2018年Python开源项目Top100!只在这里!
整理 | Jane出品 | Python大本营2018 年的最后一天,营长为大家新鲜出炉了一份 2018 年 Python 开源项目 Top100 清单!这些项目都是营长每月通过收集 Mybridge 的数据整理而来的,是不是很棒!(我要在留言区看到你们夸我~…

亲君圆梦,创业一起来
你想像中的创业,是不是办公地点找好了吗?需要注册公司一步一步来呢做哪个行业好呢有没有什么赚钱的项目呢没有你想的那么困难只需要一部手机发个链接点一下 玩一年 创业不花一分钱 校园创业 只需动动手指想要带你一起赚钱一起飞吗?我在厦门亲…

半途而废的香山之旅
今天终于下定决心去香山了!大清早,就和同学小燕两个人买好了路上吃的东西。顶着北京早晨凉爽但有点阻的风骑车自行车向香山的方向进发了!这是我第一次去香山,路线也只能是摸索了!我本来是准备从北四环西路一直往西骑,然…

POwershell 更改文件权限
今天需要给某个网络共享的大文件重新配置一个权限。这个文件夹下面有很多乱七八糟的小文件,很多创建人甚至已经离开公司了。如果一个个地目录手动修改所有者权限,再打开继承关系,这样比较麻烦,这个时候自然是用脚本比较方便了。 1…

“清华帮”AI造富
作者 | 马程;编辑 | 罗丽娟来源 | 全天候科技【导语】如今的AI创业者中,有一大批人出自精英汇聚的 “姚班”和清华的各个院系。他们们凭借技术傍身迅速打造出一批AI独角兽,但在发展过程中,他们又不得不面对资本的压力,…
什么时候是创业最佳时机?7个最佳的励志创业时机GET了吗
1、年轻时人们常说“出名要趁早”,创业也是同样的道理,创业越早,成功的几率就越大。年轻是一种巨大的财富,是无知和天真的完美结合,吸取经验可以作为愚蠢决定的借口。有人说,和职业篮球运动员一样ÿ…

连接ORACLE实例
public class OracleConn {public static Connection getConn() {Connection conn null;try {Class.forName("oracle:jdbc.driver.OracleDriver");String url "jdbc:oracle:thin:localhost:1521:数据库SID";String user "数据库用户名";String…

用Inno Setup来解决.NetFramework安装问题
前段时间朋友接了一个项目,具体是开发一个安装在局域网内的软件,这个软件会定时连接局域网内的服务器来更新本地客户端的一些信息,因为在局域网内存在着多种不同的Windows版本,从WindowsXP、Windows2003及Windows2008到Windows7等…
我想,有间花房
你带我走进你的花房,我无法逃脱花的清香,我不知不觉忘记了方向,你说我世上最坚强,我说你世上最善良,你不知不觉和花儿一样也许每一位 爱花的姑娘,都想有一间属于自己 的花 房 ,在悠闲的午后&…

JS重写提示框(confirm)
<script language"javascript"> /** * 功能:显示提示窗口 * 作者:申楠 qq:38371354 email:amushen1yahoo.com.cn http;//amushen.cnblogs.com * 日期:2005-10-26 * 版本:1.1 * 备注&#…

实现通用人工智能还要多久?Hinton与AlphaGo之父这样回答
作者 | Klye Wiggers 译者 | 刘旭坤 责编 | 琥珀 出品 | AI科技大本营(公众号ID:rgznai100) 人工智能(AI)在即将过去的 2018 年进展神速,取得了很多令人瞩目的成就,比如预测用户感兴趣的音乐…

SQL Server 2008备份大全实战(七)
这一篇博文探讨下SQL Server 2008 备份的实际操作,事实上SQL Server 2008并不关心数据是备份到物理磁盘上还是磁带上,在SQL Server 2008数据库备份中,预定义的目标位置叫做设备。这里设备是对硬盘,磁带机等备份存储的通称。通俗些…

一个中心、三大原则,阿里这样做智能对话开发平台
作者 | 阿里巴巴高级算法专家 李永彬(水德)整理 | 一一出品 | AI科技大本营在阿里巴巴的X峰会上,阿里巴巴-智能服务事业部高级算法专家李永彬(水德)分享了小蜜智能开发平台的构建,他围绕平台来源、设计理念…
大学生目前普遍存在的问题,看你中招了没?
大学几多歌 上课时清醒没有发呆的多,发呆没有睡觉的多,睡觉没有玩手机的多。下课时自习没有吃零食多,吃零食没有看连续剧多,看连续剧没有游戏多。吃饭时吃早餐的没有吃午餐/晚餐的多,吃午餐/晚餐的没有点外卖的多。听讲…

javascript用感
最近两天一直与javascript打交道,现在想总结下所有值处 以下类型都是自己概括别名 1.创建型 例子: var objdocument.createElement("div");//例如创建个DIV var div1document.createElement("div"); div1.id"ddv"; div1.style.w…