打破深度学习局限,强化学习、深度森林或是企业AI决策技术的“良药”

算法、算力和数据是人工智能时代的三驾马车,成为企业赋能人工智能的动力,但它们自身的特性也为企业和高校在研究和落地应用过程带来了重重挑战。比如,训练算法的成本高昂,数据从采集、处理到存储已面临瓶颈,目前针对算法的加速芯片已成为硬件开发商的一大趋势。但问题是,这些加速芯片是否能对不断适应提出的新算法?在这些挑战下,降低算法成本,加速训练,推进决策,已成为所以高校、企业共同迫切的需求。
8月31日,英特尔第二期AI实践者之声夏令营活动走进南京大学。南京大学人工智能学院教授俞扬、英特尔(中国)人工智能行业客户总监孙宇和创新工场南京国际人工智能研究院执行院长冯霁围绕打破理论与实践的壁垒,助力企业高效应用落地,推动未来人工智能服务新架构等内容进行了技术分享与探讨。
提高算法效力,打破强化学习落地门槛
机器学习中一个经典的分类是监督学习、非监督学习和强化学习。监督学习是预测的过程,而强化学习即为决策的过程。现在,人工智能的识别与预测任务已经得到了广泛落地。但实际应用场景中,如推荐系统其实是一个决策过程,并非预测任务,因此系统仅有识别与预测并不够,还需要完成大量目标任务,采取一系列动作或行为使之具备决策能力。
南京大学人工智能学院教授俞扬分享了《强化学习决策》主题演讲。他谈到基于强化学习技术的人工智能系统已在围棋、视频游戏等领域展示出了可超越人类的决策能力。不过除了可以玩游戏,强化学习系统是否可以在实际应用中发挥超越人类的决策能力,帮助人们更好的解决问题?
俞扬谈到,目前除了在游戏场景,强化学习难以看到应用成果,这与决策学习算法的局限性有很大关系,算法需要和环境进行多次交互,决策过程需要海量样本,其失败的代价现实中无法承受,导致其在真实场景中很难落地。
算法效率如何提高成为该领域一大主流研究问题。经过多方尝试,南京大学与英特尔合作,将游戏当做算法的效力检验平台,通过一台服务器4个CPU48个盒子,用了4天的时间完成了很多强化学习功能,打败了内置游戏 AI bot,减少了训练所需开销,提高了效率。

零试错是强化学习在实际场景中落地难的一大门槛。俞扬认为,打破这个门槛需要提高算法效力,构建一个高精度的模拟器。让算法走出虚拟环境,需要上百年,现在我们要把现实事件虚拟化。在真实数据中还原模拟器,在不同环境中实现,产生更多的数据积累,得到泛化能力更强的模拟器。未来,他希望人工智能的决策能力可以应用于现实场景中。
从软件到硬件,英特尔助力企业人工智能落地
夏令营活动现场,英特尔(中国)人工智能行业客户总监孙宇以《英特尔人工智能战略》为题,向大家介绍了英特尔人工智能的产品、技术、相关工具以及生态环境,阐述了英特尔人工智能的发展战略。

要打破人工智能与现实的屏障,英特尔广泛的布局覆盖至人工智能应用的各方面。社区、软件与硬件是战略布局的三个重要方面。首先,英特尔需要集合各方力量培育新兴用例、吸引和培养顶尖人才,来培养生态系统并推动其发展,引领人工智能发展的前沿;其次,英特尔需要塑造开源软件堆栈,优化客户软件,构建统一的API方便开发者应使用,然后释放硬件的潜力;最后,英特尔基于广泛的数据中心基础架构,交付最佳的人工智能平台,包含拓展的CPU,完整的产品组合,高集成度的平台。
现在部署一个人工智能应用过程繁琐而复杂,从数据收集、处理、分析、训练、上线、到推理、反馈,各环节架构也不尽相同,需要消耗高昂成本,性价比不高。第二代英特尔®至强®可扩展处理器无论是加速计算、还是决策过程,都显著提升了性能;同时搭配面向多样推理的硬件组合,强大的软件工具,加速开发部署,为企业提供最高效、性价比最好的解决方案。
只有算力的提升是不够的。算力之上,英特尔也注重计算围绕的数据,打破数据从产生、处理、到存储过程的瓶颈,做到更快传输、更大存储、更全的计算。
英特尔还提供了丰富的框架库套件帮助开发者快速开发与部署。数据核心MKL-DNN,支持各种主流框架,经过优化后,开发者可以直接调用;面向ApacheSpark,有深度学习框架BigDL可以使用,训练各类人工智能任务;工具包的一部分——模型优化器OPENVINO,可用于导入经过训练的模型并将其转为中建模型。

深度森林技术,神经网络之外的里程碑式探索
创新工场南京国际人工智能研究院执行院长冯霁围绕《深度森林技术简介》进行了主题演讲,并向大家介绍创新工场的人工智能实践,以及英特尔技术如何帮助企业进行并行训练与决策。
深度森林是周志华教授在2017 年提出的一项有望探索神经网络技术之外的一项重要技术。在深入理解深度森林技术与应用之前,还要先从深度神经网络讲起。冯霁在演讲中讲到,深度神经网络主要是利用一个多层的可微分的学习器进行模型训练,但是经过这几年技术落地的过程发现,深度神经网络并不能解决所有任务,其中一个挑战就是无法很好的对离散或表格数据进行模型训练。
用一句话总结深度森林的优势就是其用不可微分的树模型,不通过BP训练,其超参数数目远少于DNN。以金融风控平台建模为例,目前仍在使用一些不可微分的数据模型。基于对这类问题的分析,对学术界来说,构建一个多层的分离器成为一个重要课题,这在工业应用中也是非常值得探索的问题。
应用方面,通过与蚂蚁金服合作构建一个用于判断交易是否是套现行为的模型,在离散数据下,使用深度森林模型的解决方案比决策树、深度学习解决方案的效果有所提升。其中,基于深度森林进行分布式学习是一个重要方法。以前大家认为只要深度学习才能进行分布式学习,而目前英特尔提供的一种高性能解决方案是基于CRADIENTBOOSTING进行多层表示学习,如果再将CRADIENTBOOSTING在拓展的CPU上集成,不仅有对表格数据的优秀的计算能力,同时对这类数据还能学习分布式表示,这也成为目前很多金融科技公司最常用的解决方案。
不过,在实际工程中会遇到既有图像数据,也有表格数据的情况,此时需要建立一个混合模型,同时又可以输出一个决策,这就让我们在构建过程中,把不同构成单元组合成混合的学习系统,这个系统可以由神经网络构成,也可以由深度森林构成,来支持对不同类型的数据进行建模。

最后他强调,对于深度森林这类较深入的技术,大家还需要考虑数据集性质本身,而在任务中采用基于决策树为构建单元的模型,可以发挥出立竿见影的效果。
AI实践者之声夏令营活动第三期——深圳站活动预告
大数据、AI时代,在实现智能化转型的道路上,各行业企业面临着海量数据处理、机器学习和深度学习技术支撑、高昂计算成本以及技术人才紧缺带来的挑战。
金融行业作为目前AI技术落地最重要的行业之一,一直在寻求可以不断提高效率、降低成本,加强数据隐私保护的生产线,这就需要开发者不断增长技能,紧跟技术发展,帮助企业解决工程实践中的挑战,从而完成转型之路。为此,英特尔将和平安科技为广大开发者们准备一场AI技术交流沙龙,帮助开发者们在企业AI转型中的最新技术,掌握核心技能。
本次技术沙龙,我们将带领开发者了解AI 技术与区块链技术、联邦学习技术在金融行业的最新应用,让开发者们掌握最新的技术与工具,更有英特尔技术专家亲自带领现场开发者进行两小时的技术实操,助力开发者炼就硬核技能。干货满满,不容错过!
扫描二维码,报名加入 AI 实践者之声夏令营,成为 AI 实践者之一!

重磅嘉宾介绍
平安科技联邦学习技术部总经理
王健宗
王健宗博士,平安科技联邦学习技术部总经理,深圳市金融智能机器人研究中心常务副主任,中国人工智能开源软件发展联盟副理事长,平安科技副总工程师,资深人工智能总监,平安联邦学习平台和AutoML平台总设计师,美国佛罗里达大学人工智能博士后,深圳市领军人才,高级工程师。现任中国计算机学会大数据专家委员会委员,高级会员,YOCSEF深圳副主席,曾任美国莱斯大学电子与计算机工程系研究员,专注于联邦学习和人工智能在金融、保险、投资、医疗等领域的研发工作,发表深度学习、云计算、大数据等领域国际论文30余篇,以及专利100多项。多届国内知名大数据人工智能和联邦学习会议出品人。
平安科技联邦学习团队资深产品总监
卢春曦

卢春曦,平安科技联邦学习团队资深产品总监,本科毕业于美国华盛顿州立大学,获得澳大利亚悉尼大学硕士学位,负责研发设计和落地多项金融保险领域人工智能产品,包括AI翻译、AI农业、联邦学习蜂巢平台以及宠物识别等。
议题:平安科技AI实践案例联邦学习
议题介绍:随着数字经济蓬勃发展,全面智能化技术正推动传统生产要素全面转向智能化生产要素,助力金融产业链加速向跨界融合、融通发展、共享共赢的生态圈演进,最终推动数字经济迈向智能经济。本次演讲从平安科技丰富的金融业务场景出发并结合实践案例,深入探究人工智能和联邦学习如何便捷高效地赋能行业发展。
Intel中国金融行业客户总监
王东方

王东方先生(Wang, Dongfang) ,现任Intel中国金融行业客户总监,负责金融、保险、证券行业11年,曾负责教育政府行业两年、IT行业从业20年,曾推进金融移动展业、金融业务创新,和金融行业客户一起共同推进了金融行业技术创新、移动业务及交叉混业业务的发展。
英特尔中国区人工智能销售经理
Leon Lu 陆礼明

拥有超过16年的行业经验。2010年加入英特尔,负责过包括PC客户端,穿戴式设备,数据中心,人工智能专用芯片等多个产品线的技术支持和市场销售工作。
议题:英特尔人工智能产品和战略分享
议题介绍:随着人工智能技术的演进,能否顺利实现方案落地成为其发展的关键。英特尔的人工智能软硬件解决方案可以帮助企业实现方案快速部署,计算资源的弹性使用,易于维护的整体方案,成熟的云服务等,最终帮助企业将人工智能方案顺利落地。
英特尔中国区平台安全产品规划总监
李志强

李志强现任英特尔中国区平台安全产品规划总监。加拿大卡尔顿大学计算机系统和安全硕士。先后任职于朗讯科技、黑莓和英特尔。在通讯和数据网络,移动安全,和芯片级平台安全方面有着近20年的产业经验。在基于芯片的端到端的平台安全架构中,从产品规划、市场拓展、实际部署等不同维度,有着业界领先的的见解和贡献。
议题:英特尔助力区块链
议题介绍:英特尔对于区块链技术一直紧密跟进。除了不断提供基于芯片的各种硬件加速能力外,还创新性地提出了可信执行环境的具体实现。这些都为区块链的研究和发展提供了底层支持。同时通过与各种区块链联盟和行业组织的协作和参与,英特尔适时地推出了先进的锯齿湖(Sawtooth)项目以及隐私数据对象架构来解决区块链在安全、隐私和可扩展性等方面所面临的挑战和机遇。
英特尔亚太研发有限公司高级技术咨询顾问
罗毅

现任英特尔亚太研发有限公司高级技术咨询顾问,主要工作为在IntelOpenVINO平台上提供各类技术方案,协助开发者完成产品研发与性能优化。曾获多项专利授权,在腾讯等头部互联网公司有多年研发经验。长期关注计算机图形学、机器视觉与深度学习等技术领域,拥有澳大利亚伍伦贡大学计算机硕士学位。
Hands on lab 环节
Intel hands on lab:从模型训练到推理,打造AI最佳落地实践
本次实操内容主要分为两部分。一是训练模型阶段,包括准备和可视化数据集、超参数调整、培训和验证。二是部署到边缘并进行推理,这一部分将介绍英特尔®OpenVINO™工具包的功能和优势,使用模式;其次是模型优化器:优化模型,为预构建和自定义模型生成与硬件无关的中间表示(IR)文件;最后是推理引擎:部署到CPU,集成GPU、FPGA和英特尔®Movidius™神经计算棒。
hands on lab 参与要求:
1、请自行携带无线上网功能的笔记本电脑+充电器
2、通用版网页浏览器
3、Intel® AI DevCloud账号(活动现场创建免费账号)
*特别福利:参与 Intel hands on lab 还可获得 Intel 认证 !

附活动详细日程
时间:9月17日 09:30 - 19:15
地点:深圳市南山区科技南十二路20号平安科技一层

点击阅读原文,报名加入AI实践者之声夏令营,成为AI实践者之一。
相关文章:

JAVA springboot微服务b2b2c电子商务系统(十三)断路器聚合监控(Hystrix Turbine)
讲述了如何利用Hystrix Dashboard去监控断路器的Hystrix command。当我们有很多个服务的时候,这就需要聚合所以服务的Hystrix Dashboard的数据了。这就需要用到Spring Cloud的另一个组件了,即Hystrix Turbine。一、Hystrix Turbine简介看单个的Hystrix D…
二维码Data Matrix的解码实现(zxing-cpp)
二维码Data Matrix的介绍可以参考http://blog.csdn.net/fengbingchun/article/details/44279967 ,以下是通过zxing-cpp开源库实现的对Data Matrix进行解码的测试代码:#include "funset.hpp" #include <string> #include <fstream> #include &…

PHP mongodb 的使用
mongodb 不用过多的介绍了,NOSQL的一种,是一个面向文档的数据库,以其方便灵活的数据结构,对于开发者来说是比较友好的,同时查询的速度也是比较快的,现在好多网站 开始使用mongodb ,具体的介绍可以网上查找。…

必看,61篇NeurIPS深度强化学习论文解读都这里了
作者 | DeepRL来源 | 深度强化学习实验室(ID: Deep-RL)NeurIPS可谓人工智能年度最大盛会。每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大会的技术往往这未来几年就会演变成真正的研…

07-09-Exchange Server 2019-配置-Outlook 2019
[在此处输入文章标题] 《系统工程师实战培训》 -07-部署邮件系统 -09-Exchange Server 2019-配置-Outlook 2019 作者:学 无 止 境 QQ交流群:454544014 MSUCDemo01 MSUCDemo02 MSUCDemo03 MSUCDemo04 MSUCDemo05 启用邮箱 MSUCDemo01i-x-Cloud.com MSUCDe…
二维码QR Code简介及其解码实现(zxing-cpp)
二维码QR Code(Quick Response Code)是由Denso公司于1994年9月研制的一种矩阵二维码符号,它具有一维条码及其它二维条码所具有的信息容量大、可靠性高、可表示汉字及图象多种文字信息、保密防伪性强等优点。二维码QR Code呈正方形,常见的是黑白两色。在3…

jQuery学习(一)
因为项目需要,同时也因为兴趣,在近一段时间研究和使用了jQuery,它真的是太强大了,代码非常的优雅和简洁,好后悔现在才开始了解它,虽然目前网络上关于jQuery的资料、学习心得,教程多得你看不完&a…

知乎算法团队负责人孙付伟:Graph Embedding在知乎的应用实践
演讲嘉宾 | 孙付伟出品 | AI科技大本营(ID:rgznai100)9月6-7日,在由CSDN主办的2019中国AI开发者大会(AI ProCon 2019)的 机器学习专场中,知乎算法团队负责人孙付伟在机器学习专场中分享了《Graph Embedding…
一维码Codabar简介及其解码实现(zxing-cpp)
一维码Codabar:由4条黑色线条,3条白色线条,合计7条线条所组成,每一个字元与字元之间有一间隙Gap做区隔。条形码Codabar包含21个字元:(1)、10个数字0~9;(2)、””, ”-”,”*”, ”/”, ”$”, .”, ”:”等7个特殊符号…

node 压缩模块速成
1. 压缩与解压缩处理可以使用zlib模块进行压缩及解压缩处理,压缩文件以后可以减少体积,加快传输速度和节约带宽 代码2. 压缩对象压缩和解压缩对象都是一个可读可写流方法说明zlib.createGzip返回Gzip流对象,使用Gzip算法对数据进行压缩处理zlib.createGu…

hadoop作业初始化过程详解(源码分析第三篇)
(一)概述我们在上一篇blog已经详细的分析了一个作业从用户输入提交命令到到达JobTracker之前的各个过程。在作业到达JobTracker之后初始化之前,JobTracker会通过submitJob方法,为每个作业都创建一个JobInProgress对象(本文以后简称…

百度无人车急刹车
导语:没人会怀疑人工智能在未来的地位,也没人会怀疑无人驾驶将改变我们的生活,但百度首次出现亏损,“现金牛”业务遭遇越发严重的挑战,无人驾驶行业的征途却越发漫长且荆棘密布,这个公司该如何走到“流着奶…

STM32中EXTI和NVIC的关系
(1)NVIC(嵌套向量中断):NVIC是Cortex-M3核心的一部分,关于它的资料不在《STM32的技术参考手册》中,应查阅ARM公司的《Cortex-M3技术参考手册》Cortex-M3的向量中断统一由NVIC管理。 (2)EXTI(外部…
一维码Code 93简介及其解码实现(zxing-cpp)
一维码Code 93: Code 93码与Code 39码的字符集相同,但93码的密度要比39码高,因而在面积不足的情况下,可以用93码代替39码。它没有自校验功能,为了确保数据安全性,采用了双校验字符,其可靠性比39条码还要高.一维码Code 39的介绍可以参考&#…

HEVC/H.265 的未来必须是使用并行处理(OpenCL?) OpenCV和OpenCL区别
1 扩展库简介OpenCV(Open Source Computer Vision Library)是一个致力于实时处理计算机视觉问题的开源库。它最初由Intel公司开发,以GPL许可协议发布,后来由Willow Garage基金会负责开发和维护,以BSD许可协议发布&…
一维码Code 128简介及其解码实现(zxing-cpp)
一维码Code 128:1981年推出,是一种长度可变、连续性的字母数字条码。与其他一维条码比较起来,相对较为复杂,支持的字元也相对较多,又有不同的编码方式可供交互运用,因此其应用弹性也较大。Code 128特性&…

21个必须知道的机器学习开源工具!
作者 | SebastianScholl译者 | 刘静,责编 | 郭芮出品 | CSDN(ID:CSDNnews)本文将介绍21种用于机器学习的开源工具。以下为译文:你肯定已经了解流行的开源工具,如R、Python、Jupyter笔记本等。但是ÿ…

eclipse中egit插件使用
2019独角兽企业重金招聘Python工程师标准>>> 这篇文章当时制作有点粗糙,建议阅读升级版:eclipse中egit插件使用--升级版 使用git作为项目的代码管理工具现在是越来越火,网上有各种各样的文章、博客、讨论,其中以命令行…
一维码EAN 8简介及其解码实现(zxing-cpp)
一维码EAN 8:属于国际标准条码,由8个数字组成,属EAN的简易编码形式(EAN缩短码)。当包装面积小于120平方公分以下无法使用标准码时,可以申请使用缩短码。依结构的不同,EAN条码可区分为:1. EAN 1…

三年、四大顶会,深度推荐系统18篇论文只有7个可以复现
作者 | 深度传送门来源 | 深度传送门(ID:gh_5faae7b50fc5)导读:本文是“深度推荐系统”专栏的第十篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文主要根据RecSys 2019中论文…

PHP教程中验证正整数is_int($value+0),为什么要这样?
2019独角兽企业重金招聘Python工程师标准>>> 最近学习PHP应用,其中有一段是要验证变量是否为正整数,除了is_numeric($value)外,还要加上is_int($value0)且($value0) > 0,为什么还要 0呢?直接验证$value不…

[给12306支招]取消车票预订-采用全额预售(充值)
为什么80%的码农都做不了架构师?>>> 取消车票预订 预订给车票销售带来的负面效应: 产生"占座", 如果用户不付款就会造成席位在支付期内无法销售.回收成本, 超过支付期需要回收车票.恶意占座, 如果恶意占座会造成大量真正要买票的客户无法购票…
一维码ITF 25简介及其解码实现(zxing-cpp)
一维码ITF 25又称交插25条码,常用在序号,外箱编号等应用。交插25码是一种条和空都表示信息的条码,交插25码有两种单元宽度,每一个条码字符由五个单元组成,其中二个宽单元,三个窄单元。在一个交插25码符号中…

微软云计算业务增长,或成全球最具价值上市公司
近日,有消息指出,微软公司在云计算业务上的豪赌正在取得回报,目前微软已超越苹果公司,成为全球市值最高的上市公司。就在几年前,这家软件制造商的市场前景还不被人看好,随着个人电脑销量的大幅度下滑&#…

激光雷达,马斯克看不上,却又无可替代?
作者 | Xingwei来源 | 辣笔小星(ID:XingweiSteven)【导读】最近Velodyne挑起的激光雷达LiDAR专利之战成为了业界热点。可以说在严苛的自动驾驶系统中激光雷达成为一种不可替代的传感器。今天让我们详细聊聊激光雷达LIDAR是怎么回事。什么是激光雷达LIDAR…

解决CSV文件中长数字以科学记数格式保存问题
今天因为需要做数据导入到数据表中,用xlxs文件做好了转化为csv文件,结果一看,傻眼了,全部变为科学记数了,在xlxs设置好的单元格格式为文本,可是转化为csv之后就变为了常规,而且也改变了。源文件…

假设检验怎么做?这次把方法+Python代码一并教给你
(图片付费下载于视觉中国)作者 | Jose Garcia译者 | 张睿毅校对 | 张一豪、林亦霖编辑 | 于腾凯来源 | 数据派THU(ID:DatapiTHU)【导读】本文中,作者给出了假设检验的解读与Python实现的详细的假设检验中的…
C++实现tar包解析
tar(tape archive)是Unix和类Unix系统上文件打包工具,可以将多个文件合并为一个文件,使用tar工具打出来的包称为tar包。一般打包后的文件名后缀为”.tar”,也可以为其它。tar代表未被压缩的tar文件,已被压缩的tar文件则追加压缩文…

HTML5的学习,各个标签的尝试
style标签的使用可以更好的改变各个标题风格 基本标签<p>,标题<h>,这里br是换行。 超链接的使用,属性href。 表格的使用table。 最后就是图片 img,和音频audio插入地址即可。 今天的学习就分享这些,谢谢大家。转载于:https://www…

Android获取内部和SDCard的存储空间
有时我们开Android项目开发时会用到文件存储或上传文件的一些操作,那么我们前提是要获取到该存储设备的大小,以方便于与我们需要操作的文件的大小做比较,如果操作的文件大小小于存储空间,那么就可以继续操作,反之则不能…