技术引路:机器学习仍大有可为,但方向在哪里?
整理 | CTA 直播小分队
出品 | AI科技大本营(id:rgznai100)
杭州国际博览中心,这里曾经是二十国集团领导人第十一次峰会的主场馆,5 月 26 日 CTA 核心技术与应用峰会(杭州)同样在这里正式召开!
正如 CSDN 谷磊总编在大会开幕词中讲到的,在过去 20 年时间里,CSDN 见证了技术浪潮从 PC互联网到移动互联网、大数据、云计算、人工智能、万物互联的发展阶段,也见证了一代又一代开发者从优秀到卓越的心路历程。在 CSDN 社区,大家开放共享的精神,成为后来者技术精进的阶梯。
本次大会的指导单位工业和信息化部人才交流中心的党委副书记陈新,也在讲话中特别提到数字经济人才聚集区的人才建设问题,将聚焦人工智能、大数据、云计算、物联网、VR/AR等前沿技术。工信部人才交流中心将通过整合国内外专业资源,打造数字经济人才学习交流、创新创业、合作共赢的平台,为当地数字经济产业的发展营造良好的产业发展生态。
随后,大会就进入了全天的技术风暴中,来自阿里巴巴达摩院、腾讯音视频实验室、Hulu 研究院、腾讯优图、滴滴、微博等科技公司的一线技术专家,带来了当下最新的技术成果与解读,为开发者在机器学习的研究与应用之路提供了深度、有价值的意见。接下来,就跟着营长一起回顾今天不可错过的精彩内容。
华先胜:AI技术与应用成功的关键因素是创造价值
阿里达摩院城市大脑实验室负责人华先胜指出,人工智能技术发展“泼了一盆冷水”,然后指出 AI 技术和应用成功的关键因素是创造价值:锦上添花、雪中送炭、无中生有,最后是形成商业价值。
随后,基于阿里在大规模AI应用场景的基础,他从视觉智能、视觉智造、视觉诊断和城市大脑四个层面具体讲述了以机器视觉为主的技术应用案例。以视觉搜索为例,其中的关键技术是特征学习以及索引和搜索系统,从其应用中得到启发是视觉搜索应该关注核心需求:技术至上vs应用先行、刚性需求vs锦上添花、用户先行vs数据先行。
而视觉智造的主要应用有视觉编辑(比如广告植入)、自动平面设计等。对此,他给出了实践经验:要创造一个需求(不只是来自设计师),只和行业顶尖高手合作,另外,要先关注刚性需求,而不是炫酷的技术,要用商业创新反哺技术创新。
最后,他总结了对人工智能技术实践的看法。第一,人工智能发展势不可当,进展迅猛,局限巨大,无行业不 AI;第二,不深入行业,就没有深度的AI,AI+算力+数据等于价值,要首先看到价值到底是什么;第三,人工智能发展机会非常多,要用AI做人力所不能及的事情,要让AI服务于人。
高孟平:音视频领域应用落地广泛,未来挑战同样艰巨
腾讯音视频实验室专家研究员高孟平讲述了腾讯音视频实验室的多模态机器学习技术在人眼视觉服务中的落地情况。他表示,在视频服务里有几个重要的环节,如视频理解、处理、编辑、质量评估。利用深度学习等AI技术、基于人眼视觉标准的端到端视频处理平台,在视频理解、视频处理、质量评估等三个方向有非常深入的研究。
随后,高孟平从视频、音频、图像三方面分别讲述了智能封面的架构。关于未来的工作与挑战,高孟平举了两个例子进行说明。一是 Semi-Reference Architecture,二是使用图像美学(Image Aesthetics)的通用模型,因为有些内容是无法用精彩视频描述的,如QQ音乐、K歌等,没有特定的动作。如果直接透过图像美学的评价,不用精彩视频,或许也是一个好的解决办法。
谢晓辉:推动 AI 认知,解决语义的鸿沟,需要借助知识图谱等技术
Hulu首席研究主管谢晓辉分享了视频理解在个性化推荐与内容发现中的应用,内容涉及视频理解在内容冷启动、视频精细化标签和分组、深度推荐模型中的应用等。
随后在 Panel 环节中他还提到,所有在 AI 领域深耕的人,包括 Hulu,都会发现语义的鸿沟仍然是一个非常具有挑战性的问题,这最终还需要借助知识图谱等技术,来帮助整个AI认知取得新进展。
彭靖田:TensorFlow 2.0 力图实现普惠 AI
谷歌机器学习专家彭靖田以《TensorFlow 2.0实现AI大众化》为题进行了演讲。他为大家分享到:TensorFlow 2.0 力图打造易于上手、性能强劲和灵活通用的端到端机器学习平台。通过 tf.keras 定义的高层次机器学习 API,用户可以快速验证模型效果、一键实现分布式训练、跨平台部署模型等。未来,TensorFlow 社区将持续提升用户体验,真正实现普惠 AI。
彭湃:让 AI 更有温度,“科技向善”也是使命之一
腾讯优图实验室高级研究员彭湃为大家讲述了内容审核工作中 AI CV算法的实践与应用。AI 出现之前内容审核的方式都是人工审核,人工审核一百张违规照片需要 12 分钟左右,如果是 AI,只需要 1 秒钟。而 AI 审核模型是通过深度卷积神经网络实现的,从实际业务场景中探索出双模型级联合结构——DeepEye。数据是核心弹药,如何构建符合实际需要,性价比高的数据?采用主动学习机制进行数据积累,通过数据引擎挑选出值得标注的数据。
如何把网络模型 ResNet-152 变为 ResNet-50,效率提升 2 倍,精度损失降低于 1%?在性能优化工作中设计了 Deepsmart 高效模型,采用知识蒸馏兼顾大模型效果与小模型的效率,以及有助于提升模型鲁棒性的数据扩增工作。20年后的今天,AI 带来这么多的技术的升级,“科技向善”也是 AI 的使命之一,我们 AI 从业者需要有更多的社会责任感和担当,让AI更有温度,科技向善,以人为本。
谢迪:动态恒常性是深度学习模型优化和稳定性的核心
海康威视研究院前沿技术部负责人、资深算法专家谢迪讲述了团队在完善机器学习流水线上的实践,包括信息生成(Annotation)、模型训练(Train)以及部署(Deployment)。通过分析信息初始化方法(即静态恒常性和动态恒常性)的一些特点和优势,可以得知:训练一个真正的深度网络,批量标准化是必要条件;二动态恒常性相比静态恒常性更为重要;三是相较于单个方向保持动态恒常性,在训练时保持两个方向同时保持动态恒常性,才是解决问题的关键;四是如果模型非常深,可能还需要显示对传播的信号进行调控调试。
最后,谢迪还总结了四点看法:一是在目前的深度学习框架中,模型对信息生成方式是非常敏感的;二是需要找到超越Bounding Box的更加优雅的表示方式;三是训练神经网络时,一个非常关键的因素是动态恒常性(Dynamic isometry ),它是深度学习模型优化和稳定性的核心;四是可能还需要显式对传播信号进行调制。
齐彦杰:决定 Push 效果的背后机制——博文质量、算法模型与分发效率
微博研发中心技术专家齐彦杰分享了微博基于机器学习在个性化 Push 任务中的实践与应用。微博的 Push 任务有基于热点、人物关系、地理区域、个性化信息等多种类型,齐彦杰特别针对个性化 Push 场景下的技术实践与应用、打通链路的关键技术做了详细解读。
4.6 亿 MAU 的微博是如何进行用户增长的?这不得不提个性化 Push 任务。而决定 Push 效果的背后机制则主要是博文质量、算法模型与分发效率三方面。机器学习架构自底至上主要包括基础数据、特征工程、模型服务于排序策略四层。在此架构之后,还有一个重要的技术环节——构建推荐系统,最后,通过兴趣、实时、关系与环境四个维度构建特征体系,选择拟合与用户之间的关系模型,无论是早期的 LR 模型、还是 FM 模型、wide&deep 模型我们都进行过尝试,而样本数量在其中发挥着不可忽视的作用。
熊超:对话问答通过图灵测试还有很长一段路要走
滴滴 AI Labs NLP 智能对话团队负责人熊超在分享中讲到,对话问答领域面临的最大的挑战就是图灵测试,目前的多轮对话能很好的回复问题,但并不表示完全理解了用户背后真正的意图,想要顺畅的解决特定领域的对话任务还需更长时间。
圆桌讨论:AI 如何助力认知能力,提升业务水平?
数字化信息时代,虽然所有行业都在进行数字信息化,但是却没有将其真正利用。借助深度学习的快速发展,现在大家开始试图借助 AI 技术理解真实世界。”如何利用 AI 算法认知世界“就成为了核心问题。在本次 Panel 中,各位嘉宾就将围绕这个核心问题,并结合实际的业务场景中,为大家分享 AI 技术如何赋能与真实落地场景?又面临着哪些挑战?
营长特意将圆桌讨论中每位嘉宾的精彩观点进行了摘录:
谢晓辉:所有在 AI 领域深耕的人,包括 Hulu,都会发现语义的鸿沟仍然是一个非常具有挑战性的问题。做标签会发现标签距离最终产品想要的标签,二者间语义的鸿沟很大的。最终都要借助知识图谱等技术,帮助整个 AI 认知取得下一步的进展。过去几年,AI 像脱疆的野马,快速奔跑,无论是否逼进峰值,技术的快速发展都给产业落地留下了广阔空间,未来仍大有可为!
齐彦杰:推荐系统构建于认知层之上。如何基于多模态信息理解用户是当下的一个挑战。业内现在不仅会分析文本内容,图像内容,视频内容理解也成为技术热点。当前技术飞速发展,技术团队需要随着发展做出调整,提高效率,让技术更好地落地。同时,需要知道自身数据和哪些新技术契合,才能够更高效的提升自己的业务,不被淹没在新技术的海洋之中。
高孟平:我的业务中更多的关注于视频本身的理解,如标签或者高阶语义的理解。技术进展也推动了应用的发展,提供了问题的解决方案,但是很多仍存在挑战,还有很多无法解决,如质量评估。我们的解决的思路是:先定位问题,然后寻找 AI 的解决方法,最后通过业务利用客观指标反映技术的提升效果。如果只是在某个领域里不断刷新指标,反而可能错失新领域的应用机会。
熊超:我们现在做的是智能客服,在对话问答领域面临的最大的挑战就是图灵测试,尤其是在对话非常丰富的情况下,更是一项艰巨的任务。能很好的回复问题,但并不表示完全理解了用户背后真正的意图。其次,想要顺畅的解决特定领域的对话任务还需要一个质的飞跃,也许几年、十年甚至更长的时间。
彭湃:首先,内容审核业务面临的一个非常大的挑战就是:不同的客户,因其业务的形态不同,需要过滤的规则边界也会有所差异。其次,从 To C 产品到现在助力产业互联网,会服务不同的产业客户、面临不同的需求,而这些是否都是 AI 可以解决的问题,是需要思考的。20年后的今天,AI 带来这么多的技术的升级,"科技向善"也是 AI 的使命之一,我们AI从业者需要有更多的社会责任感和担当,让AI更有温度,科技向善,以人为本。
正如谢晓辉所总结的:“未来,机器学习技术仍具有广阔的空间,大有可为”,这并不是一句简单的鼓舞人心的话语,而是在各行业技术专家、各行业的技术落地等综合考量下,深入机器学习领域本身,对未来给予的厚望。今日暴露的短板正是明日奋勇前进的方向,也更是证明了,作为中国开发者,我们想做的、能做的还很多!
最后,再次奉上本次大会官方链接,一键获取大会活动详情及部分嘉宾演讲PPT:
https://bss.csdn.net/m/topic/cta_meet/index#
(*本文为 AI科技大本营原创文章,转载请联系微信1092722531)
◆
CTA核心技术及应用峰会
◆
5月25-27日,由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开,峰会将围绕人工智能领域,邀请技术领航者,与开发者共同探讨机器学习和知识图谱的前沿研究及应用。
更多重磅嘉宾请识别海报二维码查看。CTA 主会议已经开始,第二日论坛少量余票即将售罄,欢迎点击阅读原文购票参会!更多详细信息15101014297,备注“CTA”,了解票务以及会务详情。
推荐阅读
色情低俗、暴力恐怖内容...如何用AI“一网打尽”?
找啊找啊找木偶,图灵奖得主G. Hinton第一篇论文曝光!
权威解读 GitHub、Apache 疑云:主流开源软件究竟是否会被闭源?
Kaggle季军新手笔记:利用fast.ai对油棕人工林图像进行快速分类(附Python代码)
程序员连拿3份Offer,每份高达45K?他说做对了这些!
ARM到底是一家什么样的公司?
为什么你写了一万小时的代码,却没能成为架构师?| 程序员有话说
别怀疑,孩子在家里也能学编程!
百花村区块链山的选民们, 超有趣!
点击阅读原文,了解「CTA核心技术及应用峰会」
相关文章:

基于GTID模式MySQL主从复制
基于GTID模式MySQL主从复制 GTID复制原理:基于GTID的复制是MySQL 5.6后新增的复制方式GTID (global transaction identifier) 即全局事务ID, 保证了在每个在主库上提交的事务在集群中有一个唯一的ID.在原来基于日志的复制中, 从库需要告知主库要从哪个偏移量positio…

NET Framework 2.0中的数据访问新特性
1异步数据访问 a)支持异步数据编程 b)SqlConnection – BeginOpen – EndOpen c)SqlCommand – BeginExecuteNonQuery – BeginExecuteReader – BeginExecuteXmlReader – EndExecuteNonQuery – EndEx…

【网络】通讯名词解释:带宽、速率、波特率、奈奎斯特定律、香农定理
1、带宽 1.1 解释一 带宽,又叫频宽,是数据的传输能力,指单位时间内能够传输的比特数。高带宽意味着高能力。 数字设备中带宽用bps(b/s)表示,即每秒最高可以传输的位数。 模拟设备中带宽用Hz表示,即每秒传送的信号周期…

这可能是最全的机器学习工具手册!
作者 | 红色石头转载自 AI有道(ID:redstonewill)工欲善其事必先利其器!之前我也断断续续给大家发文整理过一些关于数据科学,尤其是机器学习、深度学方面的速查手册!但是,每次分享的都比较是针对某一块的内容…

保持分布式团队同步
分布式团队最大的挑战是沟通,这对建立协作的基本原则必不可少。调整工作时间,互相适应,而团队联络员有助于沟通和同步工作。以信任、尊重和开明为基础的团队会鼓励组织中的人们互相帮助,培养一种使团队保持同步的文化。\\SkuVault…

Word2010开发——操作文档
参考: http://blog.csdn.net/akipeng/article/details/6534375 http://www.haogongju.net/art/19029 首先建立一个Word外接程序(Word AddIn)(家里的Vs竟然是中文版,汗!) 接着在项目中新增项&…

【驱动】ubuntu安装内核头文件
1、检查是否已经安装 使用dpkg-query命令检查是否有可用的内核头文件。 $ dpkg-query -s linux-headers-$(uname -r) 如果输出显示install ok installed说明已经安装成功 Package: linux-headers-4.15.0-142-generic Status: install ok installed2、安装内核头文件 $ sudo…

嫌Terminal终端太单调?快收下这几个有趣的改造工具!
整理 | Rachel责编 | 琥珀出品 | AI科技大本营(ID:rgznai100)【导语】Terminal(终端)是程序员常用的工具之一,常用于系统的相关配置修改。系统自带的 terminal 较为简单,很多 Github 的开源项目都尝试对终端…

关于matlab向文件写入数据的方法——留着备用
MATLAB数据采集的时候,往往需要把得到的数据保存下来。 fid fopen(文件名,‘打开方式’); 说明:fid用于存储文件句柄值,如果fid>0,这说明文件打开成功。打开方式有如下选择: ‘r’ÿ…

js在页面滚动到一定位置时触发事件?
function getTop(e) {var offsete.offsetTop;if(e.offsetParent!null) //只要还有父元素,也就是当前元素不是根节点就继续往上累计元素的高度offsetgetTop(e.offsetParent);return offset; } var myBlockTop getTop(document.getElementById("homepageBanner")); va…

【C语言】学习笔记3——字符串
1. 字符串(charcacter string)是一个或多个字符的序列 2. C语言没有专门用于存储字符串的变量类型。字符串都被存储在char类型的数组种。 3. 数组由连续的存储单元组成,字符串种的字符被存储在相邻的存储单元中, 每个单元存储一个…

Facebook 的AI翻身之战!
作者 | Michael K. Spencer译者 | 王艳妮,责编 | 屠敏出品 | CSDN(ID:CSDNnews)Facebook最近举办了F8会议,这是了解这个平台未来发展的绝佳机会。 F8是Facebook的年度开发者大会——一个为期数日的活动,期间…

【Linux驱动】ThinkPad笔记本wifi模块rtl8821ce在ubuntu16.04的驱动(默认没有)
0、wifi模块型号 在win10下设备管理器中查看,型号为:Realtek 8821CE Wireless LAN 802.11ac PCI-E NIC 1、问题描述 在ThinkPad上安装win10ubuntu16.04双系统后,在win10下wifi可以正常使用,但是在ubuntu下没有wifi列表。 2、…

关于Linux的inode和dentry的一组文章
先mark一下,有时间再看。 http://www.ruanyifeng.com/blog/2011/12/inode.htmlhttp://teaching.idallen.com/dat2330/04f/notes/links_and_inodes.htmlhttp://www.thegeekstuff.com/2012/01/linux-inodes/http://blog.chinaunix.net/uid/7828352/frmd/-1.htmlhttp:/…

为什么Rust连续4年获“最受喜爱编程语言”?
作者 | Mike Tang责编 | Aholiab出品 | 区块链大本营(blockchain_camp)2015年5月15日,Rust编程语言核心团队正式宣布发布Rust 1.0版本。4年来,它优雅的解决高并发和高安全性系统问题的能力,受到了越来越多开发者的喜爱。并且连续4…

【Windows】清除win10开始菜单中失效打程序标签
1、问题描述 安装新版本Qt程序,卸载旧版本Qt后,在开始菜单中,还有残留,但是已经失效,需要删除这些失效的程序标签。 2、显示隐藏文件夹 打开此电脑——查看——勾选“隐藏项目”: 3、删除失效的程序标签…

解析equals(Object obj)和compareTo(T obj)
背景:最近在研究静态扫描的东西,遇到一个规则:"equals(Object obj)" should be overridden along with the "compareTo(T obj)" method 然后就想深度扒一扒equals和compareTo有什么区别 1.java.lang.Object是所有类的父类…

安装和部署Exchange Server 2007
为什么Exchange Server 2007使用服务器角色? 简化部署和管理 增强可扩展性 改进安全性 见下图:什么是邮箱服务器角色? 邮箱服务器角色: 存储用户邮箱和公共文件夹 通过群集, LCR, CCR实现高可用性 并不在邮箱之间转输邮件邮箱服务器: 不应该能从Internet直接访问 必须是活动…

AI时代,中国技术创新如何弯道超车?
2019 年 5 月 26 日 - 27 日,杭州国际博览中心,由工信部人才交流中心指导,CSDN 和数字经济人才发展中心主办的 CTA 核心技术及应用峰会圆满落下帷幕。本次大会聚焦机器学习、知识图谱等 AI 领域的热门技术,关注技术在行业中的实践…

【TX2】英伟达Nvidia TX2连接蓝牙设备
1、问题描述 买了一个蓝牙键盘(航世B.O.W 折叠键盘HB099,200大洋),尝试在连接TX2的蓝牙,试试好使不 2、安装蓝牙 Blueman 是一个适合在 GNOME 桌面环境使用的图形化蓝牙管理工具。 sudo apt-get install blueman b…

usermod
功能说明:用于修改系统已经存在的用户账号信息。 参数选项:-c comment 修改用户password文件中用户说明栏,同useradd -c功能。-d home_dir 修改用户每次登入时所使用的家目录,同useradd -d功能。-e expired_date 修改用户终止日期…

asp.net 获取当前时间的格式
在平时的编程中,经常会用到获取当前的系统时间,格式也很特定,今天就把一些格式整理了一下,贴出来,以便以后的使用。 //获取日期时间 DateTime.Now.ToString(); // 2008-9-4 20:02:10 DateTime.Now.ToLocalT…

史上最大规模ACL大会放榜,百度10篇NLP论文被录用!
近日,自然语言处理(NLP)领域的国际顶级学术会议“国际计算语言学协会年会”(ACL 2019)公布了今年大会论文录用结果。根据 ACL 2019 官方数据,今年大会的有效投稿数量达到 2694 篇,相比去年的 15…

【Ubuntu】安装Ubuntu+Win双系统后,每次开机默认是进入Ubuntu,如何设置成默认进入Win?
1、问题描述 安装UbuntuWin双系统后,每次开机默认是进入Ubuntu,如何设置成默认进入Win? 2、解决方法 1)记住开机选择中windows 10是第几个,从0开始记,如下图本人的是4 2)进入ubuntu系统&am…

MFC 多线程及线程同步
一、MFC对多线程编程的支持 MFC中有两类线程,分别称之为工作者线程和用户界面线程。二者的主要区别在于工作者线程没有消息循环,而用户界面线程有自己的消息队列和消息循环。 工作者线程没有消息机制,通常用来执行后台计算和维护任务&…

太火!这本AI图书微软强推,程序员靠它拿下50K!
如何能够短时间内抓住技术重点,集中突击?如何不在惧怕“算法”?如何才能在面试中对答如流,打造属于自己的“offer收割机”?也许这本书——《百面机器学习 算法工程师带你去面试》就能帮你实现!《百面机器学…

【Qt】错误处理:error: undefined reference to `qMain(int, char**)‘
1、问题描述 在一次编译Qt项目时,报错 H:\Qt\Qt5.14.2\5.14.2\mingw73_32\lib\libqtmain.a(qtmain_win.o):-1: In function `WinMain@16: C:\Users\qt\work\qt\qtbase\src\winmain\

Android WebView与ViewPager的滑动冲突分析
前言 如题所述,我使用的架构是ViewPagerFragmentWebView进行开发的,由于WebView的html页面代码是第三方的,这里不好放出来,所以只能放一个大致的架构图,如图所示,ViewPager包含了两个fragment,可以左右滑动…

关于outlook2010帐户设置
安装了office2010后,首次使用outlook,关于帐户设置,以qq邮件为例 开启imap服务2.打开outlook2010软件 由于有文字限制,其他的图解请链接http://wlinfang.blog.51cto.com/2961560/902193转载于:https://blog.51cto.com/wlinfang/90…

如何构建可解释的推荐系统?| 深度
作者 | gongyouliu来源 | 大数据与人工智能(ID:ai-big-data)推荐系统的目标是为用户推荐可能会感兴趣的标的物。通过算法推荐达到节省用户时间、提升用户满意度、为公司创造更多的商业价值的目的。要想达到这个目的就需要让用户信任你的推荐系…