从试用到使用:计算机视觉产业新一轮发展的起步年
参加 2018 AI开发者大会,请点击官网报名
CSDN 出品的《2018-2019 中国人工智能产业路线图》V2.0 版即将重磅面世!
V1.0 版发布以来,我们有幸得到了诸多读者朋友及行业专家的鼎力支持,在此表示由衷感谢。此次 V2.0 版路线图将进行新一轮大升级,内容包括 3 大 AI 前沿产业趋势分析,10 位 AI 特邀专家的深度技术分析,15 家一线互联网企业的 AI 实力大巡展,以及 20 个 AI 优秀应用案例,力求为读者呈现更全面的中国人工智能产业发展概况和趋势判断。
V2.0 版将于 11 月 8 日举办的 2018 AI 开发者大会上正式发布,在此之前,我们将不间断公布精要内容,以飨读者。此为 V2.0 版中深度技术分析系列稿件第 1 篇,作者为 CSDN 特邀 AI 专家大华股份研发中心副总裁殷俊。
视觉是最重要的感官之一,我们通过眼睛看到大千世界,通过大脑分析看懂场景,并能回忆过往的视觉记忆。计算机视觉,就是利用电子、信息、计算机等技术,采用电子成像系统作为基础的感知单元采集视频图像,并通过信息化技术,分析并解释采集到的视频图像。计算机视觉从学术上分类,包括图像处理、模式与图像识别、事件分析、场景理解等众多图像相关的技术学科,以及计算机、信号处理、物理学、数学、生物学等多个基础学科,且随着人工智能技术的演进还在不断发展。
利用计算机视觉,我们最终期望通过技术的发展,计算机能和人一样通过视觉观察和理解世界,并且能够具备自主适应和认知环境的能力。
▌计算机视觉技术百花齐放,加速多个产业升级
深度学习是当前人工智能领域最为热点的技术之一,其发展非常迅猛,通过深度学习技术,可以在短时间内达到传统模式识别技术的性能。深度学习技术源于 80 年代的神经网络技术,最近两年的发展才真正实现大规模商业化落地,背后驱动这项人工智能技术的突飞猛进源于芯片技术发展带来的计算能力指数级提升,互联网和物联网技术发展提供了海量的数据,深度学习技术开源推动算法的快速工程化与迭代升级。
2018 年是深度学习为代表的计算机视觉技术百花齐放的元年,创业公司和成熟企业在人工智能的浪潮里相互竞争,加速多个产业的升级。在算法层面,众多创业公司推出了很多高性能的人工智能算法,成熟的行业领导企业也迅速完成了技术突破和解决方案升级;在芯片层面,创业公司和巨头企业也发布了各类神经网络的 IP 和芯片,形成 GPU、DSP、xNN、FPGA 各自发力的格局,满足边缘计算、中心计算和云计算的计算力需求。从计算机视觉应用的产业板块上分析,以视频应用为基础的视频安防、工业视觉是目前最快落地的行业,医疗、智能驾驶领域的技术正在快速发展中,未来技术突破将会产生巨大的商业应用价值。
人工智能技术和计算能力的突破势必带来产品和解决方案的全面升级,从而加速客户应用的规模化效应。我们现在在交通道路上可以看到非常多的摄像机拍摄路面的情况,这些基本都具备人工智能能力,能够对道路上车辆的行驶情况分析,比如判断是否违章。
以前要使用智能化分析交通行为,摄像机要连接到工控服务器,在服务器里部署视频处理的算法实现智能分析。直到 2007 年,以大华股份为代表的企业通过技术创新,推出了业内一体化智能交通摄像机,把当时高性能的 DSP 嵌入到摄像机,利用一台摄像机实现了交通违章和车牌识别功能,从而加速行业的快速升级和新型产品的普及。现在随着深度学习技术的引入以及芯片计算能力的革命性提升,一台交通摄像机可以处理几十种的违章行为,而且还能进一步分析行人、非机动车的行为,实现对视频的全结构化解析,这又是一次里程碑式的发展。
同样以人脸识别技术的应用为例,2017 年人脸识别技术取得关键性突破,大规模的人脸识别率达到 90% 以上,引发商业和产品化的快速落地。现在我们可以使用刷脸支付、刷脸开门、刷脸考勤等便捷的服务,我们同样可以采用这项人工智能技术实现商业的分析和数据服务。另一方面,随着产品计算能力的大幅提升,新型人工智能的一体化产品取代了传统解决方案里需要部署的一套复杂的系统。
尽管计算机视觉在深度学习技术推动下取得惊人的成果,但我们也需要清醒的看到人工智能技术还存在很多瓶颈。当前的人工智能还不够真正的智能,离机器自主认知还有很长的路要走,现有技术还只能做到高效地解决单一或特定的任务。此外深度学习算法是个黑盒子,网络内部各层的解释性差,在实际工程过中存在不可预见性,尤其是算法还无法达到普适性要求,复杂性和融合性应用带来很多误差和相互干扰。
由于深度学习技术采用的是大规模数据驱动,大规模的数据训练本身对超算中心的能力是很大的挑战,同时在实际工程化应用中场景非常复杂多变,这会出现很多无法预测的干扰数据,导致很容易计算出未知的异常结果。更为重要的是虽然人工智能已经有了非常高的性能指标,但客户对人工智能应用的期望却往往超越现有的算法表现结果,这也需要计算机视觉技术持续突破来解决的实际问题。
▌视频安防和工业视觉领域应用发展最快
2018 年计算机视觉技术在视频安防和工业视觉领域应用是发展最快的两个领域,尤其在视频安防领域,也是业内公认最适合落地的行业。安防应用的摄像机每天产生超 3000PB 的数据,这些数据里 99% 的数据都是无效的,而依靠人工智能技术可以快速对视频数据进行结构化分析,可以挖掘出其中的价值数据,进一步结合大数据技术将数据进行时空碰撞,从而实现数据关联和数据检索应用。
计算机视觉作为物联网的视觉感知和视觉认知的重要环节,除了视频安防的智慧城市和智能交通的应用外,已广泛应用于在智慧金融、智慧楼宇、智慧教育、智慧环保、智慧城管等各个采用视频应用的行业,即使是传统的视频安防行业应用也已经从安全管理延伸到城市管理、绿色出行等新型应用。
以视频结构化技术的应用为例,这是一种基于视频内容进行信息提取的技术。视频结构化解析技术实现了人、机动车、非机动车和行为的解析,其中人的基本特征包括面部、性别、年龄、身高、发饰、衣着、帽子、包、口罩、伞等;机动车的基本特征包括车牌、车标、颜色、车型车系、车贴、驾驶座人员、车饰、车窗等;非机动车的特征包括车型、颜色、非机动车牌、乘车人等;行为的基本特征包括绊线入侵、穿越围栏、区域入侵、徘徊检测、物品遗留、物品搬移、快速奔跑、打架斗殴、人员聚集等。
道路拥堵治理也是当前城市道路管理的痛点之一,人工智能技术可以发挥巨大的价值,在管理区域内的每个摄像机可以识别出视频中的人、车的行为,即时分析违章,还能获取到道路实时通行的人流、车流、密度等数据,依靠大量摄像机数据联动,结合红绿灯管理系统,对道路车辆通行按需管理并进行分流提醒,可以达到有效提升道路通行平均速度的目的。
同样在生产制造过程中,质检环节需要大量工人靠人眼去评判生产零件、整机的质量。现在计算机视觉高速发展,可以通过摄像机安装在流水线上,高帧率拍摄视频图像并实时分析零部件的表面各种工艺缺陷,例如液晶屏的划伤、裂纹,金属零件的完整性,整件安装的角度一致性等,同时还可以直接扫码,实现生产过程自动化录入。因此在工业视觉领域,随着人工智能的能力快速适配,机器开始逐步取代人工,再极大程度上降低生产成本的同时还提升了产品质量。
此外,现在在人脸识别、文字识别、物品识别、行为识别、肢体识别等各个领域都有非常丰富的应用出现,人工智能已经融入到人们的生活、出行等各个方面,比如刷脸支付、拍摄翻译、动植物分类识别、体感游戏等等。可见,视觉技术的升级和应用的拓展,将带来相关产业升级和用户体验创新。
▌计算机视觉产业新一轮发展的起步年
2017 年计算机视觉产业处于井喷期,众多的创业公司、巨头企业以及跨界公司参与到了这个产业里,各类的新技术和新应用出现在视野内。2018 年更多的是技术到产业的落地,成熟达到商用的视觉技术结合市场的需求在行业中持续开拓市场,尚在演进中的技术正在探索挖掘试点应用,一些伪智能的技术则被快速淘汰,同时学术界和工业界也在创新地研究新的技术点并寻求突破。
2018 年是计算机视觉产业新一轮发展的起步年,市场才刚刚启动,经历过去两年市场和用户认知的培养,当前业务应用开始逐步从试用走向使用,在这个过程中技术也得到持续发展,解决了试用过程中碰到的种种问题。
随着市场需求的打开,在芯片、算法、应用各个层面有了更多的企业参与。从个别的算力平台到多元化计算芯片的格局,从早期少数算法公司技术创新到当前众多成熟公司共同参与,从算法单点爆发吸引眼球到现在人工智能推动产业升级与应用融合,目前市场格局已经发生重大的转变,走向了从技术驱动型转换到应用驱动型的发展。
计算机视觉的市场规模非常巨大,这是一种推动各个产业升级的力量,我们无法单纯衡量它的市场价值。可以预见,占据应用市场以及技术领先型的公司将在未来人工智能浪潮中获取核心价值,并引领行业的发展。
▌未来 2-3 年发展趋势
展望未来 2-3 年,计算机视觉领域在技术、应用、产业各个层面必然会有新的突破。在算法方面,深度学习技术会继续发展,但可能会有新的技术方法诞生引发新的变革。芯片方面,市场上会有更多高性能低功耗的神经网络 SoC 芯片发布,同时部分固化的视觉算法会内嵌集成到芯片里。
应用方面未来应该会持续蓬勃发展,这对于企业和用户而言都是非常巨大的市场和想象空间:
首先在现有的基础上,会更贴近用户的实际使用需求,算法的迭代升级也会快速提升用户体验;
其次新算法的推出也会带来更多的应用场景和业务需求;
最后,应用的拓展将推动产业的发展,随着新一代产品和解决方案的发布和普及,更多融合型、跨界型的业务模式会产生。
当下人工智能、物联网、云与大数据、5G、云计算等主导未来的核心技术正在加速发展与演进,计算机视觉行业生态在这些技术力量的驱动下,必将形成新的技术和市场格局。
【完】
2018 AI开发者大会
2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会!是一场以技术落地为导向的干货会议!大会设置了10场技术专题论坛,力邀15+硅谷实力讲师团和80+AI领军企业技术核心人物,多位一线经验大咖带你将AI从云端落地。
更多重磅嘉宾信息,请点击官网查看。即刻购票,享7折优惠
相关文章:

被人恨,但感觉不错!
做销售四年多了,从来没有碰到目前遇到的情况,心中的郁闷,真的没办法排除,干脆写到BLOG上,也算发泄,也算记录!早两三年,一直在软件和IT服务行业打混,接触的多是企业老总&a…
android联动动画,利用 CollapsingToolbarLayout 完成联动的动画效果
最近项目中需要实现个动画效果,研究了下这里做下简单的分享.效果图如下:示例.gif最初的想法是自己去利用 Android 的嵌套滚动机制,去实现上面的嵌套滚动效果.但最后为了开发效率直接利用了 CollapsingToolbarLayout 和 CoordinatorLayout 的效果.实现效果的原理十分简单,监听 C…
波士顿动力机器人逆天,人类已无法阻挡它的三级跳!
一直刷新大众认知的波士顿动力又秀出了新花样。 如今,波士顿动力的 Atlas 人形机器人可以玩跑酷了!在该公司发布的一段最新视频中,Atlas 展示了它可以单脚越过障碍物、跳到交错的箱子上,毫不费力! 该公司表示ÿ…

自制程序清除系统垃圾文件
电脑用久了,系统分区内肯定会有很多垃圾文件,占据着大量空间,严重影响系统运行速度,这个程序能自动清理电脑里的垃圾而不会破坏系统。1. 在桌面上点鼠标右键,新建一个文本文件,把下面的字复制进去ÿ…

pylons中常用的paster命令
paster create -t pylons helloworld 创建一个以pylons为模板的项目,项目名字是helloworldpaster create --list-templates 显示当前的pylons中有多少可以使用的模板 paster serve --reaload development.ini 最常用的命令了,启动调式程序的时候都…

What-If 工具:无需写代码,即可测试机器学习模型
文 / Google AI 软件工程师 James Wexler 构建有效的机器学习 (ML) 系统需要提出许多问题。仅仅训练一个模型,然后放任不管,是远远不够的。而优秀的开发者就像侦探一样,总是不断探索,试图更好地理解自己的模型:数据点的…

linux如何安装neo4j,Ubuntu16.04 如何安装neo4j数据库
什么是neo4j数据库?neo4j数据库是图数据库的一种,属于nosql的一种,常见的nosql数据库还有redis、memcached、mongDB等,不同于传统的关系型数据库,nosql数据也有其独特之处,例如图数据库,在处理对…
MSI文件制作全过程
MSI文件制作全过程 这两天学习制作MSI文件用于组策略发布,试了一些做.MSI文件的软件包括Win2000Server光盘带的WinINSTALL LE,实际做出来的效果都不好。最后找到InstallShield AdminStudio5,用它做的MSI文件在组策略中成功发布。下面就以“石…

C语言 带比较器的归并排序
1 #include <stdio.h>2 #include <stdlib.h>3 4 typedef int DataType;5 6 //比较器7 int mycmp(const void * a, const void *b); 8 9 //int (*compar)(const void *, const void *) 函数指针 10 void Sort(DataType * arr, int from, int to, int (*compar)(cons…

iphone adb android,通过ADB获取Android手机信息
1、获取手机体系信息(CPU,厂商名称等)adbshell”cat/system/build.prop|grep”product””2、获取手机体系版别adbshellgetpropro.build.version.release3、获取手机体系api版别adbshellgetpropro.build.version.sdk4、获取手机设备类型adb-dshellgetpropro.product…

浩方平台CS流量评估
因为需要做了一次这样的简单的流量评估,就顺便拿出来给大家共享一下转载于:https://blog.51cto.com/niujh/10164

深度学习深陷可解释性泥淖,而这个研究领域正逐步焕发生机
只讲技术,拒绝空谈!2018 AI开发者大会精彩议程曝光》 福利 11月2日前购票,立享7折优惠!更有学生专享福利!扫码报名↓↓↓

php redis 安装和使用
为什么80%的码农都做不了架构师?>>> mac安装 redis $brew update $brew install redis > Downloading https://homebrew.bintray.com/bottles/redis-4. Already downloaded: /Users/lph/Library/Caches/Homebrew/redis-4.0.2.sierra.bottle.tar.gz &…

怎样在javascript函数中将变量传递给服务端脚本程序?
怎样在javascript函数中将变量传递给服务端脚本程序?(有朋友问上述问题, 愿把结论分享给大家).摘 要: 服务器端脚本运行时, 它只会解释执行<% %>或<?php ?%> 之间的脚本语句, 它会把客户端脚本视作 普通文本. 而客户端脚本运行时, 服务器端脚本又是不可见的(客…

android studio val,Kotlin学习笔记之const val与val
const的使用const 必须修饰valconst 只允许在top-level级别和object中声明,使用方式如下:const val THOUSAND 1000object myObject {const val constNameObject: String "constNameObject"}class MyClass {companion object Factory {const …

算法开发人员的安身之本:如何将机器学习与各行各业进行深度结合
只讲技术,拒绝空谈!2018 AI开发者大会精彩议程曝光》 2018 AI开发者大会 2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会!是一场以技术落地为导向的干货会议!大会设置了10场技术专题论坛&#x…

android intent email,Android Email Intent
问题Ive set up two buttons. One opens the compose sms intent and the other opens the compose email intent. The sms intent works fine but the email button doesnt respond. Ive created a categorychooser but that doesnt show up....UNTIL I click the sms buttonT…

C#实现的18位×××格式验证算法
18位标准在国家质量技术监督局于1999年7月1日实施的GB11643-1999《公民身份号码》中做了明确的规定。 GB11643-1999《公民身份号码》为GB11643-1989《社会保障号码》的修订版,其中指出将原标准名称"社会保障号码"更名为"公民身份号码"ÿ…

大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全
参加 2018 AI开发者大会,请点击大会官网 译者 | 林椿眄、Jane 责编 | Jane 出品 | AI科技大本营 【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处…

CentOS6.5下Gunicorn+Django+nginx部署的过程
2019独角兽企业重金招聘Python工程师标准>>> 本文假设你已经在CentOS下使用Python manage.py runserver 0.0.0.0:8080,能够顺利跑起来,并且被外网访问到了。项目名假设为:blog_project 安装nginx yum -y install nginx 如果安装不…

c7pro android7,三星c7pro和iphone7哪个值得买?三星Galaxy c7 pro和苹果iphone7区别对比详细评测...
三星c7 pro介绍:三星C7 Pro三星C7 Pro可以看作是去年底上市的三星C9 Pro低配版,屏幕变小了,硬件配置也有所降低,不过配备了骁龙625升级版的骁龙626处理器,硬件方面也是颇具看点的,以下是手机详细参数。三星…

NIPS2018 | 腾讯AI Lab入选20篇论文,含2篇Spotlight
1.7亿条数据,比胡同和撸串更真实的北京35岁IT老兵,转型AI,我做错了吗?厉害了,天刚一冷程序员就都换上了衬衫……如何用Python&Fabric打造区块链“淘宝”商城Python 3 字符串中的 STR 和 Bytes 究竟有什么区别&…

windows查看端口占用以及关闭相应的进程
开始--运行--cmd 进入命令提示符 输入netstat -ano 即可看到所有连接的PID 之后在任务管理器中找到这个PID所对应的程序如果任务管理器中没有PID这一项,可以在任务管理器中选"查看"-"选择列" 经常,我们在启动应用的时候发现系统需要的端…

bzoj 2730: [HNOI2012]矿场搭建——tarjan求点双
Description 煤矿工地可以看成是由隧道连接挖煤点组成的无向图。为安全起见,希望在工地发生事故时所有挖煤点的工人都能有一条出路逃到救援出口处。于是矿主决定在某些挖煤点设立救援出口,使得无论哪一个挖煤点坍塌之后,其他挖煤点的工人都有…

华为鸿蒙手机官网价格表,曝下半年华为将推出两款鸿蒙手机:国内独享,价格良心...
虽然发声表示自己将全力支持安卓系统,维护安卓生态,但又推出了鸿蒙操作系统,余承东还表示鸿蒙系统取代安卓系统只需要1-2天即可。从这番表态来看,华为应该后续是要安卓鸿蒙两手抓了。安卓系统照常使用,而鸿蒙系统也会进…

PocketPC 全屏的实现
在windows mobile 5.0中实现全屏的方法,和隐藏SIP的方法差不多,只要稍稍改一下就可以了:::CommandBar_Show(m_hWnd, FALSE);//隐藏菜单 ::SHFullScreen(m_hWnd,SHFS_HIDETASKBAR | SHFS_HIDESIPBUTTON);//隐藏taskbar与sipSetForegroundWindo…

AI时代,谈数据分析时我们要谈些什么?
参加 2018 AI开发者大会,请点击大会官网 说起数据分析,你能想到的是什么? 根据维基百科的定义,数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘…

清瘦的记录者: 一个比dbutils更小巧、好用的的持久化工具
https://gitee.com/bitprince/memory 1. 概述 1.1 连接、语句和结果集 从JDBC的规范上看,其对数据访问层有相当简洁的抽象:1、连接(connection) 2、语句(statement)、3结果集(result set)。我们对数据库做的事情无非:连接数据库,执…

html 显示消息数量,html实现消息按钮上的数量角标的实例详解
这篇文章主要介绍了html在消息按钮上增加数量角标的实现代码,需要的朋友可以参考下html代码:消息4css代码:/*角标 */.ii{display: none;background: #f00;border-radius: 50%;width: 20px;height: 20px;top: 5px;right: 0px;position: absolute;text-ali…

为什么让A.I.“顶天立地”需要6个多月?
在A.I.的发展中,专注技术or专注应用?这从来不是一道选择题。“技术顶天,应用落地,希望全社会的开发者可以和我们一起开放创新、共建A.I.生态。”2018年3月22日,在科大讯飞主办的「AI大学未来课栈上海栈」,科…