5分钟速通 AI 计算机视觉发展应用
作者 | 李秋键
出品 | AI科技大本营(ID:rgznai100)
计算机视觉是进步最大、发展最快的领域之一。根据 Global VIEW 的研究,全球计算机视觉市场规模在 2020 的价值为 113 亿 2000 万美元,预计从2021 到 2028 的复合年增长率为 7.3% 。人工智能计算机视觉的使用案例几乎不计其数,其中最受欢迎的是无人机以及自动和半自动车辆。今天小编带大家几分钟速通 AI 计算机视觉发展应用。
应用前景
(1)物流:
利用计算机图像识别、地址库、合卷积神经网提升手写运单机器有效识别率和准确率,大幅度地减少人工输单的工作量和差错可能。
(2)肺部疾病影像诊断:
使用图像分割算法对肺部扫描序列进行处理,生成肺部区域图,然后根据肺部区域图生成肺部图像。利用肺部分割生成的肺部区域图像和结节标准信息生成结节区域图像,对基于CNN的肺结节分割器进行训练,然后对图像进行肺结节分割,得到疑似肺结节区域。找到疑似肺结节后,使用3D CNN对肺结节进行分类,得到真正肺结节的位置和置信度。
(3)垃圾桶智能监护:
首先,摄像头拍摄垃圾照片,并将照片上传至信息处理器,信息处理器对照片识别后,对垃圾进行分类;然后生成分类结果,再将结果发送到信号灯指示器;最后,对应的垃圾类别的信号灯就会亮起,提示人应该投入哪个投放口。需要注意的是,垃圾桶应配备传感器和感应开关,并且应当设置在垃圾桶外壳与投放口相对应的位置。显示屏最好选用触摸屏,便于用户操作和调整设置以及控制摄像头。
(4)交通:
(一)用于自适应信号控制机检测
1. 对车辆的检测
无论是针对全感应信号控制机还是半感应信号控制机,图像识别技术可以实时检测主干道或次干路车道上的车辆到达和排队情况,并可通过算法分析,对交叉口信号控制机进行实时数据更新,以保证最优算法,提供通畅的交通条件,在一定程度上避免了上下游交通拥堵。
2. 对行人的检测
在城市化建设的重要发展中,CBD商业步行街越来越彰显一个城市的文化精神之地,但大部分的商业街都是开放性的,如成都宽窄巷子等,这些旅游热点,往往是人潮拥挤,将其感应控制理念用于该交叉口的信号控制机,即采取车辆相位的最小绿灯时间和行人相位的最大绿灯时间,会大大提高行人和车辆的有效绿灯时间,并使得行人与车辆有序、畅通、安全地进行交通组织。而识别技术可以作为决策最小和最大绿灯时间的“发现者”;它可以在半感应控制系统中实时检测出车辆,并最大化地疏通行人;或在全感应控制系统中将两相行人流量和车辆流量反馈给信号控制机,从而优化交叉口的信号相位,达到确保行人、车辆的有序安全组织。
(二)用于潮汐车道的自适应检测
随着现代化都市工作节奏的加快,城市的交通流形成了周期性、潮汐性的现象;而潮汐车道应运而生,但面临波动的车流和交通区位的不同,为了保证潮汐车道的连续性,现有的潮汐车道都是稳定的时间点变化,即在规定时间内,该车道是上行还是下行方向,这样的设定时段式控制法,不具灵活性,由于早高峰和晚高峰具有不同集群的特点,因此忽略了交通的动态变化性这个特点。
根据大城市多具有放射环状式路网布局的特点,采用识别技术在城市中心多个射线沿路上的交叉口进行采集点布局,将上游路段实时反馈给下游,再结合电子屏实时信号控制,充分发挥潮汐车道的机动性,在时间上给予车流最大节省,从而缓解城市的拥堵,尤其是高峰期的拥堵。
(三)用于无人驾驶场景下的检测
随着人工智能的发展,无人驾驶在国内也得到了多个科研机构和大型企业的进一步探索,而试运车也在上海广州等地正式上路,这说明无人驾驶时代即将在不远的将来走进人们的生活,而面对如此复杂的交通环境,尤其是城市交通,要保证慢行交通尤其是步行者——人的安全,就要充分发挥无人驾驶各个传感器的综合优势,而摄像头作为其环境感知部分的重要部分之一,将深度学习和机器视觉同时融合,让无人车辆在上路前学会大量的城市场景储备,同时识别技术在无人驾驶车真正路用时发挥其作用,辅助车辆精准判别各类复杂的交通场景,并相应的给出决策行为。
(5)纺织品及服装:
纤维及织物组织识别
纺织阶段,图像识别技术可用于识别区分各类纤维及其织物,还可用于原棉加工前识别非棉杂质。对于织物组织结构,针织物中对纬编组织的研究较多,如对其编织周期的识别及组织结构的编码分类等。机织物中目前能够识别出织物中的三原组织;还可辅以亮度累加法检测分割经纬纱线、定位组织点,用于计算纱线密度和组织点的自动分类。但由于织物组织结构复杂多样,即使是人工识别,若非专业人士也难以轻易辨认,因此目前大多相关研究还停留在人工与计算机交互操作提取特征进行识别,难以大范围推广。
织物疵点检测
织物疵点检测经过十数年的发展,已基本能完成疵点判别、疵点分割、疵点分类等功能,并应用于工业。识别准度是其中较为重要的验收指标,但在保证准度的前提下,识别速度也需逐步提高,目前疵点在线监测的速度要求一般高于60 m/min,检测的疵点最小尺寸为0.5 mm。近年进展多为提高精细度及速度、扩展识别疵点类别及检验规范化等,还有部分学者在对织物褶皱及折痕的研究中也使用了图像识别相关技术,提出多视域织物外观平整度客观评级方法,尝试让机器判断织物平整度并验证,为织物表现性能的评估提供了有效的解决方案。
面料检索
面料图像的商业价值和大众使用率较高,消费者和生产商都有挑选符合自己预期面料的需求;且面料图像的颜色、纹理、形状等底层特征相对较为简单明晰,易于被计算机提取和区分。计算机除了能够通过对比面料图像实现相似面料的检索之外,还可基于对部分特征明显的面料进行感性属性定义,实现对面料的主观情感标注。如分析面料颜色的饱和度、对比度、色彩关系及纹理、图案等,人工将客观指标归纳至感性认知,用于面料检索和推荐。但目前的面料检索研究样本仍较为单一,多为同类面料不同色彩,或同类面料不同图案的研究,且人工定义情感属性局限较大,可尝试多维度多分类研究。
服装领域
服装领域中,对人体体型及服装款式图、样板图的识别多为服装院校和服装专业研究者完成;而计算机、信息技术领域等学者通常从识别服装实物图、着装图入手,对相关图像进行识别、检索、分割、分类及标注等。
人体体型识别
人体是服装的基础,服装的智能化生产离不开对个体体型的研究及描述。对人体体型的研究多基于来源于二维测量或三维人体扫描的数据,但就图像识别技术发展以来,也渐有学者致力于对图像信息的分析以识别体型。一般是对人体二维照片进行预处理后提取轮廓曲线,再用一定的描述方法对曲线分类、以达到对体型分类的目的。
服装款式图与样版图识别
关于服装款式图,可运用shock graph技术提取形状特征再对其分类;对于样版图,可对样版边缘进行识别,在样片文件中储存缝纫信息以用于自动缝纫技术。但服装行业中的款式图风格不一,还未形成一个统一规范作为分类标准;且shock graph一般用于进行形状外轮廓的识别与匹配,不包括内部细节,无法作为样版库的检索依据。需求方面,对服装款式图与样版图的识别需求较小;识别难度方面,服装款式图和样版图像只包含黑白二色及线条,无颜色和纹理特征,就发展现状而言识别难度较实物图高,需要对比不同的图像识别模型和方法,综合选择最合适的方案
服装着装图检索分类
服装图像识别可分为对服装廓形、尺寸的识别,及服装分类、检索和标注。服装廓形的识别中,一般先在人体着装照片以人脸或人体肤色为参照来确定照片中的服装,再对服装扫描识别特征点、获取数据,由人体身高比例或其他公式自动计算测量服装廓形相关尺寸,以此定义照片中的服装廓形。借助计算机可实现部分服装实物图的尺寸及尺码测量,但仍有较多人机交互工作量。
(6)安防领域的实践应用:
安防是每个行业都比较重视的问题之一。安防领域,计算机图像识别技术应用广泛,比如当前很多城区和街道都安装了监控,主要目的是发生事故时,可以准确查找相关资料和图像,为事故判定提供有效依据。现如今,我国大多数地区都已完成了自动化视频监控,这是图像识别技术处理应用实践的一个方式。将识别技术与安防结合,可以最大限度减轻人工劳动力,提升工作时效性,为事故纠纷提供有效依据。
(7)农业领域的实践应用:
我国是一个农业大国。近年来,我国在农业中时常引进现代技术,培养农业植物实验和新品种种植试验都融合了现代图像识别技术,以此观察植物的生长情况,从而确定影响植物生长的因素。此外,图像识别技术可鉴定农产品最终质量,为农业发展提供相关依据和指导。
(8)工业领域:
工业领域,图像识别处理技术有非常多应用。它大大提升了工作时效性,比如自动装配中的质量检测、流体力学的阻力分析、自动分拣、识别排列状态以及设计、制造视觉效果等。其中,值得一提的是研究具备感官功能的机器人,给工业生产奠定了基础。
(9)航空领域:
计算机图像识别处理技术在航空领域的应用,除了处理月球表面和火星图片外,还有遥感技术等。经过空中图像处理,如将数字化数据转为相应信号并存入内存,当卫星经过地面上空时,高速传送图片,由处理中心解析。这些图像无论是储存、传输还是成像判读,都必须采用数字图像识别技术。现如今,世界各个大国都使用卫星获取所需图像资源,例如灾难检测、地质勘探、农城规划等。数字图像识别处理技术在天象预报和其他星球研究中发挥了重要作用。
(10)通信领域:
现如今,通信行业的主要发展目标是融合声音、文字的通信。其中,图像通信是最复杂的技术领域。图像数据量较大、较广,目前智能电视机信号传输必须达到100 M/s以上,想要把输送高速数据,必须使用编码技术压缩信息量。
(11)军事领域:
军事行业,图像识别处理技术主要分布在导弹、照片解读、具备图像传输的自动化军事系统等。目前,公安系统融入了图像识别技术,主要应用于人脸识别、图片复原等方面,例如常见的高速公路不停车收费技术是图像识别技术的应用成果。
图像识别算法
(1)基于度量学习核函数的图像识别算法:
通过马氏度量学习对光学足迹图像训练样本特征进行学习得到最优的度量矩阵,从而构造度量学习核函数,在该核函数下再使用SVM进行分类识别.
(2)基于单步目标识别架构的轻量级裂纹图像自动识别:
单步识别算法,相比于两步式识别算法主要优点在于能够提高检出速度与降低对硬件使用的负载,通过合理地网络设计能够提高结构视觉检测工作的效率与质量,最终实现其自动化。SSD算法包括以下组成部分:用于特征提取的Deep CNN(也称为基础网络,即Basenet)、特征层集合(Feature Layers)、识别分类器(Classifier)、非极大值抑制(Non-Maximum Suppression,NMS)。
(3)改进Mask R-CNN的火焰图像识别算法:
基于改进Mask R-CNN的火焰图像识别算法,算法在Mask R-CNN的基础上,在特征金字塔引入一条自下向上的特征融合,同时改进了损失函数,使边框定位更准确。
(4)基于RGB颜色空间:
根据机场跑道路面上鲜明的颜色特征,采用抗噪性能好、识别速度快、识别精度高的RGB颜色空间识别方法进行黑色胶痕的识别。
(5)基于稀疏表示和多特征融合的 SAR 图像识别:
当采用稀疏表示进行 SAR 图像目标识别时,可采用的特征包括灰度特征、局部特征(HOG 特征)及基于信号变换提取的特征(单演信号特征)等。进行多特征融合时,主要采用基于联合稀疏表示的识别方法
(7)基于边缘学习的低分辨率图像识别算法:
提出了一种基于GAN结构的边缘学习低分辨率图像识别算法,将通过生成网络学习到的低分辨率图像的幻想边缘信息融入到识别网络中,得到清晰的特征图纹理轮廓,从而丰富了低分辨率图像的高频信息
(8)基于方向梯度直方图和灰度共生矩阵混合特征的金文图像识别:
用HOG提取金文的全局结构特征,用GLCM提取金文的局部纹理特征,并将两者进行融合,对金文的特征描述更为全面。最后选取支持向量机(SVM)分类器对金文图像进行分类识别
(9)基于WGAN的图像识别方法:
在GAN的生成器和判别器中加入了相同的类别标签,指导样本的生成,使GAN具有了生成多类数据的能力。
(10)传统算法:
机器学习算法K最邻近(K-NearestNeighbor, KNN),支持向量机(Support Vector Machine, SVM)和多层感知机(MultilayerPerceptron,MLP)等,以及近几年比较热门的基于深度学习和卷积神经网络(Convolutional neural network, CNN)的图像识别算法。
深度学习模型包括深度信念网络(Deep Belief Network, DBN)、卷积神经网络(CNN)、循环神经网络(Recurrent Neural Networks,RNN)等。这些模型通过构建一个更深层次的网络,在此基础上由计算机学习得到图像更深层次的特征信息以及数据隐含的内部关系,使学习到的特征更具有表达能力,从而分类更加准确。
基于特征匹配的,比如 ORB、SIFT+SURF等等。
传统图像分割方法
基于阈值的分割方法
基于边缘的分割方法
基于区域的分割方法
基于聚类分析的图像分割方法
基于小波变换的分割方法
基于数学形态学的分割方法
基于人工神经网络的分割方法
以上就是给大家整理的AI计算机视觉发展的应用,图像识别算法以及传统图像分割的一些方法,小伙伴们可以自取呦~
李秋键,CSDN博客专家,CSDN达人课作者。硕士在读于中国矿业大学,开发有taptap竞赛获奖等。
相关文章:

javascript解析json
下载json库 http://www.json.org/json-zh.html自己找javascript的 或者直接去下面的 https://github.com/douglascrockford/JSON-jsphp生成json格式使用页面 <script src"scripts/json.js"></script>alert(data.toJSONString());如果返回false说明没数据…
高德联手凯迪拉克 发布全球首个高精地图应用
6月13日,在CES ASIA活动现场,上汽通用汽车凯迪拉克超级智能驾驶系统(Super CruiseTM)在国内首发亮相,未来将搭载在凯迪拉克CT6 40T铂金版车型上推向市场。高德地图作为上汽通用汽车在华合作伙伴,将为超级智…

WinDbg安装与使用
WinDbg是微软发布的一款相当优秀的源码级(source-level)调试工具,可以用于Kernel模式调试和用户模式调试,还可以调试Dump文件。 主页:http://msdn.microsoft.com/en-us/windows/hardware/gg463016 下载链接:http://msdl.microsoft…

mysql-5.6 升级 5.7
#准备工作 1、停机 [rootlocalhost local]# /etc/init.d/mysqld stop Shutting down MySQL.. [确定]2、切换版本 [rootlocalhost local]# mv /root/mysql-5.6.27-linux-glibc2.5-x86_64.tar.gz ./mysql-5.7 [rootlocalhost local]# ln -s…

让假图无所遁形,阿里篡改图像检测大赛集结号令打响
近年来,伴随多媒体技术的迅速发展,图像安全隐患随之而来。一些不法分子通过伪造或恶意篡改证件、政府文件、转账记录截图等方式,不仅进行诈骗活动,还带来一些社会问题:2 月 10 日,广西柳州融水苗族自治县赵…

Apache网页优化之网页压缩
Apache网页压缩技术 实验介绍:本实验在虚拟机的Linux系统上搭建http-2.4.2,并在配置过程中开启mod_deflate模块,实现网页的压缩功能,最终通过fiddler抓包工具,验证mod_deflate压缩是否生效。 1、首先将搭建httpd服务所需要的软件包…

推荐阅读的多核编程技术书籍
多核编程技术好书推荐 多核程序设计技术——通过软件多线程提升性能 , 作 者: (孟加拉)阿克特(Akhter,S.),(美)罗伯茨(Roberts,J.) 著…

zabbix监控windows(03,08)
监控windows主机:下载zabbix_agents_2.2.3.win.zip (zabbix官网下载)解压文件,把对应的文件(32位或者64位)考到C盘根目录(对应目录就OK)并带配置文件;编辑配置文件:zabbix_agentd.win.confLogFi…

Dubbo原理何源码解析之服务暴露
2019独角兽企业重金招聘Python工程师标准>>> 一、框架设计 在官方《Dubbo 用户指南》架构部分,给出了服务调用的整体架构和流程: 另外,在官方《Dubbo 开发指南》框架设计部分,给出了整体设计: 以及暴露服务…

维基百科上的算法和数据结构链接很强大
突然发现维基百科上的算法和数据结构比百度百科强多啦,图文并茂。 其实这个网站不错:http://www.sorting-algorithms.com 冒泡排序: bubble冒泡的意思http://zh.wikipedia.org/wiki/%E5%86%92%E6%B3%A1%E6%8E%92%E5%BA%8F-------------------…

基于 OpenCV 的图像阴影去除
作者 | 努比来源 | 小白学视觉我们经常需要通过扫描将纸上的全部内容转换为图像。有很多在线工具可以提高图像的亮度,或者消除图像中的阴影。但是我们可以手动删除阴影吗?当然可以,我们只需要将图像加载到相应的代码中,无需任何应…

not exists 跟not in 纪念一下
转载于:https://www.cnblogs.com/zzzzw/p/4973378.html

jquery $.proxy使用 Jquery实现ready()的源码
jquery $.proxy使用 在某些情况下,我们调用Javascript函数时候,this指针并不一定是我们所期望的那个。例如: 1 //正常的this使用2 $(#myElement).click(function() {3 4 // 这个this是我们所期望的,当前元素的this.5 6 $(…

PHP session回收机制
由于PHP的工作机制,它并没有一个daemon线程,来定时地扫描session信息并判断其是否失效。当一个有效请求发生时,PHP会根据全局变量 session.gc_probability/session.gc_divisor(同样可以通过php.ini或者ini_set()函数来修改&#x…

WPF学习拾遗(二)TextBlock换行
原文:WPF学习拾遗(二)TextBlock换行下午在帮组里的同事解决一个小问题,为了以后方便,把就把它收集一下吧。 新建一个TextBlock作为最基础的一个控件,他所携带的功能相对于其他的控件要来的比较少, 比较值得…

Meta 开发 AI 语音助手,用于创建虚拟世界和实时翻译
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) Meta 在近日的「用人工智能构建元宇宙」的讨论会上,展示了最新的 AI 黑科技 「Builder Bot」 ,并且在此次会议上 Meta 公布了关于构建元宇宙的人工智能计划,其中包括…

MySQL的基础
2019独角兽企业重金招聘Python工程师标准>>> 数据库和SQL 什么数据库 数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务。 什么是SQL 结构化查询语言(Structured Query Language)…

Python:Bug 官网不要了,全迁去 GitHub
近几年,GitHub 开发者数量逐年上升,仅过去一年 GitHub 的新增用户便有 1600 万人,总用户数更是达到了 7300 万——在开源浪潮席卷全球中,GitHub 无疑成为了许多开发者迈入开源的一个重要途径。 Python 开发团队或许正是看中了这一…

最新的全球编程语言,操作系统,web服务器等使用率分析报告
由www.w3techs.com 根据alexa排名前100万的网站数据给出的分析报告,并每天持续更新。1.服务器端编程语言排名 http://w3techs.com/technologies/overview/programming_language/all点评:PHP是最高的,说明目前php是主流,但是asp.ne…

javascript中有关this的使用
this在面向对象编程中非常重要,他的值取决于调用的模式。 在Javascript中有4种调用模式:方法调用模式、函数调用模式、构造器调用和apply调用。 1. 方法调用模式:当一个方法被调用时,this被绑定到该对象。方法可以使用this访问自己…

Vue中v-if和v-show的使用场景
1. 官方文档 https://cn.vuejs.org/v2/guide/conditional.html#v-if-vs-v-show 2. v-if 和 v-show 的区别 2.1 官方解释 v-if 是“真正”的条件渲染,因为它会确保在切换过程中条件块内的事件监听器和子组件适当地被销毁和重建。 v-if 也是惰性的:如果在初…

手机自带的显示基站命令
安卓手机自带快捷指令显示当前的网络信息,不过手机厂商不同,命令也不一样。每次要用时总想不起来命令,记下备用。(1) HTC 安卓手机在拨号键盘输入 *#*#4636#*#* , 选择 “手机信息” (2)三星安卓手机 *#*#4636#*#* , 选择 “手机信息” (3)摩…

LB负载均衡集群 - NAT
前提:客户机 : eth0 192.168.0.200 eth1 192.168.205.129dir主机: eth0 192.168.0.166 eth1 192.168.205.128rs1主机: eth0 192.168.0.207rs2主机: eth0 192.168.0.208rs1 和 rs2的网关是dir 192…

时序预测的三种方式:统计学模型、机器学习、循环神经网络
作者 | luanhz来源 | 小数志导读时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用。甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格、天气变化等等。关于时序预测问题的相关理论也极为广泛,…

Python 爬虫练手项目—酒店信息爬取
from bs4 import BeautifulSoup import requests import time import reurl http://search.qyer.com/hotel/89580_4.html urls [http://search.qyer.com/hotel/89580_{}.html.format(str(i)) for i in range(1,10)] # 最多157页 infos [] # print(urls)# 批量爬取数据 def g…

应用交换技术的负载均衡算法
原文出处是:http://hi.baidu.com/ruijievideo/blog/item/5959be1f3c1621ff1bd576d2.html 应用交换技术的负载均衡算法应用交换技术里主要包括四项关键的技术:◆截获和检查流量◆服务器监控健康检查◆负载均衡算法◆会话保持截获和检查流量保证只有合适的…

平民架构的春天——UCloud数据方舟实战记
LNMP是最亲民的网页服务架构,整合了优秀的开源软件,想必大家再熟悉不过了,随着云计算的落地;大众创业,万众创新的倡导,为了更好的服务和安全,LNMP也迁入了云平台,比如像UCloud这样优…

用 Python 制作可视化报表,这也太快了!
作者 | 小F来源 | 法纳斯特在数据展示中使用图表来分享自己的见解,是个非常常见的方法。这也是Tableau、Power BI这类商业智能仪表盘持续流行的原因之一,这些工具为数据提供了精美的图形解释。当然了,这些工具也有着不少缺点,比如…

Django 错误汇总
1、 解决:python manage.py migrate sessions 2、转载于:https://blog.51cto.com/jacksoner/2130665

几种负载均衡算法
几种负载均衡算法 本地流量管理技术主要有一下几种负载均衡算法: 静态负载均衡算法包括:轮询,比率,优先权 动态负载均衡算法包括: 最少连接数,最快响应速度,观察方法,预测法,动态性能分配&#…