超阿里、大华,澎思科技行人再识别(ReID)技术刷新三大数据集记录
整理 | Jane
出品 | AI科技大本营(ID:rgznai100)
【导读】不久前,江苏省某市公安通过 AI 技术分析监控摄像头中的信息,抓获了一个偷盗电动车的嫌疑人员。监控摄像头在现场拍到的是嫌疑人背对摄像头的情况,未有清晰正面的人脸,但图片显示了他的穿着、发型、身高等信息,而警方运用的技术则是计算机视觉领域中的行人再识别技术(Re-ID),通过Re-ID技术警方找到了关联摄像头正好拍到他的正脸,以此确认身份,迅速将嫌疑人抓获。这也是行人再识别技术在实战场景中的一个典型应用,而提供给警方技术支持的则是国内人工智能企业澎思科技(Pensees)。
行人再识别,澎思科技 ReID算法的三大突破
行人再识别起源于多摄像头跟踪,指在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。行人再识别涉及计算机视觉、机器学习、模式识别等多个学科领域。在行人再识别(ReID)技术研究领域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指标。
近日,在行人再识别(Person Re-identification,简称ReID)算法上澎思科技取得了突破,在三大主流ReID数据集测试 Market1501、DukeMTMC-reID 和 CUHK03 中,算法关键指标首位命中率(Rank-1 Accuracy)刷新了世界纪录。
在三大数据集上,Rank-1 指标分别达到 96.73%、92.01% 和 84.57%超过了阿里巴巴、腾讯、大华、云从科技等头部厂家;在 CUHK03 数据集的实验中,mAP 也超过了之前的成绩。
澎思科技 Market1501 部分测试结果
澎思科技通过对算法的自研创新和融合探索,算法上的突破有以下三点:
1、金字塔水平分块策略:采用 human parsing 对人体分割,结合金字塔水平分块策略,使得网络准确提取细粒度区域特征的能力大幅提升;
如图所示, 特征图水平分割 6 等份,其幂集一共有种组合,去掉全集和空集以后还有种组合方式,这些特征区域可以组合成为新的特征图。对每个新的特征图进行常规操作(全局池化=>卷积=>批归一化=>激活函数=>全连接层=>ID 监督信号)。通过多监督信号的参与,可以大幅提高模型的精度和鲁棒性。
2、(1)渐进式训练策略;(2)图网络结构
(1)训练阶段,借鉴 curriculum learning 思路,难样本比例逐步提升,使得损失函数更易收敛。参与训练的样本按照学习难易度、按顺序进入和退出训练循环,模型在训练的同时评估各样本的难度,如此可以保证模型能够有效挖掘样本特征完成ReID任务。
(2)通过图网络结构,学习得到各个细粒度特征的加权系数,进一步提高特征的分辨能力。
如图所示,网络在学习行人特征提取的同时还要学习区分不同部分的人体结构,有的放矢地在这些区域提取特征并进行池化可以大大减少背景信息造成的干扰。同时使用图卷积网络对人体各部分的特征之关系经行建模可以得到一个人的整体表示,其效果要优于直接垂直等分特征图。
各部分的特征向量首先堆叠在一起形成特征矩阵,使用一维卷积分别混洗每行和每列的特征,让信息在各部分、各通道之间流动,重复一定次数以后可以得到稳定的整体特征。
3、重构距离:最后在测试阶段,除常规距离计算手段,引入重构距离,提升网络对未对齐、遮挡等技术难点的鲁棒性。
为了解决遮挡带来的精度下降问题,提出线性空间重构,利用参考图片的信息尝试尽可能地恢复残缺特征图,恢复后的特征图和参考特征图之间的距离即为重构距离。由此可以保证相似的图片之间可以互相重构,而不同个体的图片不管怎么重构都有一定的距离。从而提高了模型应对遮挡情况的能力。
ReID 算法持续优化,加速技术在多行业应用落地
ReID 算法加速技术在多行业应用落地
近年来受益于深度学习的发展,行人再识别(ReID)技术水平得到了巨大提升,超越人眼识别能力,并达到了商用的水平。作为人脸识别技术的重要补充,其发展内核便是在不同视频中,在无法获取清晰人脸特征信息前提下,机器通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性。在公共安全(如智能视频监控、安保、刑侦)、智能零售、智能交通以及智慧城市等领域有很高的应用价值。
在公共安全领域,行人再识别技术在警务实战中可以作为人脸识别技术的有力补充,帮助公安视频侦查实现人脸、人体图像与数据联结,强化轨迹追踪功能,深化公安视频图像应用能力。
在智慧零售领域,行人再识别技术可以帮助商超收集“人”与“场”之间的关系数据并以可视化的方式重现。通过行人再识别技术追踪记录顾客店内行动轨迹,分析热点区域和商品关注度,分析不同区域的客流驻足率,从而据此优化商品陈列,获取最佳客流动线;感知客流峰谷,最受欢迎区域,合理配备人员,提升服务。同时,也将有助于基于用户行为画像,实现线下广告精准投放。
在智能制造、智慧园区等领域,行人再识别技术同样可以在提高员工工作效率,管理规范生产过程,降低企业管理成本,提升企业安保等级等方面有很多的应用场景。目前,澎思科技自研的 ReID 算法已经在不同行业的多个业务场景中落地应用。
(*本文为 AI科技大本营整理文章,转载请联系 1092722531)
◆
精彩推荐
◆
“只讲技术,拒绝空谈!”2019 AI开发者大会将于9月6日-7日在北京举行,这一届AI开发者大会有哪些亮点?一线公司的大牛们都在关注什么?AI行业的风向是什么?2019 AI开发者大会,倾听大牛分享,聚焦技术实践,和万千开发者共成长。
目前,大会盲订票限量发售中~扫码购票,领先一步!
推荐阅读
人工智能六十年技术简史
YOLOv3模型剪枝,瘦身80%,提速100%,精度基本不变
干货 | Python后台开发的高并发场景优化解决方案
重磅!Python再次第一,Java和C下降,凭什么?
22019年技术盘点容器篇(三):阿里专家谈容器:既叫好又叫座? | 程序员硬核评测
任正非:华为鸿蒙将比安卓快 60%;小米回应主题侵权;VS Code 1.36发布 | 极客头条
以太坊暗网? 这群北大才子做到了...
谷歌员工中位数年薪达 170 万元,却仍买不起房!
泪目!Linux之父:我就是觉得苹果太没意思!

相关文章:

[转] vuewebpack多页面配置
前言 最近由于项目需求,选择使用vue框架,webpack打包直接使用的vue-cli,因为需要多页面而vue-cli只有单页面,所以就决定修改vue-cli的配置文件来满足开发需求。 html-webpack-plugin 实现需求需要用到这个插件, 具体信…

微信扫描二维码登入实现,网页端
2019独角兽企业重金招聘Python工程师标准>>> 服务器端要做得事很多,虽然逻辑不是很复杂,但是我们必须要分析清楚我们要做哪些事,请看下图: 通过这张图,我们看出,服务器端的接口一共有6个&#…

微软洪小文:AI将成为人类未来最好的左脑
演讲嘉宾 | 洪小文整理 | 夕颜出品 | AI科技大本营(ID:rgznai100)导读:2019 年 6 月 14 日,由清华大学五道口金融学院、清华大学国家金融研究院、清华大学研究生会联合主办的“未来已来—全球领袖论天下”系列讲座再次开讲。应清华…

计算机视觉相关网站
转自:http://blog.sciencenet.cn/home.php?modspace&uid454498&doblog&id377338 1、OpenCV中文网站 http://www.opencv.org.cn/index.php/%E9%A6%96%E9%A1%B5 2、Advanced Digital Imaging Solutions Laboratory (ADISL) Image Apprentice is a C/C ba…

预告 · Flutter Live 2018 全球同步直播
Flutter Live 2018 是 Google 在伦敦线下举办,并面向全球线上直播的一次 Flutter 庆祝活动。在 2018 年已经过去的这段时间里,Flutter 有着非常大的进展: 2 月底在世界移动大会 (MWC) 上宣布了第一个 Beta 版发布;5 月的 Google I/O 大会上发…

context-param与init-param的区别与作用
<context-param>与<init-param>的区别与作用 spring2009-11-04 16:49阅读39 评论0字号:大 中 小<context-param>的作用:web.xml的配置中<context-param>配置作用1. 启动一个WEB项目的时候,容器(如:Tomcat)会去读它的配置文件web.xml.读两个…

C#中object的使用
转自:http://www.hackvip.com/article/sort0129/sort0143/Hackvip_233655.html C#中system.object的函数方法功能介绍 在C#中,Object类型是所有类型的根,大家平常开发中都要跟它打交道,但不见得对它里面的每个方法都知根知底&am…

百炼智百炼智能获5000万元Pre-A轮融资,深耕智能获客赛道
出品 | AI科技大本营(ID:rgznai100)2019年7月9日,百炼智能正式宣布完成5000万元Pre-A轮融资。该轮融资由东方嘉富领投,上市公司任子行、元投资本和酷我音乐创始人雷鸣等投资者跟投。百炼智能利用自有核心自然语言处理、图像识别和…

阿里巴巴连任 Java 全球管理组织席位
百度智能云 云生态狂欢季 热门云产品1折起>>> 11 月 23 日,阿里巴巴宣布连任 Java 全球管理组织 JCP 最高执行委员会委员,任期从 2018 年 12 月 4 号开始,为期两年。阿里表示,这意味将有更多中国开发者的声音被引入 Ja…

Django ModelForm操作及验证
一、内容回顾 Model- 数据库操作- 验证class A(MOdel): user email pwd Form - class LoginForm(Form): email fields.EmailField() user pwd - is_valid -> 每一个字段进行正则(字段内置正则)clean_字段 -> clean(__all__) -> _post_clean - cleand_data - err…

matlab外部接口简介
1、MATLAB外部接口主要包括3部分内容: (1)、MEX文件:外部程序调用接口; MEX文件是MATLAB解释器可以自动加载和运行的动态链接过程,MATLAB可以像调用内部函数一样调用它们。用户通过MEX文件可以完成以下功能: 可以在…

IE调试网页之一:F12 开发人员工具简介
F12 开发人员工具是可帮助生成和调试网页的一套工具。 编写出色的网页需要编码知识以及适当的工具来发现和调试难免会出现的问题。Windows Internet Explorer 9 提供所呈现代码的视图,F12 工具提供 Internet Explorer 9 如何在代码级别上解释这些页面的视图。F12 工…

100万奖金池,这不仅仅是场比赛
这,不仅仅是场比赛,更是对最前沿领域的共同探索2019 E起AI!2019年度的大赛,由香港科大商学院和香港科大商学院内地办事处主办,由香港科大EMBA校友企业安讯科技冠名,将围绕人工智能领域的创新及运用展开赛事…

举例说明使用MATLAB Coder从MATLAB生成C/C++代码步骤
MATLAB Coder可以从MATLAB代码生成独立的、可读性强、可移植的C/C代码。 使用MATLAB Coder产生代码的3个步骤:准备用于产生代码的MATLAB算法;检查MATLAB代码的兼容性(有些matlab代码语句并不能生成c/c代码);产生最终使用的源代码或MEX。 利…

媒体智能应用落地靠5G,视频社交需要想象力
作者简介:卢迪,中国传媒大学新媒体研究院书记、副教授、硕士研究生导师。人工智能正逐渐成为重要的基础设施,在与各行各业传统领域紧密结合的基础上对社会生产、生活方式带来深刻的影响。中央多次强调媒体融合,“要探索将人工智能…

堆栈的链表实现
2019独角兽企业重金招聘Python工程师标准>>> /** stack3.c** Created on: Dec 6, 2012* Author: fsxchen* 链式结构的栈*/ #include #include #include #include typedef struct StackNode //节点结构体 {int data; //存放数…

registry ---------仓库 -----------------镜像
registry --------->仓库 ----------------->镜像 本地镜像都保存在宿主机下 : /var/lib/docker/containers 镜像从仓库下载下来.镜像保存在仓库中,而仓库存在于Registry中. Docker Hub 中有两种类型的仓库: 用户库: 用户仓库…

BigBiGAN问世,“GAN父”都说酷的无监督表示学习模型有多优秀?
作者 | Jeff Donahue、Karen Simonyan 译者 | Lucy、一一出品 | AI开发者大本营(ID:rgznai100)众所周知,对抗训练生成模型(GAN)在图像生成领域获得了不凡的效果。尽管基于GAN的无监督学习方法取得了初步成果࿰…

技术人生:与其鸟宿檐下,不如击翅风雨
人生途中,有些是无法逃避的,比如命运;有些是无法更改的,比如情缘;有些是难以磨灭的,比如记忆;有些是难以搁置的,比如爱恋……与其被动地承受,不如勇敢地面对;…

C++递归用法
转自:http://bbs.ikaka.com/showtopic-664019.aspx 简单谈谈C 递归的思想实现以及和循环的关系 很多初学者往往对递归迷惑不解,也在这上面花了不少的时间。其实教材上的例子很经典,只是它说的有一些唠叨了。初学者会看的头大的。编程是解决…

java导入excle表格,并且对表格进行相应的修改,并对表格数据进行整理,最后导出本地表格等一系列...
1.首先创建一个java项目 完成效果如下图所示 2.导入以下jar包 3.代码如下 其中行和列的操作是根据需求自动划分的 复制代码1 public class auto_date {2 private static List<List<String>> readExcel(File file) throws Exception {3 // 创建输入流,读…

RetinaFace,最强开源人脸检测算法
作者 | CV君 来源 | 我爱计算机视觉(ID:aicvmlaicvmlaicvml)人脸检测为目标检测的特例,是商业化最早的目标检测算法,也是目前几乎各大 CV 方向 AI 公司的必争之地。WIDER FACE 数据集是由香港中文大学发布的大型人脸数…

OpenCV中cvBlobsLib的编译与使用
OpenCV的cvBlobsLib库的作用类似于matlab中的regionprops函数。 cvBlobsLib库的编译: 首先从http://opencv.willowgarage.com/wiki/cvBlobsLib#Blobextractionlibrary下载最新的v8.3版本的源代码,其次机子上要装有OpenCV1.0的环境,从http:/…

AWS开源Firecracker,一种运行多租户容器服务的新虚拟化技术
现在的技术环境下,容器具有快速启动时间和高密度,VM可以对硬件虚拟化,具有更好的安全性,并对工作负载具有更好的隔离性。容器和VM的特性现在还不可兼得。 现在AWS开源了Firecracker,一种利用KVM的新虚拟化技术…

python urllib2 开启调试
2019独角兽企业重金招聘Python工程师标准>>> 发一段在网上看见. USING HTTPLIB.HTTPCONNECTION.SET_DEBUGLEVEL() WITH URLLIB2 Posted on October 1, 2007, 9:52 pm, by jamiegrove, under python. I’ve been trying to get the debug level turned on in urll…

从发展滞后到不断突破,NLP已成为AI又一燃爆点?
作者 | 刘家俊,一览群智CTO责编 | Jane出品 | AI科技大本营(ID :rgznai100)自然语言处理:人工智能连接主义复兴浪潮中的下一个突破口AI 行业应用是一片新的大陆,深度学习作为新大陆的基石,经历了…

matlab最小分类错误全局二值化算法
转自:http://download.csdn.net/detail/hupeng810/1511870 function imagBW kittlerMet(imag) % KITTLERMET binarizes a gray scale image imag into a binary image % Input: % imag: the gray scale image, with black foreground(0), and white % bac…

XShell连接Deepin
为什么80%的码农都做不了架构师?>>> 先让deepin安装openssh sudo apt-get install openssh-serverchkconfig ssh on 转载于:https://my.oschina.net/enzo/blog/110518

第三届“达观杯”文本智能信息抽取挑战赛丰厚奖金,群英集结,等你来战!...
近日,第三届“达观杯”文本智能信息抽取挑战赛正式上线启动(点击阅读原文,跳转报名页面),6月28日至8月31日,面向所有参赛选手开放竞赛结果提交。本届“达观杯”的任务是信息抽取。“达观杯”大赛由国内文本…

Spline interpolation and Savitzki-Golay smoothing
转自:http://octave.1599824.n4.nabble.com/Spline-interpolation-and-Savitzki-Golay-smoothing-td1675136.html ## natural-cubic-spline interpolation ## usage: yspline spline(x,y,xspline) ## example: ## x 0:10; y sin(x); ## xspline 0:0.1:10; y…