当前位置：首页 > 编程日记 > 正文

CVPR2019|微软、中科大开源基于深度高分辨表示学习的姿态估计算法

编程日记 2025-01-11 21:00:00

640?wx_fmt=jpeg

作者 | 周强（CV君）

来源 | 我爱计算机视觉（公众号id：aicvml）

如何挑战百万年薪的人工智能！
https://edu.csdn.net/topic/ai30?utm_source=csdn_bw

昨天arXiv出现了好几篇被CVPR 2019接收的论文。

其中来自微软和中国科技大学研究学者的论文《Deep High-Resolution Representation Learning for Human Pose Estimation》和相应代码甫一公布，立刻引起大家的关注，不到一天之内，github上已有将近50颗星。

今天就跟大家一起来品读此文妙处。

该文作者信息：

640?wx_fmt=jpeg

该文为第一作者Ke Sun在微软亚洲研究院实习期间发明的算法。

基本思想

作者观察到，现有姿态估计算法中往往网络会有先降低分辨率再恢复高分辨率的过程，比如下面的几种典型网络。

为便于表达，在下面的a、b、c、d四幅图中，同一水平线上的特征图为相同分辨率，越向下分辨率越小，在最终的高分辨率特征图heatmap中计算姿态估计的关键点。

640?wx_fmt=jpeg

Hourglass

640?wx_fmt=jpeg

Cascaded pyramid networks

640?wx_fmt=jpeg

Simple baseline

640?wx_fmt=jpeg

Combined with dilated convolutions

其中的网络结构说明如下：

640?wx_fmt=jpeg

作者希望不要有这个分辨率恢复的过程，在网络各个阶段都存在高分辨率特征图。

下图简洁明了地表达作者的思想。

640?wx_fmt=jpeg

在上图中网络向右侧方向，深度不断加深，网络向下方向，特征图被下采样分辨率越小，相同深度高分辨率和低分辨率特征图在中间有互相融合的过程。

作者描述这种结构为不同分辨率子网络并行前进。

关键点的heatmap是在最后的高分辨率特征图上计算的。

网络中不同分辨率子网络特征图融合过程如下：

640?wx_fmt=jpeg

主要是使用strided 3*3的卷积来下采样和up sample 1*1卷积上采样。

这么做有什么好处？

作者认为：

1）一直维护了高分辨率特征图，不需要恢复分辨率。

2）多次重复融合特征的多分辨率表示。

实验结果

该算法在COCO姿态估计数据集的验证集上测试结果：

640?wx_fmt=jpeg

与目前的state-of-the-art比较，取得了各个指标的最高值。相同分辨率的输入图像，与之前的最好算法相比增长了3个百分点！

在COCO test-dev数据集上，同样一骑绝尘！

640?wx_fmt=jpeg

在MPII test 数据集上，同样取得了最好的结果！

640?wx_fmt=jpeg

作者进一步与之前最好模型比较了参数量、计算量，该文发明的HRNet-W32在精度最高的同时，计算量最低！

如下图：

640?wx_fmt=jpeg

在PoseTrack2017姿态跟踪数据集上的结果比较：

640?wx_fmt=jpeg

同样取得了最好的结果。

下图是算法姿态估计的结果示例：

640?wx_fmt=jpeg

（请点击查看大图）

不仅仅是姿态估计

作者在官网指出，深度高分辨率网络不仅对姿态估计有效，也可以应用到计算机视觉的其他任务，诸如语义分割、人脸对齐、目标检测、图像分类中，期待更多具有说服力的结果公布。

640?wx_fmt=jpeg

论文地址：

http://cn.arxiv.org/pdf/1902.09212.pdf

项目主页：

https://jingdongwang2017.github.io/Projects/HRNet/PoseEstimation.html

代码地址：

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

（本文为AI科技大本营转载文章，转载请微信联系原作者）

人工智能的现状及今后发展趋势如何？
https://edu.csdn.net/topic/ai30?utm_source=csdn_bw

群招募

扫码添加小助手微信，回复：公司+研究方向（学校+研究方向），邀你加入技术交流群。技术群审核较严，敬请谅解。

640?wx_fmt=jpeg

推荐阅读：

90后美女学霸传奇人生：出身清华姚班，成斯坦福AI实验室负责人高徒
如今，你感受到内存技术的“思维速度”了吗？
暴雪游戏遭遇AI“实力”坑队友：四处游走，还不参与战斗
我用Python分析了翟天临的论文，学术还是要认真做啊
快速上手爬虫，有哪些方便实用的工具和服务？
C++ 开发者怒了：这个无用的模块设计最终会害死 C++！
程序员写代码没激情该怎么破？
以太坊升级完成你也做不出爆款应用, 就因为你不知道这个！
刚刚，阿里发布了一个重磅技术炸弹，70%的程序员受影响！

640?wx_fmt=png

点击“阅读原文”，查看历史精彩文章。

https://www.dkcj.cn/info/35870.html

本地连接受限制或无法连接怎么办？

一个非常常见的问题，就是我们家用电脑安装宽带后，任务栏上的“本地连接”图标有一个的叹号。查看状态：“受限制或无连接”，点“修复”却无法修复，显示无法获取IP地址，获得私网地址！但ADSL又可以…

编程日记2025/01/11 20:50:00

糟心！苹果无人车裁员190人，程序员却首当其冲

整理 | 琥珀出品 | AI科技大本营（ID:rgznai100） 60s测试：你是否适合转型人工智能？ https://edu.csdn.net/topic/ai30?utm_sourcecxrs_bw 仅过了一个多月，苹果公司自动驾驶部门裁员的真相便已浮出水面，该…

编程日记2025/01/11 20:40:00

【工具】Internet Download Manager( IDM )抓取站点

软件说明： 扒网站的好东西，免费，支持中文下载地址（官网） http://www.internetdownloadmanager.com/ 使用方法 https://jingyan.baidu.com/article/a681b0de0be10b3b1943465d.html

编程日记2025/01/11 20:30:01

2010-12-30

I want to invest in stocks to make a quick buck.我想炒股，尽快赚点儿钱花１、Which company are you going to invest in?那你打算买什么股？２、Dont put all your eggs in one basket造成不要孤注一掷。３、You need…

编程日记2025/01/11 20:20:00

PFLD：简单、快速、超高精度人脸特征点检测算法

作者 | 周强（CV君） 来源 | 我爱计算机视觉（公众号id：aicvml） 60s测试：你是否适合转型人工智能？ https://edu.csdn.net/topic/ai30?utm_sourcecxrs_bw 什么样的算法才是好算法？ 真…

编程日记2025/01/11 20:10:00

Cookie实现记住密码、自动登录

前端代码 <form id"form" action"xxx" method"post"><div><input type"text" name"account" id"account" placeholder"账号"><input type"text" name"pwd" i…

编程日记2025/01/11 20:00:01

【Ubuntu】VirtualBox+ubuntu中显示摄像头

1、下载插件 https://www.virtualbox.org/wiki/Downloads 2、修改下载的插件的后缀将后缀名改为vbox-extpack 如下载的插件为Oracle_VM_VirtualBox_Extension_Pack-5.2.14.txt，改为Oracle_VM_VirtualBox_Extension_Pack-5.2.14.vbox-extpack 3、安装插件点击…

编程日记2025/01/11 19:50:00

以SIGSEGV为例详解信号处理(与栈回溯)

以SIGSEGV为例详解信号处理(与栈回溯) 信号是内核提供的向用户态进程发送信息的机制, 常见的有使用SIGUSR1唤醒用户进程执行子程序或发生段错误时使用SIGSEGV保存用户错误现场. 本文以SIGSEGV为例, 详细分析信号使用方法, 内核信号的发送与接收机制. 1. 信号处理例程以下是一…

编程日记2025/01/11 19:40:00

十个jQuery图片画廊插件推荐

2019独角兽企业重金招聘Python工程师标准>>> jQuery的画廊插件可以将分组图像和多媒体资料转成类似Flash的图像或照片。当幻灯片已经成为网站的重要组成部分，jQuery的重要性不能被忽视。下面为你介绍了10个最有美感，创新性和创造性的jQuery图…

编程日记2025/01/11 19:30:01

总结机器学习优质学习文章Top50！

整理 | Jane出品 | AI科技大本营（公众号id：rgznai100）在过去一年里，我们每个月都会给大家推荐一些优质的、最新的机器学习研究成果或机器学习技术文章，很多文章是从近千篇文章中评选出来的。综合考虑这些文章的更新时间…

编程日记2025/01/11 19:20:00

【Qt】ubuntu QtCreator的pro文件中使用pkg-config

试验环境 ubuntu14.04.5 opencv2.4.13.6 Qt Creator 4.0.3 Qt 5.6 使用方法在pro文件中，添加opencv头文件路径 INCLUDEPATH /usr/local/opencv2.4.13.6/include 添加pkg-config –libs opencv CONFIG link_pkgconfig PKGCONFIG opencv 可以在命令行下…

编程日记2025/01/11 19:10:00

弯曲评论上关于SOC的一段文章【整理】

近几天，弯曲评论上针对一个文章进行了热烈的讨论。这个文章本无关乎SOC，不过，有业界同仁willchen将话题引到了SOC上，并发表了一番言论，整理如下（BTW，看着willchen的文字，让我想到了s…

编程日记2025/01/11 19:00:00

C# richtextbox 自动下拉到最后方法 RichTextBox读取txt中文后出现乱码

C# richtextbox 自动滚动到最后光标到最后自动显示最后一行 private void richTextBox1_TextChanged(object sender, EventArgs e) { richTextBox1.SelectionStart richTextBox1.TextLength; // Scrolls the contents of the control to the current car…

编程日记2025/01/11 18:50:00

【Qt】在Qt中使用opencv，不要使用opencv创建窗口

问题描述在ubuntu14.04.5 Qt5.6中使用opencv创建窗口显示摄像头时，报错： (:1103): Gtk-WARNING **: gtk_disable_setlocale() must be called before gtk_init() (:1103): GLib-CRITICAL **: Source ID 52 was not found when attempting to remove …

编程日记2025/01/11 18:40:00

曝贾扬清第二跳，加入阿里！达摩院或将承载中国下一个AI愿景？

整理 | Jane出品 | AI科技大本营（公众号id：rgznai100）无论是国外还是国内，AI 界的人才动向一直是大家关注的焦点，从 2017 年3 月，吴恩达离职百度，开启创业之路；2018 年 9 月&#xf…

编程日记2025/01/11 18:30:00

excel表格出问题了

我excel文件出问题，所有sheet表的N2表格内容自动替换成了几个固定的文字，出现两次了，第一次我手工改回来了，这有出现了第二次，我不知道是病毒原因，还是其他原因，应该不是我误操作，一…

编程日记2025/01/11 18:20:00

阿里云凌晨大规模宕机，华北部分网站陷入瘫痪

整理 | 琥珀出品 | AI科技大本营（ID:rgznai100）今天凌晨，有不少网友反馈称阿里云疑似出现了宕机故障。据消息称，北京时间 2019 年 3 月 2 日 23:55 分左右开始，监控发现华北 2 地域部分 ECS 实例及部分 EMR、RDS on EC…

编程日记2025/01/11 18:10:00

java8中的时间处理6 - 格式化

下面是格式化和解析的粒子： LocalDate date LocalDate.now();System.out.println(date);System.out.println(date.format(DateTimeFormatter.ofPattern("d::MMM::uuuu")));System.out.println(date.format(DateTimeFormatter.BASIC_ISO_DATE));LocalDate…

编程日记2025/01/11 18:00:01

【Qt】ubuntu14.04.5 qt5.6中使用opencv3.4报错：Using GTK+ 2.x and GTK+ 3 in the same process is not supported

问题描述 ubuntu14.04.5 qt5.6中使用opencv3.4报错： Using GTK 2.x and GTK 3 in the same process is not supported 原因 Qt5.6使用的GTK2.x，opencv3.4安装时使用的GTK3。解决方法 1、降低opencv版本，将opencv3.4更换为opencv2.4 这…

编程日记2025/01/11 17:50:00

mysql 开启慢查询命令【转】

以MySQL 5.1.36为例：在slow_query_log （注意log_slow_querys参数已经废弃）值为ON的情况下（默认为OFF），当一条SQL语句执行的时间超过了 long_query_time 预设的时间（默认为10s，同时精…

编程日记2025/01/11 17:40:00

不用开着电脑，如何将脚本代码放到服务器上？

作者 | sergiojune 转载自公众号日常学python（ID:daily_learn） 程序员转行学什么语言？ https://edu.csdn.net/topic/ai30?utm_sourcecsdn_bw 上次弄了个机器人，反响挺不错的，我也挺满意的，因为这个我也初…

编程日记2025/01/11 17:30:00

【Qt】ubuntu14.04+qt5.6+opencv2.4编程注意事项

cv::imshow();//不能在QT中使用该接口来创建窗口否侧会报错： (:1103): Gtk-WARNING **: gtk_disable_setlocale() must be called before gtk_init() (:1103): GLib-CRITICAL **: Source ID 52 was not found when attempting to remove it 参见：ht…

编程日记2025/01/11 17:20:00

Docker完整建站详介

2019独角兽企业重金招聘Python工程师标准>>> 一，在主服务器上操作：安装完成docker;略二，查看镜像 [rootlocalhost ~]#docker images REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE centos/shop2.web.top latest 8fc9b211671a 14…

编程日记2025/01/11 17:10:00

word2007启用宏

word选项-》信任中心->启用宏

编程日记2025/01/11 17:00:00

用Python分析《工作细胞》的一万多条评论后，非漫迷也要入番了

作者 | 量化小白一枚，上财研究生在读，专注于数据分析与量化投资来源 | 量化小白上分记（公众号 id：quanthzp） 责编 | Jane 人工智能的现状及今后发展趋势如何？ https://edu.csdn.net/topic/ai30?utm_so…

编程日记2025/01/11 16:50:00

【VritualBox】虚拟机VirtualBox中ubuntu下加载USB设备报错：busy with a previous request.Plaease try again later

1、问题描述在VirtualBox中添加USB设备时，报错： USB device with ‘SanDisk Crurer Blade’UUID {*} is busy with a previous request.Plaease try again later 返回代码: E_INVALIDARG(0x80070057) 组件: HostUSBDeviceWrap 界面： I…

编程日记2025/01/11 16:40:00

谈谈动态规划的思想

动态规划（ dynamic programming ）算法是解决多阶段决策过程最优化问题的一种常用方法，难度比较大，技巧性也很强。利用动态规划算法，可以优雅而高效地解决很多贪婪算法或分治算法不能解决的问题。动态规划算法的基本思想…

编程日记2025/01/11 16:30:01

关于ARM启动的一篇文章

时间：2010-12-28 09:22:36 来源：老古开发网作者：写的不错, 应该对大家有所帮助： 基于ARM的芯片多数为复杂的片上系统,这种复杂系统里的多数硬件模块都是可配置的,需要由软件来设置其需要的工作状态。因此在用户的应用程序之前,需…

编程日记2025/01/11 16:20:00

【Qt】QImage加载bmp位图数据

QImage直接加载bmp文件 QImage image(image.bmp); QImage加载已经获取的bmp数据 unsigned char *imageData = NULL; int imageLen = (102*3+2)*126+54; imageData = (unsigned char*)malloc(imageLen); FILE*stream; if((stream=fopen("image.bmp","r")…

编程日记2025/01/11 16:10:00

CVPR 2019审稿满分论文：中国博士提出融合CV与NLP的视觉语言导航新方法

整理 | 刘畅、Jane 责编 | Jane 出品 | AI科技大本营（公众号id：rgznai100） 如何挑战百万年薪的人工智能！ https://edu.csdn.net/topic/ai30?utm_sourcecsdn_bw CVPR 2019 接收论文编号公布以来，AI科技大本营开始陆续…

编程日记2025/01/11 16:00:01

相关文章：