CenterNet KeyPoints 关键点训练自己的数据
概述
网上搜了一圈,关于CenterNet 训练关键点数据的资料非常少,而且讲得都很模糊,没法解决实际问题,也未说明细节和要素。在踏坑许久之后,才跑通CenterNet的关键点训练,于是记录一下踏坑历程,以备后忘
环境
cuda11.0
torch1.7.1
torchvision0.8.2
numpy 1.19.2
这是我的环境版本,不是非得这个版本
数据集准备
参考我的另一篇文章
COCO KeyPoints关键点数据集准备
CenterNet 代码修改
训练代码修改
我的数据集 的类别是1类, 关键点是3个
新的数据集代码创建
CenterNet/src/lib/datasets/datasets 目录, coco_hp.py是原来的coco keypoints官方数据集的数据集代码, 我们从这文件copy一份, 命名为handKeyPoints.py
修改其中内容, 先看下对比图
修改代码
num_classes = 1 #类别1num_joints = 3 #关键点个数3default_resolution = [512, 512]mean = np.array([0.636623, 0.642096, 0.649946],dtype=np.float32).reshape(1, 1, 3) #数据集计算出的meanstd = np.array([0.318729, 0.316616, 0.297199], #数据集计算出的stddtype=np.float32).reshape(1, 1, 3)flip_idx = [[1, 2]] #图像翻转,这个我也不懂, 就照着官方的写了一个,跟实际的关键点数对应def __init__(self, opt, split):super(HandKeyPoints, self).__init__()self.edges = [[0, 1], [1, 2]]self.acc_idxs = [1, 2, 3]#数据集文件夹 目录 data/HandCupKeyPoints , 这个文件夹里面是annotations、test2017 、train2017三个文件夹self.data_dir = os.path.join(opt.data_dir, 'HandCupKeyPoints') if split == 'val': #这里我们的是test而不是val,所以改一下split = 'test'self.img_dir = os.path.join(self.data_dir, '{}2017'.format(split))if split == 'test':self.annot_path = os.path.join(self.data_dir, 'annotations', 'test.json') #直接指定文件名else:self.annot_path = os.path.join(self.data_dir, 'annotations', 'train.json') #直接指定文件名
这个文件就修改完毕, 其他不用动
修改文件 CenterNet/src/lib/datasets/dataset_factory.py
对比如下:
我这里大小写不一致,不用管, dataset_factory 字段 key 就是 刚刚创建的handKeyPoints.py 的前缀 , value就是 文件里 class 的类名
修改文件 CenterNet/src/lib/opts.py
第15行 修改默认数据集为 handKeyPoints 数据集
第323行
opt.flip_idx = False#dataset.flip_idxopt.heads = {'hm': opt.num_classes, 'wh': 2, 'hps': 34} #17个点的x、y 共 34个值
修改为:
# opt.flip_idx = Falseopt.flip_idx = dataset.flip_idxopt.heads = {'hm': opt.num_classes, 'wh': 2, 'hps': 6} #3个点的x、y 共 6个值
第345行
'multi_pose': {'default_resolution': [512, 512], 'num_classes': 1, 'mean': [0.408, 0.447, 0.470], 'std': [0.289, 0.274, 0.278], #数据集的 mean std'dataset': 'coco_hp', 'num_joints': 17, #关键点个数 17个'flip_idx': [[1, 2], [3, 4], [5, 6], [7, 8], [9, 10], [11, 12], [13, 14], [15, 16]]}, #flip_idx
修改为 自己数据集的 mean 和std
flip_idx 修改为相应的
'multi_pose': {'default_resolution': [512, 512], 'num_classes': 1, 'mean': [0.614, 0.612, 0.622], 'std': [0.348, 0.347, 0.329], #数据集的 mean std'dataset': 'handKeyPoints', 'num_joints': 3, #关键点个数 3个'flip_idx': [[1, 2]]}, #flip_idx 看情况写
到此,训练部分的代码就修改完了, 可以开始训练了
编写脚本train.sh, 内容
python main.py multi_pose --arch dla_34 --dataset handKeyPoints --lr 0.25e-4 --batch_size 16 --gpus 0 --load_model ../models/multi_pose_dla_3x.pth
学习率自定义设置,
–batch_size 依据GPU显存大小, 如果CUDA out of memery 就改小点
–load_model …/models/multi_pose_dla_3x.pth 这个是官方训练好的模型,
开始训练
报一堆警告,不用管, 如下:
输出训练过程日志
看损失值, 在验证损失不再下降的时候停止训练
训练的结果
训练的结果保存在exp目录下
模型文件如下:
这样我们就得到了 训练好的模型,
我的数据集较少,不知道是由于标注质量的问题还是学习率的问题,最终验证损失loss=2.7左右时不再下降。
测试
训练代码修改
修改文件 CenterNet/src/lib/utils/debugger.py
增加handKeyPoints 数据集类别判断
第45行增加
elif num_classes == 1 or dataset == 'handKeyPoints': #增加自定义的handKeyPoints类别self.names = handKeyPoints_class #类别名称self.names = ['p'] #类别名称self.num_class = 1 #类别数self.num_joints = 3 #关键点数量self.edges = [[0, 1], [1, 2]] #关键点连接关系self.ec = [(255, 0, 0), (0, 0, 255), (255, 0, 0)] #颜色self.colors_hp = [(255, 0, 255), (255, 0, 0), (0, 0, 255)]
第467行增加
handKeyPoints_class = ['hand']
修改文件 CenterNet/src/lib/detectors/multi_pose.py
第85行
dets[:, :, :4] *= self.opt.down_ratio #bbox 的4个值 dets[:, :, 5:39] *= self.opt.down_ratioemmina.mo #5~39 是17个关键点的坐标34个值
这里修改为:
dets[:, :, :4] *= self.opt.down_ratio #bbox 的4个值 dets[:, :, 5:11] *= self.opt.down_ratioemmina.mo #5~11 是3个关键点的坐标6个值
第101行
debugger.add_coco_bbox(bbox[:4], 0, bbox[4], img_id='multi_pose') #bbox 的4个值 debugger.add_coco_hp(bbox[5:39], img_id='multi_pose') #5~39 是17个关键点的坐标34个值
修改为
debugger.add_coco_bbox(bbox[:4], 0, bbox[4], img_id='multi_pose') #bbox 的4个值 debugger.add_coco_hp(bbox[5:11], img_id='multi_pose') #5~11 是3个关键点的坐标6个值
到这里测试代码就修改好了
编写测试脚本test_keyPoints.sh, 内容如下:
python demo.py multi_pose --demo ../images/16.jpg --load_model ../models/model_best_keypoints.pth
模型用的就是上述训练好的模型
测试结果
识别出了手臂, 置信度为0.9
相关文章:

Java学习笔记---字符类型
一、字符类型也算是整数类型的一种 字符类型在内存中占有2个字节,可以用来保存英文字母等字符。计算机处理字符类型时,是把这些字符当成不同的整数来看待,因此,严格说来,字符类型也算是整数类型的一种(小写…

我的家庭私有云计划-16
嗯,上午测试S2S的稳定性,改掉几个bug。还挺忙的。这会儿让机器跑测试去,腾出点时间,我们接着聊。 呵呵,昨天哪,已经有朋友批评我了,说我有点贪大求全,这个论坛什么的没必要自己实现&…

“cyl projection cannot cross pole” 解决方法
解决方法: 1、尝试更新NumPy以及相关模块: 在CMD里面执行 conda update –all 遇到提示选择yes/y 更新完毕后看是否可以载入。 发现并不能成功更新,于是采取了下面方法: 2、如果方法一不能解决,那么尝试卸载相关库&…

使用ubuntu(18.04) 作为软路由器连接互联网
使用ubuntu(18.04) 作为软路由器连接互联网 背景: 最近要用ubuntu机器作为中继路由,需要配置一下,但是内网外网网上找了一圈,五花八门的,照着做没有一个靠谱的,遇到的问题也没有任何说明&#…

程序员肿么了?为何总被认为是“屌丝”
没有想到会这么多人,有一点我强调一下,我的标题是被认为,而不是说真是。其实程序员相比其他行业不见得差,只是社会整体认可度不高。(或者说认知) 本文纯属闲时娱乐,请勿当真,请勿较真…

python空值填充_pandas | DataFrame基础运算以及空值填充
今天是pandas数据处理专题的第四篇文章,我们一起来聊聊DataFrame的基本运算。上一篇文章当中我们介绍了DataFrame数据结构当中一些常用的索引的使用方法,比如iloc、loc以及逻辑索引等等。今天的文章我们来看看DataFrame的一些基本运算。数据对齐我们可以…

Python学习之路基础篇--10Python基础,函数进阶
1 命名空间 对于Python 来说命名空间一共有三种 1 内置命名空间 —— Python 解释器 就是Python 解释器一启动就可以使用的名字,储存在内置命名空间中。内置的名字在启动解释器的时候被加载进内存里 2 全局命名空间 —— 我们所命名的,但不是函数中的代码…
C语言中整型浮点型在计算机中的存储
第一次写博客,遣词造句有点菜,算是一次简单梳理,慢慢学习人家的博客风格,随着学习的深入再做修改。 本次学习的是C语言在VS下的编译调试,对于初学者两说,首先说一下如何监控变量,以及监控变量在…

判断交换机性能好坏的九个因素
【文章摘要】把握千兆交换机的主要性能指标是关键,而判断交换机性能的好坏,需要从以下几方面的因素出发... 把握千兆交换机的主要性能指标是关键,而判断交换机性能的好坏,需要从以下几方面的因素出发: 转发技术 …

xgboost回归预测模型_偏最小二乘回归分析法 从预测角度对所建立的回归模型进行比较...
在实际问题中,经常遇到需要研究两组多重相关变量间的相互依赖关系,并研究用一组变量(常称为自变量或预测变量)去预测另一组变量(常称为因变量或响应变量), 除了最小二乘准则下的经典多元线性回归分析(MLR),提取自变量组主成分的主…

win7的IE缓存,临时文件,cookies和历史记录
2019独角兽企业重金招聘Python工程师标准>>> vista、win7的缓存以及临时文件、Cookies和历史记录都在以下几个地方: 缓存: %userprofile%\AppData\Local\Microsoft\Windows\Temporary Internet Files Temp: %userprofile%\AppData\Local\Temp Cookies: %…

Sql Server函数全解(四)日期和时间函数
阅读目录 1.获取系统当前日期的函数getDate();2.返回UTC日期的函数UTCDATE()3.获取天数的函数DAY(d)4.获取月份的函数MONTH(d)5.获取年份的函数YEAR(d)6.获取日期中指定部分字符串值的函数DATENAME(dp,d)7.获取日期中指定部分的整数值的函数DATEPART(dp,d)8.计算日期和时间的函…

关于python的比赛_【蓝桥杯】——python集团的比赛技巧,Python,组
【蓝桥杯】—— Python组比赛技巧蓝桥杯是大学生IT学科赛事,由工业和信息化部人才交流中心主办,所以对于大学生还说还是非常值得去参加的,2020年第十一届蓝桥杯新增了大学Python组,不分组别,第一届没有历届的真题&…

杭电 HOJ 1312 Red and Black 解题报告
搜索,bfs。依旧用队列做。边界处懒得处理,全部初始化为-1。当然,0也可以。AC代码如下: #include<iostream> #include<deque> using namespace std;struct Point {int x,y; } x,y;int main() {char str[22];int i,j,n,…

pfile和spfile的区别
pfile和spfile的区别 pfile 默认的名称为“init例程名.ora”文件路径:/app/oracle/product/10.2.0/dbs,这是一个文本文件,可以用任何文本编辑工具打开。spfile 默认的名称为“spfile例程名.ora”文件路径:/app/oracle/product/10…

json操作2
import jsonfopen(a.txt,w,encodingutf-8)goods{ 宝马:111111, 奔驰:222222}resjson.dumps(goods,ensure_asciiFalse)#把字典转成jsonf.write(res) json.dump(goods,f,ensure_asciiFalse)#把字典转成json,json会帮你write一次 ----颜色不一样的代码一致运行结果ÿ…
缓冲区和数组的输入输出问题
最近编写程序的时候一直被数据的输入输出所困扰,由此写篇博文总结一下最近遇到的问题和解决方法,错误之处望指正。 1.数组使用的一些语法注意事项 (1)数组的定义 一维数组:类型名 数组名 [常量表达式] 常量表达式中可…

目前python主要应用领域零售_python3读取HDA零售企业数据(一)
#-*- coding:utf-8 -*-# 下载河南FDA各药品经营企业目录import urllib.requestimport urllib.parseimport reimport osimport http.cookiejarheader {Connection: Keep-Alive,Accept: application/x-ms-application, image/jpeg, application/xamlxml, image/gif, image/pjpeg…

调试webservice遇到“测试窗体只能用于使用基元类型作为参数的方法”的解决办法...
之前一直写webservice 没有遇见这种情况,因为一般返回的参数整形 字符串 之类的 都是基本类型,最多也就是把xml序列化为一个字符串返回,这次遇到了返回一个引用类型的,不能直接调试了。所以,现在只能写一个程序把webse…

EJB3.1 JBoss7.1 Eclipse3.7
为什么80%的码农都做不了架构师?>>> EJB3.1 JBoss7.1 Eclipse3.7 ------Hello World 一、环境配置: JDK:正常配置 Eclipse:正常下载,解压(V3.7) JBoss:正常下载…

NOIP2012-摆花
放题目不解释~~~~ 【试题描述】 小明的花店新开张,为了吸引顾客,他想在花店的门口摆上一排花,共m盆。通过调查顾客的喜好,小明列出了顾客最喜欢的n种花,从1到n标号。为了在门口展出更多种花,规定第i种花不能…

github提交代码却没有显示绿格子
在github上提交代码之后,进入github上面查看自己的提交,可以看看刚刚的提交内容,但是却一直没有显示绿格子,一个原因是本地git的配置邮箱和github上面的邮箱不一致。 解决办法是,打开本地的git bash,然后直…

spark+openfire即时通讯工具二次开发参考文档
摘自: http://gmd20.blog.163.com/blog/static/168439232010527525542/ 其中Spark是开源的基于XMPP协议的即时通讯工具,公司最近也换到用这个了,说是在服务器(openfire)上可以备份消息,然后可以看员工的聊天记录 smac…

python selenium 等待页面加载完毕_Selenium_等待页面加载完毕
隐式等待WebDriver driver newFirefoxDriver();driver.get("www.baidu.com");driver.manage().timeouts().implicitlyWait(20, TimeUnit.SECONDS);WebElement element driver.findElement(By.cssSelector(".abc"));((JavascriptExecutor)driver).executeS…

TechEd 2012奥兰多!
亚特兰大TechEd 2011如同昨天的事情,今天又无比期待奥兰多的TechEd 2012!如果可能的话,我将继续为大家分享关于奥兰多TechEd 2012 的现场见闻! 转载于:https://blog.51cto.com/suhua/845796

【常见CPU架构对比】维基百科
Comparison of instruction set architectures https://en.wikipedia.org/wiki/Comparison_of_instruction_set_architectures转载于:https://www.cnblogs.com/timeObjserver/p/9441242.html
Python基础学习1(Python的Windows和Linux的安装及简单学习)
一Python的安装 1.Windows下安装Python (1)windows 命令行的几个常见的命令 dir:查看当前目录下的所有文件,以及目录 cd NAME:进入到NAME目录下(tab键自动补全) D: 切换到D盘 type NUL…
Python Tutorial(十):浏览标准库(一)
10.1 操作系统接口 os模块提供很多函数用于和操作系统的交互: 确定使用import os风格而不是from os import *。这将避免os.open()被内建的open()函数遮住,它的操作截然不同。 内建的函数dir()和help()作为交互助手对于大的模块像os是非常有用的ÿ…

学业水平考试b能上985吗_河南单招哪些学院好考?哪些专业能录取?
高职单招的录取规则是什么?在符合报考条件的前提下,考试是由两部分组成:文化素质评价职业适应性测试、职业技能测试。文化素质评价大多院校采用学业水平考试等级成绩折合一定的分值计入。有些学校采用现场考试语数外三门,以实际成绩计入。职…

单例模式Java实现
为什么80%的码农都做不了架构师?>>> public class Singleton {private static Singleton instance null;// 同步时加锁的静态对象private static final Object OL new Object();private Singleton() {// Class initialize}/** 在多线程环境下执行时的…