当前位置: 首页 > 编程日记 > 正文

姿态检测 树莓派_怎样在树莓派上轻松实现深度学习目标检测?

原标题:怎样在树莓派上轻松实现深度学习目标检测?

雷锋网按:本文为 AI 研习社编译的技术博客,原标题 How to easily Detect Objects with Deep Learning on Raspberry Pi,作者为 Sarthak Jain。

翻译 | 小哥哥 狒狒 校对 | 老赵 整理 | 凡江

这个现实世界造成了很多挑战,比如数据有限、只有微型的计算机硬件(像手机、树莓派)所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽车,冰箱里的橘子,文件上的签名和太空中的特斯拉。

免责声明:我正在建设 nanonets.com 来帮助使用很少的数据和没有计算机硬件的情况下构建机器学习模型。

如果你很迫切,请直接下拉到这篇文章的底部进入Github的仓库。

在孟买的公路上检测车辆

为什么是目标检测?为什么是树莓派?

树莓派是一款灵活的计算机硬件,它以1500万台的销量已经吸引了一代消费者的心,并且黑客们也在树莓派上构建了很多很酷的项目。考虑到深度学习和树莓派相机的的流行,我们认为如果能在树莓派上使用深度学习来检测任意的物体那就非常棒了。

现在你可以检测到你的自拍照里的照片炸弹,有人进入到Harambe的笼子里,哪里有辣椒酱或者亚马逊的快递员进入到你的房子里。

什么是目标检测?

2000万年的进化使得人类的视觉系统有了相当高的进化。人脑有30%的神经元负责处理视觉信息(相对比只有8%处理触觉和3%处理听觉)。与机器相比,人类有两个主要的优势。一是立体视觉,二是训练数据集的供应几乎是无限的(一个五岁的婴儿可以大约在30fps的采样间隔获得2.7B的图像数据)。

为了模仿人类水平的表现,科学家将视觉感知任务分解为四个不同的类别。

1. 分类,为图像指定一个标签。

2. 定位,对特定的标签指定一个边框。

3. 物体检测,在图像中绘制多个边框。

4. 图像分割,得到物体在图像中的精确位置区域。

物体检测对于很多应用已经足够好(图像分割是更精确的结果,它受到了创建训练数据复杂性的影响。相比于画边框它通常花费人类标注者12倍的时间去分割图像。)此外,在检测物体之后,可以将物体在边框中单独分割出来。

使用物体检测:

目标检测具有重要的现实意义,已经在各行各业得到了广泛应用。下面列举了一些例子:

我怎样使用物体检测解决自己的问题?

物体检测可以用于解决各种各样的问题。这些是一个概括的分类:

1. 物体是不是出现在我的图像中?比如在我的房子有一个入侵者。

2. 在图像中的一个物体在哪个位置?比如一个汽车试图在世界各地导航时,知道物体的位置就很重要。

3. 图像中有多少个物体?物体检测是计算物体数目最有效的方法之一。比如仓库的货架上有多少个盒子。

4. 图像中有哪些不同类型的物体?比如动物园的哪些区域有哪些动物?

5.物体的尺寸有多大?特别是使用静态的相机,很容易计算出物体的大小。比如芒果的大小是多少。

6. 物体之间是如何相互作用的?比如在足球场上的队形是如何影响比赛结果的?

7. 物体在不同时间的位置(跟踪一个物体)?比如跟踪一个像火车一样的物体并且计算它的速度。

在 20 行代码内完成物体检测

YOLO算法的可视化

有多种用于物体检测的模型或结构。每一个都在速度、尺寸和精确度之间权衡。我们选择了最流行的一个:YOLO(You only look once),并且展示它如何以20行代码(忽略注释)进行工作。

注意:这是伪代码,不是一个可直接工作的实例。它有一个非常标准的CNN构成的黑箱,如下图所示:

你可以阅读(YOLO)全文:https://pjreddie.com/media/files/papers/yolo_1.pdf

YOLO中使用卷积神经网络的体系结构代码小于20行,如下:

如何建立目标检测的深度学习模型?

深度学习的工作流程有6个基本步骤,分为了三个部分:

1. 收集训练集

2. 训练模型

3. 预测新图像

第1阶段 — 收集训练数据

步骤1. 收集图像(每个对象至少100张)

......

想要继续阅读,请移步至我们的AI研习社社区:http://www.gair.link/page/TextTranslation/904

更多精彩内容尽在 AI 研习社。

不同领域包括计算机视觉,语音语义,区块链,自动驾驶,数据挖掘,智能控制,编程语言等每日更新。

雷锋网(公众号:雷锋网)

基于 OpenCV(C++/Python) 使用深度学习 进行人类姿态检测

如何在 Azure 上使用 Horovod 框架进行物体检测的分布式深度学习

基于 OpenCV 使用 YOLOv3 进行深度学习中的物体检测

亚马逊、谷歌、微软等各家公司人脸识别对比

斯坦福CS231n李飞飞计算机视觉经典课程(中英双语字幕+作业讲解+实战分享)

等你来译:

你能在 10 分钟之内解决人物检测的问题吗?

如何使用 OpenCV 编写基于 Node.js 命令行界面 和 神经网络模型的图像分类

深度学习来自监督的方法返回搜狐,查看更多

责任编辑:

相关文章:

Linux目录读写和可执行权限

一 . 进入目录权限如果我在普通用户下创建了一个目录f1,然后使用chomd u-rwx,g-rwx,o-rwx之后,我在普通用户下想进入f1目录,权限不允许。然后我切换到超级用户下,再次尝试进入到f1目录,这个时候允许进入。然后回到普通…

【译】表变量和临时表的比较(转)

关于表变量是什么(和表变量不是什么),以及和临时表的比较让很多人非常困惑。虽然网上已经有了很多关于它们的文章,但我并没有发现一篇比较全面的。在本篇文章中,我们将探索表变量和临时表是什么(以及不是什…

grub加密。

一、介绍 安全无小事 linux系统的安全分为很多方面,什么端口啊,什么网络啊,听着都特么烦,今天谈谈最简单明显的密码安全。 二、单用户模式 单用户模式个人觉得相当有用,可以用来修复系统,修改密码…… 但是…

Linux下stat + 文件名后, Access,Modify,Change的含义

我们首先在一个目录下创建了一个文件使用命令touch file然后输入命令:stat file,这个时候会输出一系列信息大家注意红色框中的三个时间Access : 文件最近一次被访问的时间Modify: 文件内容最近一次被修改的时间Change: 文件属性最近一次被改变的时间接着…

基于设计模式的学习之旅-----访问者模式(附源码)

基于设计模式的学习之旅-----访问者模式 1、初始访问者模式 2、什么是访问者模式 表示一个作用于某对象结构中的各元素的操作。它使你可以在不改变各元素的类的前提下定义作用于这些元素的新操作。 3、模式结构图 4、模式代码事例 场景:年会,每个小组表演…

x is y python_Python 基础

2.1 程序与用户交互在python3中#input:无论用输入何种类型,都会存成字符串类型nameinput(please input your name:) #name18print(id(name),type(name),name)在python2中#raw_input与python3的input是一样的nameraw_input(please input your name:)print…

【leetcode 简单】 第八十九题 赎金信

给定一个赎金信 (ransom) 字符串和一个杂志(magazine)字符串,判断第一个字符串ransom能不能由第二个字符串magazines里面的字符构成。如果可以构成,返回 true ;否则返回 false。 (题目说明:为了不暴露赎金信字迹,要从杂…

创建专属博客栏目

今天给大家get新技能了,是不是很期待捏我们一般看到的博客页面是这样的但是你是不是特别期待这样的捏其实技术上面也不是特别的 难,我们登录自己的csdn博客,然后选择“管理博客”,跳转页面之后选择“博客栏目”进入到这个页面之后…

《帝企鹅日记》观后感

第一次看到是在高中的英语周报上,那时候蛮好奇的,企鹅也写日记,呵呵,后来想了想应该是纪录片,时隔三年,发现当初的猜测果然不假。 我觉得那些企鹅很可爱,也很漂亮。最重要的是,那一条…

合并道路_资质改革已经确定!盘点被合并的资质!有这资质的要注意了

资质改革可以说是在行业里掀起了轩然大波,众多资质面临改革,有的资质被取消,有的资质被合并,有的资质继续保留。此文就带大家来盘点一下那些在近期资质定稿中被取消,被改变的资质:勘察资质勘察资质中&#…

如何为ccflow工作流引擎增加一个优先级PRI?

为什么80%的码农都做不了架构师?>>> 如何为ccflow工作流引擎增加一个优先级PRI? 对于一条流程的优先级可分为 低,中,高三个级别,用这个状态来标示这条流程的紧急程度。 以以前版本的ccflow中是以节点表…

SQL Server (MSSQLSERVER) 服务因 2148081668 服务性错误而停止。

https://zhidao.baidu.com/question/151448005.html 具体步骤:运行-> 输入:“services.msc” ->找到 “SQL Server (SQLEXPRESS)” 服务,双击 -> 在“SQL Server (SQLEXPRESS) 的属性”界面,点登录 -> 默认登录身份是…

面试题--特别是字节对齐

来源&#xff1a;http://www.cnblogs.com/Braveliu/archive/2013/01/04/2844757.html 【1】设置或者清除某位。 示例代码如下: 1 #include<iostream>2 using namespace std;3 4 #define BIT3 (0x1<<3)5 6 void Set_bit3(int &a)7 {8 a|BIT3;9 } 10 11…

vim基础入门

一. vim的三种模式在Linux操作系统下&#xff0c;我们一般会使用vim进行文本编辑&#xff0c;它相当于Windows下的记事本&#xff0c;但是它比记事本的功能强大的多。vim一般有三种模式分别是普通模式&#xff0c;编辑模式和命令模式。普通模式和编辑模式可以来回的切换&#x…

python html解析查找字符串_用python的BeautifulSoup分析html

序言之前用python爬取网页的时候&#xff0c;一直用的是regex或者自带的库sgmllib里的SGMLParser。但是遇到复杂一点的情况时&#xff0c;SGMLParser往往就不那么给力了&#xff01;(哈&#xff0c;难道说我 too native了&#xff1f;毕竟beautifulSoup是继承sgmlparser的么~)所…

ejb 3中bean的种类

会话bean(session bean) 主要用来编写业务逻辑和对数据库进行操作&#xff0c;Session Bean用于实现业务逻辑&#xff0c;它分为有状态bean和无状态bean。每当客户端请求时&#xff0c;容器就会选择一个Session Bean来为客户端服务。Session Bean可以直接访问数据库&#xff0…

Android学习 —— 数据的存储与访问方式一: 文件存取

笔记摘要&#xff1a; 在Android中主要提供了四种数据存储与访问的方式&#xff0c;文件、SharedPreference&#xff08;偏好参数保存&#xff09;、SOLite数据库、内容提供者&#xff08;Content provider&#xff09;和网络&#xff0c; 本篇文章先介绍使用文件的方式进行数据…

react的安装使用

react的重要思想是通过组件来开发应用&#xff0c;而组件就是能够完成某个特定功能而独立、可复用的代码。 react是可以像JQuery那样直接下载引入使用&#xff0c;也可以直接引用官网提供的CDN的地址&#xff1a; <script src"https://unpkg.com/react16/umd/react.dev…

锐捷交换机配置snmp版本_snmp交换机配置

华为交换机1、查询交换机当前是snmp配置命令dis cur2、进入全局模式 int ethernet1/0/7 shutdown 关 undoshutdown 激活sys3、进入SNMP配置snmp-agent4、配置只读字符串snmp-agent community read abcd5、配置写字符串snmp-agent community write abcd6、开启snmp版本支持功能 …

Linux命令find的35个实例

注&#xff1a;本文内容参考《35 Practical Examples of Linux Find Command》 网址&#xff1a;http://www.tecmint.com/35-practical-examples-of-linux-find-command/ Linux 查找命令是Linux系统中最重要和最常用的命令之一。查找用于根据与参数匹配的文件指定的条件来搜索…

PHP使用APNS的 feedback service

http://blog.csdn.net/gnicky/article/details/7544202 1. URL是不一样的&#xff0c;端口是2196 2. 使用同样的Certificate&#xff0c;建立安全连接&#xff0c;接受数据&#xff0c;直到数据不存在&#xff0c;类似table select操作 3.每条纪录是一个token&#xff0c;serve…

洛谷——P2341 [HAOI2006]受欢迎的牛//POJ2186:Popular Cows

P2341 [HAOI2006]受欢迎的牛/POJ2186:Popular Cows 题目背景 本题测试数据已修复。 题目描述 每头奶牛都梦想成为牛棚里的明星。被所有奶牛喜欢的奶牛就是一头明星奶牛。所有奶 牛都是自恋狂&#xff0c;每头奶牛总是喜欢自己的。奶牛之间的“喜欢”是可以传递的——如果A喜 欢…

学习使用Bing Maps Silverlight Control(五):离线使用和自定义地图模式

6 离线使用 在笔记第一部分的时候就提到如果要使用Bing Maps Silverlight Control 进行开发&#xff0c;需要申请一个key&#xff0c;不让会显示一个错误提示出来。但是在实际开发或使用过程中&#xff0c;使用环境和地图数据可能不是在线的&#xff0c;但控件因为验证失败仍然…

python123第k序元素查找_Python实现折半查找并用matplotlib实现动态过程可视化

折半查找是算法中减治策略的基本例子&#xff0c;实现起来也很简单&#xff0c;但是在网上看到的图片教程不觉得很乾巴麽&#xff1f;&#xff1f;在这里插入图片描述这是一个简单的实现&#xff1a;def Reduction(lists, k):""":param lists: 元素列表:param k…

vim进阶技巧

本篇博文是在之前的《vim基础入门》的基础之上写的&#xff0c;不懂的同学可以先看之前的分享 1. 视觉范围的选择 普通模式下&#xff0c;按v键确定范围起点&#xff0c;然后移动光标&#xff0c;光标所在位置为范围的终点&#xff0c;然后按操作键完成其他操作&#xff0c;之…

Flex Air程序打包成独立的exe安装文件

2019独角兽企业重金招聘Python工程师标准>>> 开发背景&#xff1a; FlexBuilder3.2开发生成的Air程序需要能够独立安装&#xff0c;事先不需要安装AdobeAir运行环境 实现方法&#xff1a; 1)用winrar打开xx.air文件爱能&#xff0c;并将它解压在D:\airapp目录中。 2…

《C++primer》第一章--开始

之前开始读《Cprimer》&#xff0c;想着读书不动笔不如不读书&#xff0c;于是就想做一个读书笔记的内容&#xff0c;于是就想起了写一个《Cprimer读思录》的一个专栏。一是为了给自己平时读书做笔记&#xff0c;方便自己随时查看。二是为了督促自己每天学习。三是为了知识的分…

对于计算机网络的整体框架的概括(转载) 个人感觉很好

作者&#xff1a; 阮一峰 日期&#xff1a; 2012年5月31日 我们每天使用互联网&#xff0c;你是否想过&#xff0c;它是如何实现的&#xff1f; 全世界几十亿台电脑&#xff0c;连接在一起&#xff0c;两两通信。上海的某一块网卡送出信号&#xff0c;洛杉矶的另一块网卡居然就…

Centos修改系统语言

使用man page帮助时&#xff0c;发现居然是中文的&#xff0c;不过想想即便英语再水&#xff0c;也要逼着自己去适应。于是百度找了一下修改系统语言的方法。 首先使用 locale 命令查看当前的系统语言 然后修改时一般有两种方法&#xff0c;一是临时修改&#xff0c;立即生效&a…

tp3 普通模式url模式_Thinkphp 3.2.3 url 路由访问模式

Thinkphp 3.2.3 url 的4中路由模式&#xff1a;// 0 (普通模式)http://网址/index.php?m模块&c控制器&a方法http://localhost/index.php?mHome&cindex&aindex//1 (PATHINFO 模式) 默认为PATHINFO 模式http://网址/index.php/模块/控制器/方法http://localhos…