离不开深度学习的自动驾驶
作者 | 小白
来源 | 小白学视觉
头图 | 下载于视觉中国
深度学习在整个自动驾驶技术的各个部分中进行了应用,例如在感知,预测和计划中都有应用。同时,深度学习也可以用于制图,这是高级自动驾驶的关键组成部分。
拥有准确的地图对于自动驾驶至关重要,可自动进行路线选择,本地化以及简化感知。但是,在没有地图的地区,自动驾驶汽车需要依靠自己的地图构建能力来确保自动驾驶的功能性和安全性。
离线映射与在线映射
在离线映射方案中,传感器数据被聚集在一个集中的位置。数据可以是卫星图像,也可以是机载传感器(例如相机或激光雷达)收集的数据。它可能来自同一辆车经过同一地点的多次通行,也可能来自众多车辆。地图的渲染是离线构建的,并且需要人工注释者来注释地图上的语义结构并查看最终结果。传统的地图服务以这种离线方式工作,然后将带注释和精选的地图提供给道路上的车辆。
在线地图是在车上进行的,典型示例是用于同时定位和映射的SLAM系统。最近,重点研究道路上表面标记的几何形状和语义含义的语义SLAM作为一种轻量级的制图解决方案。另外,单语义在线映射(monoSOM)是一个研究趋势,其中使用神经网络将来自多台摄像机的单目图像的时间序列融合到语义鸟瞰图中。
SD Maps与HD Maps
根据输入分辨率,大约有两种类型的深度学习在地图中的应用。一种类型工作重点是地图拓扑的发现,例如道路网络,通常不包含车道级别信息。他们只需要一个相对低分辨率的图像,并具有大约米级的精度。另一种类型的应用程序侧重于提取车道级别信息,例如车道线,路面箭头和其他语义标记。这需要具有厘米级精度的高分辨率图像。相应地,在本文的其余部分中,这两类地图将被简称为SD映射和HD映射。
SD映射(道路拓扑发现)
深度学习在地图上的早期应用着重于从相对低分辨率的航空图像中提取道路拓扑。深度学习创建了一个合适的解决方案,涵盖了SD映射的大量内容。SD地图中生成的道路拓扑主要用于在自动驾驶(用于路线选择和导航)的环境中相对受限的情况下。然而,其中一些研究提出的方法与高清地图的后续工作高度相关,因此在此进行了综述。
DeepRoadMapper(ICCV2017)吸收从卫星获得的航拍图像并创建结构化的道路网络。它首先执行语义分割,然后对生成的路线图运行细化和修剪算法。由于语义分割的不准确(树木,建筑物等遮挡),许多道路都保持断开状态。为了解决这个问题,DeepRoadMapper使用A *搜索算法来生成连接假设以弥合差距。
RoadTracer(CVPR2018)也注意到了不可靠的语义分割结果,并将其作为中间表示消除了。它使用迭代图构造直接获取道路拓扑。该算法需要做出决定,朝特定方向迈进一定距离,类似于增强学习设置中的主体。
PolyMapper(ICCV2019)可能受到RoadTracer的启发,并且也消除了中间表示形式。它明确统一了不同类型的对象(包括道路和建筑物的街区)的特定形状,并将其表示为封闭的多边形。遵循迷宫墙追随者算法,算法极其巧妙和简洁。
PolyMapper使用MaskRCNN架构提取建筑物和道路的边界蒙版。基于蒙版,它提取顶点,找到起始顶点,然后使用RNN对所有顶点进行自回归迭代以形成封闭的多边形。
高清映射(车道信息提取)
SD地图缺少自动驾驶汽车的安全定位和运动计划所需的精细细节和准确性。带有车道等级信息的高清地图对于自动驾驶是必不可少的。
HD地图的生成通常采用高分辨率的鸟瞰图(BEV)图像,该图像是通过拼接车载摄像机图像和/或激光雷达扫描生成的。
HRAN (用于结构化在线地图的分层递归注意网络,CVPR 2018)接受道路的稀疏点云扫描,并输出包含车道边界实例的道路网络的结构化表示。它首先迭代找到每条车道线的起点,然后针对每条车道线,迭代地绘制沿该线的下一个顶点。这两个RNN以分层方式进行组织,因此名称为HRAN-分层递归注意网络。
它提出了折线损失的想法,以帮助神经网络输出结构化折线。折线损失测量的是地面真线折线边缘及其预测的偏差。这比在顶点上的距离更合适,因为存在许多绘制等效折线的方法。
HRAN每像素使用5 cm的分辨率,在20 cm的精度范围内可实现0.91的召回率。主要的故障模式来自错过或多余的车道线。请注意,100%的准确性并不一定是最终目标,因为注释者仍然需要手动查看并修复这些图像。这些故障案例可以相对容易地解决。在以后的工作“深边界提取器”中使用的高度梯度图可能能够修复FP护栏被误认为车道线的情况。
深度结构人行横道 (用于绘制人行横道的端到端深度结构模型,ECCV 2018)从激光雷达点产生的BEV图像和相机图像(激光雷达+ RGB = 4通道)中提取结构化人行横道。该网络生成三个独特的特征图-语义分割,轮廓检测以及从直接监督定义人行横道方向的角度。
深边界提取器 (CVPR 2019,CVPR2019,用于道路边界提取的卷积循环网络)使用折线提取道路边界。它受深度结构人行横道的启发,并使用卷积RNN(卷积Snake或cSnake)以自回归方式进行预测。输入通过添加一个额外的激光雷达高度梯度通道扩展了“深层结构人行横道”的输入范围,该通道是通过获取Sobel滤波的激光雷达BEV图的大小而生成的。
cSnake网络迭代处理旋转的ROI,并输出对应于道路边界的折线的顶点。它首先预测端点。基于每个端点,它会裁剪并旋转以端点为中心的特征图的面片,并找到下一个点的位置。上面的过程是自动回归的。
DAGMapper (通过发现车道拓扑学习地图,ICCV 2019)将HRAN的结构化车道线提取工作进一步向前迈进了一步,专注于诸如分叉和合并之类的较难案例。它接受激光雷达强度图并输出DAG(有向无环图),而不是HRAN中的简单折线。
DAGMapper的核心也是一个循环卷积头,它迭代地关注以最后一个预测点为中心的裁剪特征图补丁,并预测下一个点的位置。所做的更改是,它还预测了点的状态为合并,派生或继续。
注意
1. 深度学习的结果需要构造成易于由自动驾驶堆栈使用,并易于人工注释者修改。
2. 当前的高清制图应用程序专注于道路边界,车道线(包括合并和岔路拓扑)和人行横道边界的提取。
3. 所有高清制图研究的核心组成部分是循环卷积网络,该网络以迭代方式获取以当前注释点为中心的裁剪特征图,并预测下一个注释点。
CSDN协同行业大佬,携手打造13长热门知识图谱及IT成长路线
助力千万IT人成长,快速实现职场进阶!
更多精彩推荐
☞官方抓虫,PyTorch 新版本修复 13 项 Bug☞GitLab 在中国成立公司极狐,GitHub 还会远吗?☞16款小米新品,刚刚雷军只发了5款
点分享点收藏点点赞点在看
相关文章:

IOS -- base64编码
在iOS7以后可以用NSData自带的base64EncodedStringWithOptions进行编解码: 方法如下: - (NSString *)encodeToBase64String:(UIImage *)image {return [UIImagePNGRepresentation(image) base64EncodedStringWithOptions:NSDataBase64Encoding64Charact…

OpenCV持久化(二)
如何利用OpenCV持久化自己的数据结构?我们来看看OpenCV中的一个例子。 MyData.hpp定义自己的数据结构MyData如下: #ifndef MYDATA_HPP #define MYDATA_HPP#include <opencv2/core/core.hpp> #include <iostream> #include <string>using namespac…

Excel、Exchange和C#
摘要:Eric Gunnerson 将向您介绍如何使用 Outlook、Excel 和 C# 创建自定义的日历,该日历可以提供适用于短期项目和长期项目的清晰明了的版式。 下载 csharp05152003_sample.exe 示例文件(英文)。 虽然一月份已经过去了&#x…

这个宝藏工具,给你一种黑客般的感觉
明天要交作业了,吴检正在宿舍熬夜爆肝拼命敲代码,劈里啪啦的键盘声和咔咔的鼠标声格外嘈杂,室友陈琛瞥了一眼,背过身,沉沉睡去,留下他一人在深夜无尽的黑暗中,断断续续却又没有尽头的咔咔声中凌…

LSTM神经网络
LSTM是什么 LSTM即Long Short Memory Network,长短时记忆网络。它其实是属于RNN的一种变种,可以说它是为了克服RNN无法很好处理远距离依赖而提出的。 我们说RNN不能处理距离较远的序列是因为训练时很有可能会出现梯度消失,即通过下面的公式训…

用C#实现在PowerPoint文档中搜索文本
用编程的方式根据对象模型很容易实现在Word、Excel文档中搜索文本,在PowerPoint里面也同样如此,使用对象模型有助于我们了解office的文档结构。 搜索的思路和方法基本是一样的,用PowerPoint应用程序对象打开指定的文档,用文档对象…

雷军的最后一次 重 大 创 业
这是我人生最后一次重大创业项目。我愿意押上人生全部的声誉,亲自带队,为小米汽车而战!——雷军作者 | Carol头图 | 下载于视觉中国出品 | CSDN(ID:CSDNnews)3月29日19:30,小米春季新品发布会拉…

shell之冒号的作用
冒号: :在shell中是一种命令,意思是总是为真,但是却不做任何操作,即总是为真的空命令eg:[rootlocalhost ~]# ${abc:t1}-bash: t1: command not found[rootlocalhost ~]# : ${abc:t1}[rootlocalhost ~]# echo $abct1[ro…

关于epel源的配置
EPEL,即Extra Packages for Enterprise Linux,这个软件仓库里有很多非常常用的软件,而且是专门针对RHEL设计的,对RHEL标准yum源是一个很好的补充,完全免费使用,由Fedora项目维护,所以如果你使用的是RHEL&am…

C#如何在Form中嵌入并且操作Excel表格
网上比较多讲述如何操作excel表的文章,但都是启动excel的窗口来打开excel数据文件。有时候需要把excel表嵌入到自己程序的form中,给客户一个不用切换窗口的操作界面,似乎更好。这在vc中用ole技术很容易实现,但是在c#中方法就不一样…

自研芯片架构 ,这家中国公司发布DPU芯片计划
近日,专注于智能计算领域的DPU芯片和解决方案公司中科驭数发布了其下一代DPU芯片计划,将基于自研的KPU(Kernel Processing Unit)芯片架构,围绕网络协议处理、数据库和大数据处理加速、存储运算、安全加密运算等核心功能࿰…

QQ超时不能刷新好友接收发送信息
如果您在其它电脑登录时正常,只在本地出现此种情况,可能与您本机的设置及网络限制有关,建议您先确保安装的是我司的官方版本,然后再搜索并删除您的QQ号码文件夹(会丢失聊天记录,请注意备份)&…
JavaStuNote 4
装箱(inbox)和拆箱(outbox) 代表了类类型和基本类型之间的转换行为。 手动版本号: Integer b new Integer(10); Int a b.intValue; 自己主动版本号: Integer b30; Integer bnew Integer(30); Int ab; int a b.intValue(); 由于基本类型…

把Doc文档转换成HTML等其它格式
利用microsoft Word 9.0 Object Library可以在页面中对Doc文档进行格式转换。有关Word对象的一些方法可以参考Open和Save。下面是进行转换的代码[C#]: /// <summary>/// WordToHtml 的摘要说明。/// 首先要添加引用:Microsoft Word 9.0 Object Li…

如何学好Python?相信很多人都做错了!
Python入门从哪开始,以我的过往经验,发现很多的教程都是这样讲的:先介绍 Python 的基本语法规则、list、dict、tuple 等数据结构,然后再介绍字符串处理和正则表达式,介绍文件等IO操作.... 就这样一点一点往下说。然而这…

艾麦捷科技-铂金小猪新年致辞
2019独角兽企业重金招聘Python工程师标准>>> 光阴似箭,2013年是匆忙的一年,艾麦捷科技从最初的“笑谈”到现在上线,招财猪进销存管理软件从无到有,到现在多次更新,无一不是在匆忙中完成的,尽管很…

C#开源框架整理
Json.NET http://json.codeplex.com/ Json.Net 是一个读写Json效率比较高的.Net框架.Json.Net 使得在.Net环境下使用Json更加简单。通过Linq To JSON可以快速的读写Json,通过JsonSerializer可以序列化你的.Net对象。让你轻松实现.Net中所有类型(对象,基本数据类型 …

提供一个基于.NET的加密/解密算法
提供一个基于.NET SymmetricAlgorithm 类的、带私钥的加密/解密算法的包装类。使用方法: symmcrypto de new SymmCrypto(SymmCrypto.SymmProvEnum.DES);Response.Write(x.Decrypting(de.Encrypting("ok","yyy"),"yyy")); 类的实现…

ubuntu修改IP
一、使用命令设置Ubuntu的ip地址1. 设置IP sudo ifconfig eth0 203.171.239.155 netmask 255.255.255.224 这样就算设置好了网卡eth0的IP地址和子网掩码2. 设置网关 sudo route add default gw 203.171.239.1293. 设置DNS 修改/etc/resolv.conf,在其中加入 nameserv…

Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片
整理 | 伍杏玲出品 | AI科技大本营(ID:rgznai100)随着 AI、大数据、IoT 技术的相互渗透,人们对数据的要求也越来越高,如何提供普适专用、安全而强大的处理能力的架构?Arm 为这个答案准备十年。近日,Arm 推出…

HDU 6051 - If the starlight never fade | 2017 Multi-University Training Contest 2
/* HDU 6051 - If the starlight never fade [ 原根,欧拉函数 ] | 2017 Multi-University Training Contest 2 题意:给定 m,p, p 是素数设 f(i) 是 满足 (xy)^i ≡ x^i mod p 的 (x,y) 对数 且 1 ≤ x ≤ p-1 , 1 ≤ y ≤ m 求 ∑[1≤i≤p-1] i*f(i)限制ÿ…

干货!用 Python 快速构建神经网络
作者 | ZackSock责编 | 欧阳姝黎头图 | 下载于视觉中国前言机器学习一直是Python的一大热门方向,其中由神经网络算法衍生出来的深度学习在很多方面大放光彩。那神经网络到底是个个什么东西呢?说到神经网络很容易让人们联想到生物学中的神经网络ÿ…

才知道百度也提供了智能DNS服务 - 加速乐
http://jiasule.baidu.com/ 智能DNS 依托百度多年积累的高精度DNS识别库,平均只需5秒全球DNS服务器全部生效,百度蜘蛛1秒生效。抗攻击、无限解析记录,免费支持电信、联通、移动、铁通、教育网、国外、搜索引擎等分线路解析。 极致云加速 百度…

c#中结构与类的区别
类与结构的差别如何选择结构还是类一.类与结构的示例比较:结构示例:public struct Person {string Name;int height;int weightpublic bool overWeight(){//implement something}}类示例:public class TestTime {int hours;int mi…
Samba amp; Nginx - Resource temporarily unavailable
先说说本人的开发环境:Win7 Editplus VMware(CentosSambaNginx)。用Samba在Centos上把web文件夹(如www)共享,然后在Win7上訪问这个文件夹。之所以这么用的原因有: 习惯了Windows。效率比較高Editplus编辑器好用,相对于vi系列来说…

好多Javascript日期选择器呀-7
the Coolest DHTML Calendar 最特別的在於按下月份跟年份的加減按鈕不放,就可以選擇該項目。但實際上按著左鍵拖曳實在是一件很累的事,而且不懂電腦的 End-user 根本就不知道要按著不放,還得特地花時間去說明真的吃力不討好。 正好這次的專案…

话AI、学实践、探未来,亚马逊云科技AI在线大会报名开启!
Innovate 2021亚马逊云科技 AI 在线大会即将在 4 月 22 日举办。届时,亚马逊云科技大中华区产品部总经理顾凡,以及亚马逊云科技全球人工智能技术副总裁、杰出科学家Alex Smola将联袂为您献上精彩的主题演讲。大会开设六大分会场,可谓是别开生…

linux中的一些命令的想法
用户影子文件 ----shadow为什么要有影子文件因为Linux使用不可逆的加密算法来加密口令。加密算法不可逆的,因此***从密文处得不到明文,但/etc/passwd文件是全局可读的,而且加密算法是公开的,一旦用户有机会获取了/etc/passwd文件&…

vstpd服务
1、安装ftpyum install vsftpd -y systemctl start vsftpd systemctl stop firewalld systemctl enable vsftpd setenforce 0 #关闭selinux或者设置selinux不然会对试验造成影响 lftp ip ##能登陆并且显示,表示安装成功2、vsftpd文件信息/var/ftp …

LINQ to XML 建立,读取,增,删,改
LINQ to XML的出现使得我们再也不需要使用XMLDocument这样复杂的一个个的没有层次感的添加和删除。LINQ可以使的生成的XML文档在内存中错落有致。下面以一个小的例子说名LINQ to XML的简单应用。 需要添加必要的引用。System.XML.Linq , System.XML.Xpath使用XDocument 建立一个…