MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件
作者 | 神经小兮
来源 | HyperAI超神经(ID:HyperAI)
内容提要:麻省理工学院在最近 ECCV 2020 上提交的一篇论文中,发布了一套自然灾害图像数据集。这是迄今为止规模最大、质量最高的自然灾害卫星图像数据集。
2020 年,多灾多难的一年。年初爆发的疫情,夏天南方的洪灾,近期美国加州的野火……
洪灾、山火、地震之类的自然灾害,总是威胁着人们的生命财产安全。而在无法避免其发生的情况下,如果能够及时、迅速地发现一些细微的变化,就能更好地制定相应救援方案,更合理地进行资源配置,同时也有助于进行相关新闻的报道。
因此,麻省理工学院的工程学硕士生 Ethan Weber 和合作者 Hassan Kan,在最新论文《Building Disaster Damage Assessment in Satellite Imagery with Multi-Temporal Fusion》(《具有多时相融合的卫星影像中的建筑物灾害破坏评估》)中提出了一个深度学习模型,能够对受损区域的卫星图像进行更快、更精准的评估,从而为急救人员争取更多的时间、最大程度地减少损失。
该论文在近期 CV 顶会 ECCV 2020 上发表
论文地址:https://arxiv.org/pdf/2004.05525.pdf
与此同时,他们还发布了一个最新的用于损坏评估的卫星图像数据集,让图像事件检测的相关研究更进一步,研究人员能实现更精确的定位和量化损失。
用 AI 与时间赛跑:加速灾情评估
对于自然灾害,现场应急小组减少反应时间,迅速响应、采取行动,对于减少损失和挽救生命至关重要。此外,为了更好地在受灾地区部署资源,应急人员必须了解损失的确切位置和严重性,这些同样重要。
目前,应急人员通常通过人力观察卫星图像的方法,来评估灾害损坏程度,但评估过程可能要花费数小时之久,这对于抢救工作极为不利。
人员观察分析卫星图像耗时耗力
是目前自然灾害评估工作中的一个瓶颈
Ethan Weber 的这项研究贡献在于,创建自动分析图像的工具,减少图像分析时间,赢得与时间的赛跑。
另外,其研究通过共享权值的 CNN(卷积神经网络),独立地提供灾前和灾后图像,可以获得更好的性能。
他们还提出了一种新的计算机视觉模型,该模型能够检测在 Twitter 和 Flickr 等社交媒体平台上发布的图片中的事件。
论文中提出的建筑损坏预测、评估模型架构
标记 19 种自然灾害的 22068 张图像
除了提出新模型外,该研究团队还重磅发布了一个新的事件数据集:xBD 数据集。
该数据集包含 22068 张图像,标记有 19 种不同的事件,包括地震,洪水,野火、火山爆发和车祸等。这些图像包括了灾前、灾后图像,图像可用于构建定位和损伤评估这两项任务。
飓风灾前图像(上图)与灾后图像(下图)
据介绍,xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像中规模最大、质量最高的公共数据集之一。其基本信息如下:
这些图像分辨率为 1024×1024,其中每个建筑物都有标识符,并在灾前灾后图片中保持一致。
但研究者发现建筑物的分辨率往往太小,模型无法准确绘制建筑物边界。为此,他们在 4 张 512×512 的图像上训练和运行模型,形成左上角、右上角、左下角和右下角象限。
根据这些灾前和灾后数据,损伤评估可以被定义为单时间和多时间任务。在单时间设置中,只有灾后图像被输入模型,该模型必须预测每个像素的损伤水平。在多时间背景下,灾前灾后图像都被输入到模型中,该模型必须在后图像上预测损伤程度。
团队综合多方资料,制定的损坏评估量表
数据集从何而来?
团队表示,这套新数据集旨在填补该领域的空白。现有数据集的图像数量和事件类别的多样性都受到限制。
作者还解释了如何创建数据集、如何创建模型以检测图像中的事件,以及如何过滤嘈杂的社交媒体数据中的事件。
他们的其中一项工作是,过滤了 4000 万张 Flickr 图片,来寻找灾害事件。另外一些工作则是可对地震,洪水和其他自然灾害期间,发布在 Twitter 上的图像进行过滤。
比如,该团队将与自然灾害相关的推文过滤为特定事件,并通过将推文频率与美国国家海洋和大气管理局(NOAA)提供的数据库相关联,来验证这一过程。
Ethan Weber 说:「我对这个数据集能够进行进一步的研究以检测图像中的事件感到兴奋,它也非常有效地激发了人们对计算机视觉界的兴趣。」
他还表示,社交媒体和卫星图像都是有助于应急响应的数据形式。社交媒体提供实地观察,而卫星图像提供宏观的观察(expansive insights),例如确定哪些地区受野火影响最大。
每逢灾害发生,网友通常会在社交媒体上发布实地拍摄照片。
正是意识到这种相互联系,Ethan Weber 和他的校友合作,在损害评估方面做出了卓越的成绩。
Ethan Weber 说:「现在我们有了数据,对定位和量化破坏很感兴趣。我们正在与应急组织合作,以保持专注并开展具有现实利益的研究。」
更多精彩推荐
鸿蒙加海思,麒麟加龙芯,组合拳能否渡劫“生态”危机
用 Python 详解《英雄联盟》游戏取胜的重要因素!
万字长文总结机器学习的模型评估与调参 | 附代码下载
“Talk is cheap, show me the code”你一行代码有多少漏洞?
科普 | 定义 Eth2.0 中的验证者质量
相关文章:

DataBind数据核心
作者:飞刀 这一节主要是要讲DataBind,这个在ASP.net中是很重要的东东,几乎所有的控件都需要它来控制数据的操作。也可以说是ASP.net的数据核心。 我们先来看一个简单的例子: <% Page Language"C#" %> <% …

convertViewsetTag方法的一点理解
转自:http://blog.163.com/freemanls126/blog/static/164585061201171210504864/ 前言 首先我们要知道setTag方法是干什么的,SDK解释为 Tags Unlike IDs, tags are not used to identify views. Tags are essentially an extra piece of information tha…

iOS使用Security.framework进行RSA 加密解密签名和验证签名
iOS 上 Security.framework为我们提供了安全方面相关的api; Security框架提供的RSA在iOS上使用的一些小结 支持的RSA keySize 大小有:512,768,1024,2048位支持的RSA 填充方式有三种:NOPadding,PKCS1,OAEP 三…

Android APK反编译详解(附图)
这段时间在学Android应用开发,在想既然是用Java开发的应该很好反编译从而得到源代码吧,google了一下,确实很简单,以下是我的实践过程。 在此郑重声明,贴出来的目的不是为了去破解人家的软件,完全是一种学习…
你不知道的18个Python高效编程技巧
来源 | Python编程时光初识Python语言,觉得python满足了我上学时候对编程语言的所有要求。python语言的高效编程技巧让我们这些大学曾经苦逼学了四年c或者c的人,兴奋的不行不行的,终于解脱了。高级语言,如果做不到这样,…

Alisql源码编译安装(详细篇)
前言 AliSQL 在 2016 云栖大会宣布开放源代码之后,迅速就获得了广泛的关注,目前(2016-10-27) star 数目已达 1187,欢迎访问 AliSQL GitHub 项目关注。社区反应也非常活跃,在 Issue 中提了不少反馈建议,其中有一部分是和…

如何给DataGrid添加自动增长列
作者: cuike519的专栏 http://blog.csdn.net/cuike519/我想我们都知道在数据库中如何添加自增长列,我们可以将这个自增长列绑定到DataGrid上使得用户方便的知道现在是第几行,今天我介绍一种不用数据库就可以简单显示出自增长列的方法&…
达摩院NLP团队斩获六项世界冠军背后,让AI没有难懂的语言
2018年末,BERT横空出世,它采用自编码对句子进行表示,通过预测掩盖词和上下句之间的关系作为语言模型学习任务,使用更多的数据,更大的模型,在多个自然语言处理(NLP)任务中显著超越之前…

提权巧用RAR.EXE
rar.exe是什么?它就是大名鼎鼎的winrar自带的命令行解压程序。在提权中我们经常要下载各种敏感文件,比如:SU目录。你想一下,如果su目录文件这么多,难道你要一个个的下载??这明显就很麻烦,有了ra…
OSGI企业应用开发(二)Eclipse中搭建Felix运行环境
上篇文章介绍了什么是OSGI以及使用OSGI构建应用的优点,接着介绍了两款常用的OSGI实现,分别为Apache Felix和Equinox,接下来开始介绍如何在Eclipse中使用Apache Felix和Equinox搭建OSGI运行环境。 一、搭建Apache Felix运行环境 上篇文章中介绍…
马斯克脑机接口、BrainOS相继发布,不努力也能有出路了
作者 | 马超责编 | Carol封图 | CSDN 下载自视觉中国在北京时间的8月29日凌晨,钢铁侠埃隆马斯克投资1亿多美元的脑机接口初创公司公司Neuralink(http://www.neurolink.company/)进行了一次现场发布会,展示新一代的脑机接口设备。这…

C语言单向链表的实现
一个简单结点的结构体表示为:struct note{int data; /*数据成员可以是多个不同类型的数据*/struct note *next; /*指针变量成员只能是-个*/}; 一个简单的单向链表的图示1.链表是结构、指针相结合…

Java开发常用Linux命令
1.查找文件 find / -name filename.txt根据名称查找/目录下的filename.txt文件。 find . -name "*.xml"递归查找所有的xml文件 find . -name "*.xml" |xargs grep "hello world"递归查找所有文件内容中包含hello world的xml文件 grep -H spring …

数据库开发基本操作-安装Sql Server 2005出现“性能监视器计数器要求”错误解决方法...
今天在安装SQL Server 2005时,出现“性能监视器计数器要求”错误,因为以前出现过这种错误,得到了解决。今天又又出现这种错误,但并不是很清楚当时的解决办法,所以这次把解决方法记录下来,供自己以后参考&am…
华为昇腾师资培训沙龙·南京场 |华为昇腾 ACL 语言开发实践全程干货来了!看完就实操系列...
自今年疫情以来,AI 技术加速进入了人们的视线,在抗疫过程中发挥了重要作用,产业发展明显提速,我国逐步走出了一条由需求导向引领商业模式创新、市场应用倒逼基础理论和关键技术创新的发展道路,AI 人才的争夺战也正式打…
设计模式之C#实现---Builder
作者:cuike519的专栏 http://blog.csdn.net/cuike519/我们将要介绍一个和它比较像的创建型模式 Builder (至于关于 Builder 的详细内容您可以参考 GOF 的书,在这里不重复了。)。在 GOF 的书里 Builder 的目的是这样的࿱…

微信小程序开发之不能使用eval函数的问题
2019独角兽企业重金招聘Python工程师标准>>> 一 eval函数问题 JavaScript中的eval函数是颇受开发者争议的问题之一,问题主要在于其可能导致的不安全性。有关此方面问题,在此不再赘述,读者可能很容易地浏览到许多介绍性文章。 但是…

设计模式之C#实现--FactoryMethod
作者:cuike519的专栏 http://blog.csdn.net/cuike519/工厂方法的目的很明确就是定义一个用来创建对象的接口,但是他不直接创建对象,而由他的子类来创建,这样一来就将创建对象的责任推迟到了该接口的子类中,创建什么类…
美国AI博士指出,自学Python到底能做什么
我见过市面上很多的 Python 讲解教程和书籍,他们大都这样讲 Python 的:先从 Python 的发展历史开始,介绍 Python 的基本语法规则,Python 的 list, dict, tuple 等数据结构,然后再介绍字符串处理和正则表达式࿰…

关于微博溯源的后续问题
1、在进行关键词搜索的时候,如何分词,我们不可能用语料库进行匹配,已没有语料可以学习。 2、关于转折点的寻找。目前我们使用高级搜索,从当前时间往前推,根据搜索到微博的条数变化,确定时间发生具体时间&am…

python3的数据类型以及模块的含义
python3的数据类型以及模块的含义购物车转载于:https://blog.51cto.com/11834445/1884901
设计模式之C#实现---- ProtoType
作者: cuike519的专栏 http://blog.csdn.net/cuike519/该模式的意图是:用原型实例指定创建对象的种类,并且通过拷贝这些原型创建新的对象。那么首先我们应该已经有了一个对象,同时这个对象还支持自我复制(科隆&…

快速排序(二)最后修改
1 //2012-07-162 void quickSort(element list[], int left, int right)//快速排序3 {4 int ileft;5 int jright;6 7 if(i > j) //判断需要i<j8 return;9 10 element templist[i]; 11 12 while(i<j) 13 { 14 while(i<j …
性能超越GPU、FPGA,华人学者提出软件算法架构加速AI实时化
作者 | 王言治,美国东北大学电子与计算机工程系助理教授出品 | AI科技大本营(ID:rgznai100)近年来,机器学习(Machine Learning)领域的研究和发展可谓是与日俱新,各式各样与机器学习相关的研究成果与应用层出不穷&#…

PHP获取毫秒时间戳,利用microtime()函数
PHP获取毫秒时间戳,利用microtime()函数 php本身没有提供返回毫秒数的函数,但提供了一个microtime()函数,借助此函数,可以很容易定义一个返回毫秒数的函数。php的毫秒是没有默认函数的,但提供了一个microtime()函数&am…

.NET中添加控件数组
作者:cuike519的专栏 http://blog.csdn.net/cuike519/添加控件数组 在.NET里面我好像没有找到有关于控件数组的说明,但是前两天偶在网上看到了一篇关于如何在.NET里面实现控件数组的文章(该文章请参看MSDN).记得大学的时候在使用VB的时候使用过控件数组,可是到了…
如何在机器学习的框架里实现隐私保护?
编者按:数据时代,人们从技术中获取便利的同时,也面临着隐私泄露的风险。微软倡导负责任的人工智能,因此机器学习中的隐私保护问题至关重要。本文介绍了目前机器学习中隐私保护领域的最新研究进展,讨论了机密计算、模型…

函数图像轻松画:教你用永中图象
函数图像轻松画:教你用永中图象 函数图像轻松画:教你用永中图象转载于:https://blog.51cto.com/premium/933220

c语言语系的命名风格和java系命名风格
c语言系的命名风格:单词之间使用下划线分隔。如上图。 java语言是另外一个系,javascript属于java语系(当年就是想借助java的名气所以命名javascript)。java语系是驼峰式命名法,如getElementById()。如果使用c语系命名风格则使用下划线分隔 ge…

全国IP地址分配表
xa.sn.cn,西安公众网,西安,陕西,CN,202.100.0.* xa.sn.cn,西安公众网,西安,陕西,CN,202.100.1.* xa.sn.cn,西安公众网,西安,陕西,CN,202.100.2.* xa.sn.cn,西安公众网,西安,陕西,CN,202.100.3.* xa.sn.cn,西安公众网,西安,陕西,CN,202.100.4.* xa.sn.cn,西安公众网,西安,陕西,C…