当前位置: 首页 > 编程日记 > 正文

使用深度学习检测混凝土结构中的表面裂缝

65f9dcc278c1a5b97d17ff0c7e17e0ae.gif

作者 | 小白

来源 | 小白学视觉

0e402c540cda98b5dd12beaeac9aaca7.png

混凝土建筑裂缝


介绍

表面裂缝检测是监测混凝土结构健康的一项重要任务。如果裂纹发展并继续扩展,它们会减少有效承载表面积,并且随着时间的推移会导致结构失效。裂纹检测的人工过程费时费力,且受检验人员主观判断的影响。在高层建筑和桥梁的情况下,手动检查也可能难以执行。在这篇文章中,我们使用深度学习来构建一个简单但非常准确的裂缝检测模型。此外,我们在现实世界的数据上测试了模型,发现该模型在检测混凝土和非混凝土结构示例道路中的表面裂缝方面是准确的。该代码在Github上的链接上开源。

数据集

在这篇文章中,我们使用了公开可用的混凝土裂缝图像数据集,该数据集由 20,000 张有裂缝的混凝土结构图像和 20,000 张无裂缝的图像组成。该数据集由 458 张高分辨率图像(4032x3024 像素)生成。数据集中的每个图像都是 227 x 227 像素的 RGB 图像。部分有裂纹和无裂纹的示例图如下所示:

e559351657c1520c43712a00bb3929bf.png

带有裂纹的示例图像

e7d3460f2d628b839c9915fa31a966c7.png没有裂纹的示例图像

可以看出,数据集有各种各样的图像——不同颜色、不同强度和形状的裂缝。

建立模型

对于这个问题,让我们在 Pytorch 中构建一个卷积神经网络(CNN)。由于我们的图像数量有限,因此我们将使用预训练的网络作为起点,并使用图像增强功能来进一步提高准确性。图像增强使我们能够进行诸如垂直和水平翻转、旋转和亮度变化之类的转换,从而显着增加样本并帮助模型泛化。

对于以下步骤,请参考我在 Github 上的代码。

将输入数据混洗并拆分为 Train 和 Val

下载的数据将有 2 个文件夹,一个用于正样本文件夹,一个用于负样本文件夹,我们需要将其拆分为 train 和 val。下面的代码片段将为 train 和 val 创建新文件夹,并将 85% 的数据随机混洗到 train 中,并将其余数据随机放入 val 中。

a804dc6608fb626fb09b8259b9d099c5.png

拆分为 train 和 val

应用转换

Pytorch 可以轻松应用数据转换,这可以增强训练数据并帮助模型提高泛化性。我们选择的转换是随机旋转、随机水平和垂直翻转以及随机颜色抖动。此外,每个通道除以 255,然后归一化,这有助于神经网络训练。

8f2af43115ad19fd1ee463fd1b735056.png

转变

预训练模型

我们使用在 ImageNet 上经过预训练的 Resnet 50 模型来快速启动模型。如下所示,ResNet50 模型由 5 个阶段组成,每个阶段都有一个卷积和 Identity 块。每个卷积块有 3 个卷积层,每个标识块也有 3 个卷积层。ResNet-50 有超过 2300 万个可训练参数。我们将冻结所有这些权重和 2 个全连接的层——第一层在输出中有 128 个神经元,第二层在输出中有 2 个神经元,这是最终的预测。

01cbe5d1fa82578c760954b182596b32.pngResNet50 模型

6da95ddce5f4f35deb03dc43ef1b603e.png

ResNet 模型层

如模型摘要所示,该模型有 2300 万个不可训练参数和 262K 个可训练参数

708b548048457931c167121712ff04e1.png

模型参数

我们使用 Adam 作为优化程序并训练模型 6 个 epoch。


真实图像上的模型训练和预测

我们用迁移学习训练,然后在训练数据集模型,同时在验证集上测量损失和准确性。如下面的损失和准确率数字所示,模型训练的非常快。在第 1 个 epoch 之后,训练准确率为 87%,验证准确率为 97%!这就是迁移学习的力量,我们的最终模型的验证准确率为 98.4%。

9c7f01964bd830ccd1eb3fe40fb4a4de.png

模型训练统计

在真实图像上测试模型

现在是最有趣的部分。是的,该模型适用于验证数据,但我们希望确保它也适用于互联网上看不见的数据。为了测试这一点,我们随机拍摄了混凝土开裂结构和路面裂缝的图像,这些图像比我们的训练图像大得多。请记住,该模型是在 227,227 像素的切片上训练的。我们现在将输入图像分成小块并对其进行预测。如果模型预测有裂纹,我们将补丁涂成红色(有裂纹),否则将补丁涂成绿色。以下代码片段将执行此操作。

01f62f14257b256517afb2f7c529923f.png切片预测

该模型在从未见过的图像上效果非常好。如下图所示,该模型能够通过处理图像上的 100 多个补丁来检测混凝土中很长的裂缝。

f625a5581fc5812f8101b8f4ef9fb6fd.png混凝土裂缝检测。左原图。右侧红色区域是有裂纹的预测,绿色区域是无裂纹的预测

此外,也在道路裂缝上测试了该模型。这个模型没有在路面数据集上训练过,但在识别道路裂缝方面也做得很好!

d89331200a1a39bd4aae2ca0a75309f7.png道路裂缝检测。左原图。右侧红色区域是有裂纹的预测,绿色区域是无裂纹的预测

在此项目的 github 链接上共享了更多现实世界图像以及有关它们的模型预测。


结论

这篇文章展示了使用深度学习和开源数据构建现实世界的应用程序变得多么容易。整个工作花了半天时间,输出了一个实用的解决方案。我希望小伙伴们自己尝试这个代码,并在更多现实世界的图像上进行测试。

参考

  • 2018 — Özgenel, Ç.F., Gönenç Sorguç, A. “Performance Comparison of Pretrained Convolutional Neural Networks on Crack Detection in Buildings”, ISARC 2018, Berlin.

  • Good paper on importance of crack detection — https://www.hindawi.com/journals/ace/2018/3924120/

  • Good blog on Image Classification in Pytorch. Several of the code snippets used in the blog were from here.

  • Another good blog on Image Classification in Pytorch. Several of the code snippets used in the blog were from here.

Github代码连接:

  1. https://github.com/priya-dwivedi/Deep-Learning/tree/master/crack_detection

  2. https://github.com/priya-dwivedi/Deep-Learning/blob/master/crack_detection/Crack%20Detection%20Model.ipynb

  3. https://github.com/priya-dwivedi/Deep-Learning/tree/master/crack_detection/real_images

84261b884ab7c196263b906c3234cd08.gif

909810c3186488448ae408dabd27b60c.png

福利

小白入门机器学习的三个问题

资讯

Meta新语音模型可支持128种语言交流

招募

内容整理志愿者招募令

专访

低代码平台产品的使用者都是谁?

4bf4557bee60571f1401a5e212d1ea6a.png

分享

b2da7a3d1f027f326a36e77e4b5407ff.png

点收藏

fe19cce1107621b270972a1b27599f1b.png

点点赞

2f80b69c8657cd6bf7eb560b19ea5e90.png

点在看

相关文章:

Python学习笔记--序列

Sequence序列 1.序列操作 seq[ind1:ind2] seq[ind] seq1 seq2 seq1 * seq2 seq * n obj in seq obj not in seq 2.切片操作 #反转操作 seq[::-1] #隔一个取一个 seq[::2] #取全部 seq[:None] ##序列类型可用的内建函数 enumerate(seq) #接受一个迭代对象,返回由索引…

「深度」线下大数据正成为构建精准“用户画像”的最大助力

不管是针对消费者的宣传还是营销,或者是针对公司的管理运营,大数据在其中的作用从本质来讲就是在构造“用户画像”。 近年来,在智能化趋势的推动下,社会经济的众多领域都发生了翻天覆地的变化,其中尤其以金融、零售等…

Android上成功实现了蓝牙的一些Profile

前段时间做蓝牙方面的开发,Google的Android只实现了Handset/Handfree和A2DP/AVRCP等Profile,而其 它常用的Profile如HID/DUN/SPP/OPP/FTP/PAN等却没有实现,并且Google方面关于何时实现也没有一个时间表。 前段时间我实现了HID/DUN/SPP三个Pro…

拥有「人类智能」的全球首款有「思想」的机器人,活细胞培养的神经元

出品 | AI科技大本营(ID:rgznai100) 脑机接口,其主体是人的大脑,利用人大脑中产生的信号转换为命令而执行任务。 首款有思想的机器人?是的,你真的没有看错! 反过来说呢,比如主体是机…

使用VS2010调试技巧让C指针无处遁形

Linux 下调试远没有windows下的VS方便,不管是VC6还是VS2003,2005,2008,2010,2012. VS2012自动格式化代码 CtrlKD VS下调试一定要注意尽量不要用F11,要用F10!不然需要引入库文件,提示…

Maven就是这么简单

2019独角兽企业重金招聘Python工程师标准>>> 什么是Maven Maven是一个采用纯Java编写的开源项目管理工具, Maven采用了一种被称之为Project Object Model (POM)概念来管理项目,所有的项目配置信息都被定义在一个叫做POM.xml的文件中.. **Maven是一款跨平…

C语言的内联函数的作用

关内联函数键字inline void myprintf(int a){priintf("%d",a);}int main(){for(i0;i<100;i)myprintf(3);}对于这个函数&#xff0c;在进行反复的打印3的过程中我们是不是要反复的调用myprintf(int a)这个函数&#xff0c;进函数和出函数是需要时间的&#xff0c;假…

推荐 2个十分好用的 pandas 数据探索分析神器!

作者 | 俊欣来源 | 关于数据分析与可视化今天小编给大家推荐两款超好用的工具来对数据进行探索分析。更好地帮助数据分析师从数据集当中来挖掘出有用的信息PandasGUI一听到这个名字&#xff0c;大家想必就会知道这个工具是在Pandas的基础之上加了GUI界面&#xff0c;它所具备的…

DoubleViewPager

https://github.com/eltld/DoubleViewPager https://github.com/eltld/DoubleViewPagerSample

OCQ亮相中国移动办公峰会 荣获2017中国移动办公创新品牌

11月21日至23日&#xff0c;由中国软件网主办的“新格局 再出发——企服三会”在北京中关村软件园国际会议中心隆重举行!国内市场上移动办公、CRM、HR三大领域的主流企业参加会议&#xff0c;百位业界专家学者汇聚一堂&#xff0c;交流经验&#xff0c;碰撞思维&#xff0c;对三…

typedef和define具体的详细区别

1) #define是预处理指令&#xff0c;在编译预处理时进行简单的替换&#xff0c;不作正确性检查&#xff0c;不关含义是否正确照样带入&#xff0c;只有在编译已被展开的源程序时才会发现可能的错误并报错。例如&#xff1a; #define PI 3.1415926 程序中的&#xff1a;areaPI*r…

IOS初级:NSKeyedArchiver

NSKeyedArchiver对象归档 首先要实现<NScoding>里面的两个代理方法initWithCoder,encodeWithCoder property (nonatomic, copy) NSString *keyName; /*将某个对象写入文件时候会调用在这个方法中说清楚哪些属性需要存储*/ - (void)encodeWithCoder:(NSCoder *)encoder{[e…

「摸鱼」神器来了,Python 实现人脸监测制作神器

作者 | 李秋键 出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09; 最近都在讨论工作摸鱼&#xff0c;网易云音乐也出了合理摸鱼时间表&#xff0c;今天给大家推荐如何用python实现摸鱼~码住呦&#xff01; 引言&#xff1a;脸部表情是人类情绪的最直接外部表现之一和进…

初学Java——选择

1.boolean数据类型 1)取值为true/false 2)关系操作符的运算结果是boolean类型&#xff08;6种关系运算符同C语言&#xff09;2.分支语句 1)单分支if 2)双分支if-else 3)多分支if-else(此编码风格可避免深度缩进) if(){ } else if(){ } else if(){ } …

C语言宏定义使用技巧

写好C语言&#xff0c;漂亮的宏定义很重要&#xff0c;使用宏定义可以防止出错&#xff0c;提高可移植性&#xff0c;可读性&#xff0c;方便性等等。下面列举一些成熟软件中常用得宏定义。。。。。。1&#xff0c;防止一个头文件被重复包含#ifndef COMDEF_H#define COMDEF_H//…

java显示本地磁盘所有盘符,显示桌面路径

import java.io.File; import javax.swing.filechooser.FileSystemView;/** 显示本地磁盘根盘符&#xff0c;显示桌面路径 */ public class RDDemo {static File[] files;public static void main(String[] args) {FileSystemView sys FileSystemView.getFileSystemView();fil…

Twitter 禁止未经用户同意分享照片和视频

整理 | 禾木木 出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09; Twitter 宣布将扩大私人信息政策&#xff0c;包括在未经个人许可的情况下共享的私人媒体&#xff0c;例如照片和视频&#xff0c;因为该社交媒体平台旨在改善用户隐私和安全。 “分享个人媒体&#xff…

这就是我向您推荐使用Thunderbird邮件客户端的理由

E-MAIL服务是最古老的互联网服务之一&#xff0c;相信很多人都在使用&#xff0c;只不过频率不同。IM出现后的&#xff08;及时通信工具&#xff09;一段时间&#xff0c;E-MAIL的通信不及时性估计让很多人交流会更倾向于IM。但是电子邮件&#xff08;E-MAIL&#xff09;仍然是…

ATT汇编语言与GCC内嵌汇编简介

AT&T汇编语言与GCC内嵌汇编简介1 AT&T 与INTEL的汇编语言语法的区别1.1大小写1.2操作数赋值方向1.3前缀1.4间接寻址语法1.5后缀1.6指令2 GCC内嵌汇编2.1简介2.2内嵌汇编举例2.3语法2.3.1汇编语句模板2.3.2输出部分2.3.3输入部分2.3.4限制字符2.3.5破坏描述部分2.4GCC如…

递归和迭代之间的差

递归的基本概念:编程技巧程序调用自身递归调用,是一个函数&#xff0c;调用自身. 在一个函数的定义直接或间接调用自己的方法,它通常是一个大的&#xff0c;复杂的问题分解成一个需要解决的问题类似于原来小问题,它可以大大减少的代码量.使用递归的能力是有限的语句来定义对象的…

智能交通:影响人类未来10-40年的重大变革

作者 | 百度创始人、董事长兼CEO李彦宏 《智能交通&#xff1a;影响人类未来10—40年的重大变革》&#xff0c;是我写的第三本关于人工智能的书。第一本是2017年编写的《智能革命&#xff1a;迎接人工智能时代的社会、经济与文化变革》&#xff0c;第二本是2020年编写的《智能…

Python--日志模块

# 时间 哪个文件里面的 第几行代码import loggingfrom logging import handlers# logging.debug(debug级别&#xff0c;最低级别&#xff0c;一般开发人员用来打印一些调试信息)# logging.info(info级别&#xff0c;正常输出信息&#xff0c;一般用来打印一些正常的操作)# logg…

Linux动态库(.so)搜索路径

众所周知&#xff0c;Linux动态库的默认搜索路径是/lib和/usr/lib。动态库被创建后&#xff0c;一般都复制到这两个目录中。当程序执行时需要某动态库&#xff0c;并且该动 态库还未加载到内存中&#xff0c;则系统会自动到这两个默认搜索路径中去查找相应的动态库文件&#xf…

redis-3.0.2集群部署

Redis 集群安装集群搭建步骤1、创建多个节点.2、为每个节点指派槽&#xff0c;并将多个节点连接起来&#xff0c;组成一个集群.3、当集群数据库的16384个槽都有节点在处理时&#xff0c;集群进入上线状态.要求&#xff1a;搭建一个包含6个节点的Redis集群&#xff0c;其中三个主…

联邦学习应用思考:需求还是方法?

作者 | 徐葳 清华大学交叉信息研究院长聘副教授、华控清交首席科学家前言&#xff1a;目前&#xff0c;“联邦学习”这个术语在市场上存在很多认识上的误解和混淆&#xff0c;主要原因是其既在广义上表达了保护数据前提下联合多方数据训练模型的需求&#xff0c;又在狭义上表示…

monkey如何获取app包名

别人学习网址&#xff1a;http://www.51testing.com/html/58/15092658-2984032.html 使用aapt aapt是sdk自带的一个工具&#xff0c;在sdk\builds-tools\目录下&#xff0c; 1. 在cmd中&#xff0c;切换至sdk\builds-tools\目录下&#xff0c;即aapt.exe目录下2.以QQ音乐为例…

嵌入式Web服务器移植

第一步 Boa程序的移植1、下载Boa源码下载地址: http://www.boa.org/&#xff0c; 或者http://sourceforge.net最新发行版本&#xff1a; 0.94.13下载 boa-0.94.13.tar.gz&#xff0c;注意&#xff1a;从boa上下载的是boa-0.94.13.tar.tar&#xff0c;解压方式一样解压&#xff…

一文详解 RNN 及股票预测实战(Python)!

作者 | 泳鱼来源 | 算法进阶循环神经网络&#xff08;RNN&#xff09;是基于序列数据&#xff08;如语言、语音、时间序列&#xff09;的递归性质而设计的&#xff0c;是一种反馈类型的神经网络&#xff0c;其结构包含环和自重复&#xff0c;因此被称为“循环”。它专门用于处理…

symfony2 Process 组件的学习笔记

2019独角兽企业重金招聘Python工程师标准>>> 安装 composer require "symfony/process:2.7.1" ##描述 process组件是可以开启一个子进程 去执行一个命令 ##例子 use Symfony\Component\Process\Process; $process new Process(ls -lsa); $process->ru…

C++模式学习------策略模式

当遇到同一个对象有不同的行为&#xff0c;方法&#xff0c;为管理这些方法可使用策略模式。 策略模式就是对算法进行包装&#xff0c;是把使用算法的责任和算法本身分割开来。通常把一个系列的算法包装到一系列的策略类里面&#xff0c;这些类继承一个抽象的策略类。使用这些算…