当前位置：首页 > 编程日记 > 正文

【Dlib】dlib实现深度网络学习之 input层

编程日记 2025-01-08 11:10:00

1、 dlib::input

模板类，深度神经网络的简单输入层，它将某种图像作为输入并将其加载到网络中。
这是一个基本的输入层，它只是简单地将图像复制到一个张量中。
注意：dlib::input只支持输入dlib::matrix和dlib::array2d类型，并且它们的像素类型必须是合法的，eg：必须存在 pixel_traits<T::type>

以dlib::matrix为例：
原型：

template <typename T, long NR, long NC, typename MM, typename L>
class input<matrix<T,NR,NC,MM,L>>

主要成员函数说明：

template <typename forward_iterator>
void to_tensor ( forward_iterator ibegin, forward_iterator iend, resizable_tensor& data ) const

说明：
将图像数据转换成张量并保存到data变量中。假定图像有R行、C列和K个通道，则图像数据和张量的对应关系如下

  - #data.num_samples() == std::distance(ibegin,iend)	//std::distance计算迭代器之间的距离（第一个和最后一个元素之间的个数）- #data.nr() == R- #data.nc() == C- #data.k() == K

例如：

  matrix<float,3,3>转换成张量tensor是3行、3列、1通道；matrix<rgb_pixel,4,5> 转换成张量tensor是4行、5列、3通道；std::array<matrix<float,3,3>,5> 转换成张量tensor是3行、3列、5通道；

注意，如果matrix的像素类型是unsigned char、rgb_pixel或者以unsigned char为basic_pixel_type的其它像素类型，会将张量中的值都除外256，即值在[0,1]返回内。

2、dlib::input_rgb_image

和dlib::input相似，它将RGB图像作为输入并将其加载到网络中。并且在将图像转换为张量时从每个颜色通道中减去平均颜色值（对图片进行预处理，零均值化(zero-mean) / 中心化）。

3、dlib::input_rgb_image_sized

该层具有与input_rgb_image相同的接口和行为，除了它要求输入图像具有特定大小（指定NR行和NC列）。还可以通过复制构造或赋值在input_rgb_image和input_rgb_image_size之间进行转换。
原型：

template <size_t NR, size_t NC=NR>
class input_rgb_image_sized

该层主要成员变量：

float avg_red;
float avg_green;
float avg_blue;

可以通过构造函数设置：input_rgb_image_sized (float avg_red_, float avg_green_, float avg_blue_)

默认参数打印：layer<131> input_rgb_image_sized(122.782,117.001,104.298) nr=50 nc=50

4、dlib::input_layer

模板函数，获取网络的输入层。
原型：

template <typename net_type>
auto& input_layer (net_type& net);

5、dlib::input_tensor_to_output_tensor

原型：

template <typename net_type>
dpoint input_tensor_to_output_tensor(const net_type& net, dpoint p);

说明：
给定网络net和输入张量中的dpoint(即行、列坐标)，该函数返回输出张量网络中相应的dpoint。
这种映射在处理全卷积网络时非常有用，可以获取输入和对应的输出特征映射。
如果网络包含跳跃层，那么在计算这个坐标映射时，跳跃层跳过的任何层都将被忽略。
也就是说，如果您将网络从输出层走到输入层，每当您遇到一个跳跃层时，您都会跳到跳跃层所指示的层，您将访问所涉及的网络中的各个层
这种行为是有用的，因为它允许您计算一些辅助DNN作为一个单独的计算分支，独立于主网络在图像上运行某种全卷积网络的工作。例如，您可能希望在网络中有一个分支来计算一些全局图像级别的摘要/特性。

6、dlib::input_rgb_image_pyramid

原型：

template <typename PYRAMID_TYPE> 
class input_rgb_image_pyramid

说明：
此输入层使用matrix<rgb_pixel>类型的RGB图像。它与input_rgb_image相同，只是它输出的张量包含每个输入图像的平铺图像金字塔（参见create_tiled_pyramid），而不是每个图像的简单副本。
该输入层旨在与诸如MMOD loss layer的损耗层一起使用。
在这里插入图片描述

https://www.dkcj.cn/info/35379.html

【Dlib】dlib实现深度网络学习之 input层

1、 dlib::input

2、dlib::input_rgb_image

3、dlib::input_rgb_image_sized

4、dlib::input_layer

5、dlib::input_tensor_to_output_tensor

6、dlib::input_rgb_image_pyramid

相关文章：

首发 | 13篇京东CVPR 2019论文！你值得一读~ 技术头条

Windows 活动目录（AD）服务器系统升级到2012之活动目录角色迁移（三）

《星际争霸2》引擎技术解析

回顾与展望：大热的AutoML究竟是什么？ | 技术头条

【Python】深度学习中将数据按比例随机分成随机训练集和测试集的python脚本

docker 系列之配置阿里云镜像加速器

LVM-HOWTO/学习笔记(二)

【python】使用python脚本将LFW数据中1672组同一个人多张照片拷贝出来

EXP6 信息搜集与漏洞扫描

百度发的208亿春晚红包，靠这样的技术送到了你手上 | 解读

一步一步学Silverlight 2系列（10）：使用用户控件

何恺明的GN之后，权重标准化新方法能超越GN、BN吗？ | 技术头条

【AI】CelebA数据介绍、下载及说明

Zend Framework Mail通过网易免费邮箱发送邮件

将shp导入SDE中出现“表或视图不存在”问题

【python】使用python脚本将CelebA中同一人的图片捡到对应单独的文件夹中

仅用语音，AI就能“脑补”你的脸！ | 技术头条

如何在SAP云平台上使用MongoDB服务

C#中将dll汇入exe，并加壳

【AI】dlib中图像标注工具 imglab 详细说明

最萌算法学习来啦，看不懂才怪！| 码书

Redis 缓存设计原则

最强大,最简洁的【禁止输入中文】

无监督机器学习中，最常见4类聚类算法总结 | 技术头条

自动红眼移除算法附c++完整代码

【Dlib】在GPU环境中运行dlib中的例子dnn_mmod_ex报错...dlib::cuda_error...Error while calling cudaMalloc...

Exchange 2010正式发布了

【python】使用python脚本将CelebA中图片按照 list_attr_celeba.txt 中属性处理（删除、复制、移动）

firefly 编译opencv3.3.1, CMake报错

AI时代，为何机器人公司无法盈利只能走向倒闭？