当前位置：首页 > 编程日记 > 正文

深度学习开源库tiny-dnn的使用(MNIST)

编程日记 2024-12-24 09:00:00

tiny-dnn是一个基于DNN的深度学习开源库，它的License是BSD 3-Clause。之前名字是tiny-cnn是基于CNN的，tiny-dnn与tiny-cnn相关又增加了些新层。此开源库很活跃，几乎每天都有新的提交，因此下面详细介绍下tiny-dnn在windows7 64bit vs2013的编译及使用。

1. 从https://github.com/tiny-dnn/tiny-dnn 下载源码：

$ git clone https://github.com/tiny-dnn/tiny-dnn.git 版本号为6281c1b，更新日期2016.12.03

2. 源文件中已经包含了vs2013工程，vc/vc12/tiny-dnn.sln，默认是win32的，这里新建一个x64的控制台工程tiny-dnn；

3. 仿照源工程，将相应.h文件加入到新控制台工程中，新加一个test_tiny-dnn.cpp文件；

4. 仿照examples/mnist中test.cpp和train.cpp文件中的代码添加测试代码；

#include "funset.hpp"
#include <string>
#include <algorithm>
#include "tiny_dnn/tiny_dnn.h"static void construct_net(tiny_dnn::network<tiny_dnn::sequential>& nn)
{// connection table [Y.Lecun, 1998 Table.1]
#define O true
#define X falsestatic const bool tbl[] = {O, X, X, X, O, O, O, X, X, O, O, O, O, X, O, O,O, O, X, X, X, O, O, O, X, X, O, O, O, O, X, O,O, O, O, X, X, X, O, O, O, X, X, O, X, O, O, O,X, O, O, O, X, X, O, O, O, O, X, X, O, X, O, O,X, X, O, O, O, X, X, O, O, O, O, X, O, O, X, O,X, X, X, O, O, O, X, X, O, O, O, O, X, O, O, O};
#undef O
#undef X// by default will use backend_t::tiny_dnn unless you compiled// with -DUSE_AVX=ON and your device supports AVX intrinsicstiny_dnn::core::backend_t backend_type = tiny_dnn::core::default_engine();// construct nets: C: convolution; S: sub-sampling; F: fully connectednn << tiny_dnn::convolutional_layer<tiny_dnn::activation::tan_h>(32, 32, 5, 1, 6,  // C1, 1@32x32-in, 6@28x28-outtiny_dnn::padding::valid, true, 1, 1, backend_type)<< tiny_dnn::average_pooling_layer<tiny_dnn::activation::tan_h>(28, 28, 6, 2)   // S2, 6@28x28-in, 6@14x14-out<< tiny_dnn::convolutional_layer<tiny_dnn::activation::tan_h>(14, 14, 5, 6, 16, // C3, 6@14x14-in, 16@10x10-outconnection_table(tbl, 6, 16),tiny_dnn::padding::valid, true, 1, 1, backend_type)<< tiny_dnn::average_pooling_layer<tiny_dnn::activation::tan_h>(10, 10, 16, 2)  // S4, 16@10x10-in, 16@5x5-out<< tiny_dnn::convolutional_layer<tiny_dnn::activation::tan_h>(5, 5, 5, 16, 120, // C5, 16@5x5-in, 120@1x1-outtiny_dnn::padding::valid, true, 1, 1, backend_type)<< tiny_dnn::fully_connected_layer<tiny_dnn::activation::tan_h>(120, 10,        // F6, 120-in, 10-outtrue, backend_type);
}static void train_lenet(const std::string& data_dir_path)
{// specify loss-function and learning strategytiny_dnn::network<tiny_dnn::sequential> nn;tiny_dnn::adagrad optimizer;construct_net(nn);std::cout << "load models..." << std::endl;// load MNIST datasetstd::vector<tiny_dnn::label_t> train_labels, test_labels;std::vector<tiny_dnn::vec_t> train_images, test_images;tiny_dnn::parse_mnist_labels(data_dir_path + "/train-labels.idx1-ubyte", &train_labels);tiny_dnn::parse_mnist_images(data_dir_path + "/train-images.idx3-ubyte", &train_images, -1.0, 1.0, 2, 2);tiny_dnn::parse_mnist_labels(data_dir_path + "/t10k-labels.idx1-ubyte", &test_labels);tiny_dnn::parse_mnist_images(data_dir_path + "/t10k-images.idx3-ubyte", &test_images, -1.0, 1.0, 2, 2);std::cout << "start training" << std::endl;tiny_dnn::progress_display disp(static_cast<unsigned long>(train_images.size()));tiny_dnn::timer t;int minibatch_size = 10;int num_epochs = 30;optimizer.alpha *= static_cast<tiny_dnn::float_t>(std::sqrt(minibatch_size));// create callbackauto on_enumerate_epoch = [&](){std::cout << t.elapsed() << "s elapsed." << std::endl;tiny_dnn::result res = nn.test(test_images, test_labels);std::cout << res.num_success << "/" << res.num_total << std::endl;disp.restart(static_cast<unsigned long>(train_images.size()));t.restart();};auto on_enumerate_minibatch = [&](){disp += minibatch_size;};// trainingnn.train<tiny_dnn::mse>(optimizer, train_images, train_labels, minibatch_size, num_epochs, on_enumerate_minibatch, on_enumerate_epoch);std::cout << "end training." << std::endl;// test and show resultsnn.test(test_images, test_labels).print_detail(std::cout);// save network model & trained weightsnn.save(data_dir_path + "/LeNet-model");
}// rescale output to 0-100
template <typename Activation>
static double rescale(double x)
{Activation a;return 100.0 * (x - a.scale().first) / (a.scale().second - a.scale().first);
}static void convert_image(const std::string& imagefilename, double minv, double maxv, int w, int h, tiny_dnn::vec_t& data)
{tiny_dnn::image<> img(imagefilename, tiny_dnn::image_type::grayscale);tiny_dnn::image<> resized = resize_image(img, w, h);// mnist dataset is "white on black", so negate requiredstd::transform(resized.begin(), resized.end(), std::back_inserter(data),[=](uint8_t c) { return (255 - c) * (maxv - minv) / 255.0 + minv; });
}int test_dnn_mnist_train()
{std::string data_dir_path = "E:/GitCode/NN_Test/data";train_lenet(data_dir_path);return 0;
}int test_dnn_mnist_predict()
{std::string model { "E:/GitCode/NN_Test/data/LeNet-model" };std::string image_path { "E:/GitCode/NN_Test/data/images/"};int target[10] { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };tiny_dnn::network<tiny_dnn::sequential> nn;nn.load(model);for (int i = 0; i < 10; i++) {std::string str = std::to_string(i);str += ".png";str = image_path + str;// convert imagefile to vec_ttiny_dnn::vec_t data;convert_image(str, -1.0, 1.0, 32, 32, data);// recognizeauto res = nn.predict(data);std::vector<std::pair<double, int> > scores;// sort & print top-3for (int j = 0; j < 10; j++)scores.emplace_back(rescale<tiny_dnn::tan_h>(res[j]), j);std::sort(scores.begin(), scores.end(), std::greater<std::pair<double, int>>());for (int j = 0; j < 3; j++)fprintf(stdout, "%d: %f;  ", scores[j].second, scores[j].first);fprintf(stderr, "\n");// save outputs of each layerfor (size_t j = 0; j < nn.depth(); j++) {auto out_img = nn[j]->output_to_image();auto filename = image_path + std::to_string(i) + "_layer_" + std::to_string(j) + ".png";out_img.save(filename);}// save filter shape of first convolutional layerauto weight = nn.at<tiny_dnn::convolutional_layer<tiny_dnn::tan_h>>(0).weight_to_image();auto filename = image_path + std::to_string(i) + "_weights.png";weight.save(filename);fprintf(stdout, "the actual digit is: %d, correct digit is: %d \n\n", scores[0].second, target[i]);}return 0;
}

5. 运行程序，train时，运行结果如下图所示，准确率达到99%以上：

6. 对生成的model进行测试，通过画图工具，每个数字生成一张图像，共10幅，如下图：

7. 通过导入train时生成的model，对这10张图像进行识别，识别结果如下图，其中0,8,9被误识别为2,2,1.

GitHub：https://github.com/fengbingchun/NN_Test

https://www.dkcj.cn/info/33206.html

如何学习SVM？怎么改进实现SVM算法程序？答案来了

编辑 | 忆臻来源 | 深度学习这件小事（ID：DL_NLP）【导读】在 3D 动作识别领域，需要用到 SVM（支持向量机算法），但是现在所知道的 SVM 算法很多很乱，相关的程序包也很多，有什…

编程日记2024/12/24 08:50:00

跟着石头哥哥学cocos2d-x（三）---2dx引擎中的内存管理模型

2019独角兽企业重金招聘Python工程师标准>>> 2dx引擎中的对象内存管理模型，很简单就是一个对象池引用计数，本着学好2dx的好奇心，先这里开走吧，紧接上面两节，首先我们看一个编码场景代码： hello…

编程日记2024/12/24 08:40:00

读8篇论文，梳理BERT相关模型进展与反思

作者 | 陈永强来源 | 微软研究院AI头条（ID:MSRAsia)【导读】BERT 自从在 arXiv 上发表以来获得了很大的成功和关注，打开了 NLP 中 2-Stage 的潘多拉魔盒。随后涌现了一大批类似于“BERT”的预训练（pre-trained）模型，有…

编程日记2024/12/24 08:30:00

Dlib库中实现正脸人脸检测的测试代码

Dlib库中提供了正脸人脸检测的接口，这里参考dlib/examples/face_detection_ex.cpp中的代码，通过调用Dlib中的接口，实现正脸人脸检测的测试代码，测试代码如下：#include "funset.hpp" #include <string>…

编程日记2024/12/24 08:20:00

20189317 《网络攻防技术》第二周作业

一.黑客信息 （1）国外黑客 1971年，卡普尔从耶鲁大学毕业。在校期间，他专修心理学、语言学以及计算机学科。也就是在这时他开始对计算机萌生兴趣。他继续到研究生院深造。20世纪60年代，退学是许多人的一个选择。只靠知识…

编程日记2024/12/24 08:10:00

centos 6.4 SVN服务器多个项目的权限分组管理

根据本博客中的cent OS 6.4下的SVN服务器构建一文，搭建好SVN服务器只能管理一个工程，如何做到不同的项目，多个成员的权限管理分配呢？一需求开发服务器搭建好SVN服务器，不可能只管理一个工程项目，如何做到…

编程日记2024/12/24 08:00:00

CIFAR是一个用于普通物体识别的数据集。CIFAR数据集分为两种：CIFAR-10和CIFAR-100。The CIFAR-10 and CIFAR-100 are labeled subsets of the 80 million tiny images dataset. They were collected by Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton.CIFAR-10由…

编程日记2024/12/24 07:50:00

取代Python？Rust凭什么

作者 | Nathan J. Goldbaum译者 | 弯月，责编 | 屠敏来源 | CSDN（ID：CSDNnews）【导语】Rust 也能实现神经网络？在前一篇帖子中，作者介绍了MNIST数据集以及分辨手写数字的问题。在这篇文章中，他将…

编程日记2024/12/24 07:40:00

【Mac】解决「无法将 chromedriver 移动到 /usr/bin 目录下」问题

问题描述在搭建 Selenium 库 ChromeDriver 爬虫环境时，遇到了无法将 chromedriver 移动到 /usr/bin 目录下的问题，如下图： 一查原来是因为系统有一个 System Integrity Protection (SIP) 系统完整性保护，如果此功能不关闭&#…

编程日记2024/12/24 07:30:00

【译文】怎样让一天有36个小时

作者：Jon Bischke原文地址：How to Have a 36 Hour Day 你经常听人说“真希望一天能多几个小时”或者类似的话吗？当然，现实中我们每天只有24小时。这么说吧，人和人怎样度过这24个小时是完全不同的。到现在这样的说法已经…

编程日记2024/12/24 07:20:00

Dlib库中实现正脸人脸关键点(landmark)检测的测试代码

Dlib库中提供了正脸人脸关键点检测的接口，这里参考dlib/examples/face_landmark_detection_ex.cpp中的代码，通过调用Dlib中的接口，实现正脸人脸关键点检测的测试代码，测试代码如下：/* reference: dlib/examples/face_l…

编程日记2024/12/24 07:10:00

LeetCode--004--寻找两个有序数组的中位数（java）

转自https://blog.csdn.net/chen_xinjia/article/details/69258706 其中，N14,N26,size4610. 1，现在有的是两个已经排好序的数组，结果是要找出这两个数组中间的数值，如果两个数组的元素个数为偶数，则输出的是中间两个元…

编程日记2024/12/24 07:00:00

开源sk-dist，超参数调优仅需3.4秒，sk-learn训练速度提升100倍

作者 | Evan Harris译者 | Monanfei编辑 | Jane 出品 | AI科技大本营（ID：rgznai100)【导语】这篇文章为大家介绍了一个开源项目——sk-dist。在一台没有并行化的单机上进行超参数调优，需要 7.2 分钟，而在一百多个核心的 Spark 群集…

编程日记2024/12/24 06:50:00

Windows和Linux下通用的线程接口

对于多线程开发，Linux下有pthread线程库，使用起来比较方便，而Windows没有，对于涉及到多线程的跨平台代码开发，会带来不便。这里参考网络上的一些文章，整理了在Windows和Linux下通用的线程接口。经过测试&am…

编程日记2024/12/24 06:40:00

MySQL 性能调优的10个方法

MYSQL 应该是最流行了 WEB 后端数据库。WEB 开发语言最近发展很快，PHP， Ruby, Python, Java 各有特点，虽然 NOSQL 最近越來越多的被提到，但是相信大部分架构师还是会选择 MYSQL 来做数据存储。MYSQL 如此方便和稳定，以…

编程日记2024/12/24 06:30:00

他们用卷积神经网络，发现了名画中隐藏的秘密

作者 | 神经小刀来源 |HyperAI超神经（ ID: HyperAI）导语：著名的艺术珍品《根特祭坛画》，正在进行浩大的修复工作，以保证现在的人们能感受到这幅伟大的巨制，散发出的灿烂光芒。而随着技术的进步，…

编程日记2024/12/24 06:20:00

机器学习公开课~~~~mooc

https://class.coursera.org/ntumlone-001/class/index

编程日记2024/12/24 06:10:00

DLM：微信大规模分布式n-gram语言模型系统

来源 | 微信后台团队Wechat & NUS《A Distributed System for Large-scale n-gram Language Models at Tencent》分布式语言模型，支持大型n-gram LM解码的系统。本文是对原VLDB2019论文的简要翻译。摘要n-gram语言模型广泛用于语言处理，例如自动语音…

编程日记2024/12/24 06:00:00

Ubuntu14.04 64位机上安装cuda8.0+cudnn5.0操作步骤

查看Ubuntu14.04 64位上显卡信息，执行：lspci | grep -i vga lspci -v -s 01:00.0 nvidia-smi第一条此命令可以显示一些显卡的相关信息；如果想查看某个详细信息，可以执行第二条命令;如果是NVIDIA卡， 可继续执行第三条命…

编程日记2024/12/24 05:50:00

SQLI DUMB SERIES-5

less5 （1）输入单引号，回显错误，说明存在注入点。输入的Id被一对单引号所包围，可以闭合单引号 （2）输入正常时：?id1 说明没有显示位，因此不能使用联合查询了；可…

编程日记2024/12/24 05:40:00

javascript RegExp

http://www.w3schools.com/jsref/jsref_obj_regexp.asp声明-------------modifiers：{i,g,m}1. var pattnew RegExp(pattern,modifiers);2. var patt/pattern/modifiers;------------------------例子：var str "Visit W3Schools"; //两…

编程日记2024/12/24 05:30:00

Ubuntu14.04 64位机上安装OpenCV2.4.13(CUDA8.0)版操作步骤

Ubuntu14.04 64位机上安装CUDA8.0的操作步骤可以参考http://blog.csdn.net/fengbingchun/article/details/53840684，这里是在已经正确安装了CUDA8.0的基础上安装OpenCV2.4.13(CUDA8.0)操作步骤：1. 从http://opencv.org/downloads.html 下载OpenCV2.…

编程日记2024/12/24 05:20:00

一篇文章能够看懂基础代码之CSS

web页面主要分为三块内容：js：控制用户行为和执行代码行为html元素：控制页面显示哪些控件（例如按钮，输入框，文本等）css：控制如何显示页面上的空间，例如布局，颜…

编程日记2024/12/24 05:10:00

谷歌NIPS论文Transformer模型解读：只要Attention就够了

作者 | Sherwin Chen译者 | Major，编辑 | 夕颜出品 | AI科技大本营（ID:rgznai100）导读：在 NIPS 2017 上，谷歌的 Vaswani 等人提出了 Transformer 模型。它利用自我注意（self-attention）来计算其…

编程日记2024/12/24 05:00:00

中国移动与苹果联姻三星在华霸主地位或遭取代

据国外媒体12月24日报道，在各方的期待下，苹果终于宣布中国移动将于2014年1月17日开始销售支持其网络的iPhone手机。而中国移动也将于12 月25日开始正式接受预定。作为中国以及世界最大的移动运营商，中国移动与苹果的合作，将会帮助…

编程日记2024/12/24 04:50:00

二维码Data Matrix编码、解码使用举例

二维码Data Matrix的介绍见： http://blog.csdn.net/fengbingchun/article/details/44279967 ，这里简单写了个生成二维码和对二维码进行识别的测试例子，如下：int test_data_matrix_encode() {std::string str "中国_abc_DEF…

编程日记2024/12/24 04:40:00

PDF文件如何转成markdown格式

百度上根据pdf转makrdown为关键字进行搜索，结果大多数是反过来的转换，即markdown文本转PDF格式。但是PDF转markdown的解决方案很少。正好我工作上有这个需求，所以自己实现了一个解决方案。下图是一个用PDF XChange Editor打开的PDF文件&am…

编程日记2024/12/24 04:30:00

关于SAP BW提示“Carry out repairs in non-original only

为什么80%的码农都做不了架构师？>>> 这个提示是由于你在生产系统（正式系统）里面修改了一些东西，才提示"Carry out repairs in non-original system only if they are urgent"这个警告，理论上我们…

编程日记2024/12/24 04:20:00

windows7 64位机上安装配置CUDA7.5(或8.0)+cudnn5.0操作步骤

按照官网文档 http://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html#axzz4TpI4c8vf 进行安装：在windows7上安装cuda8.0/cuda7.5的系统需求：(1)、ACUDA-capable GPU(本机显卡为GeForce GT 640M)；(2)、A support…

编程日记2024/12/24 04:10:00

多重影分身：一套代码如何生成多个小程序？

前言影分身术，看过火影的都知道，一个本体，多个分身。大家肯定要问了，那小程序开发跟影分身术也能扯上关系？没错，那自然就是：一套代码，多个小程序啦。各位先别翻白眼，且…

编程日记2024/12/24 04:00:00