从代码设计到应用开发,入坑深度学习看这本书就够了
深度学习(Deep Learning)是机器学习中一种基于对数据进行表征学习的方法。近年来,深度学习已经在科技界、工业界日益广泛地应用。随着全球各领域多样化数据的极速积累和计算资源的成熟化商业服务,深度学习已经成为人工智能领域最有效的方法。
目前,深度学习技术在语音识别、图像分类、商品推荐等各应用领域不断刷新着智能处理水平纪录。但是与此同时,深度学习模型难以解释,参数调优困难,参数规模大训练周期长等问题也困扰着研究和开发人员。
当下介绍深度学习的书籍很多,但是《深度学习实战》一书视角不同,它重在实践,内容全面。《深度学习实战》英文版由O'REILLY出版社出版,中文版由机械工业出版社出版,作者Douwe Osinga曾供职于Google公司,是深度学习研究及实践方面的一位资深专家。
、
点击封面查看书籍详情
在书中,所有的例子都是用Python编写的,并且大部分代码的实现都依赖于优秀的Keras框架,每章的代码存放在一个notebook中,可以从网站下载学习。在实例章节,每章针对一种技术应用场景,从数据获取技巧开始,接着是几个完成本章目标的技巧和一个数据可视化的技巧。
文本处理领域
词嵌入是自然语言处理的基本方法,我们首先在第3章将使用预先训练好的词嵌入模型计算单词相似性,然后展示一些有趣的Word2vec数学特性,探索如何对高维空间进行可视化,接下来利用Word2vec等词嵌入的语义特性进行特定领域中的排名。
推荐系统在商业领域应用广泛,它基于先前收集到的用户评级数据进行训练。我们在第4章会使用新训练的嵌入来预测电影的评论分数,基于维基百科传出链接(outgoing link)构建一个简单的电影推荐系统。
循环神经网络是一类善于处理时间或序列的重要神经网络,在文本处理中应用广泛,我们在第5章使用RNN根据文本风格生成类似莎士比亚风格的文本,并对RNN的工作进行可视化。
智能客服会应用问答系统,其中关键一环是文本问题匹配,在第6章我们使用来自Stack Exchange网站的数据来构建整个问题的词嵌入,然后使用Pandas从这些嵌入来匹配查找类似的文档或问题。
在社交网络中人们会为给定的一小段文本来推荐适用的表情符号,在第7章我们使用Twitter API实现推文收集,用贝叶斯分类器来阐述基线性能,还介绍卷积模型以及组合模型及模型调优方法。
之后,在第8章我们将介绍序列神经网络来学习文本片段之间的转换,从古腾堡项目(Project Gutenberg)的19世纪小说中提取对话,并利用seq2seq工具包来训练聊天机器人。
图像处理领域
深度学习技术在图像识别和计算机视觉领域产生了比较深远的影响。在图像分类任务中,数十层(有时超过一百层)的神经网络已被证明十分有效,训练这样的网络需要极佳的处理能力和海量的训练图像。
在第9章我们将介绍如何加载预训练网络(该网络是Keras提供的五个预训练网络之一),研究图像输入网络之前所需要预处理过程,展示如何运行网络的推理模式。针对其他任务的新数据进行部分的重新训练也涵盖了迁移学习(transfer learning)概念。
在网络搜索中,可能有人会采取以图搜图模式。在第10章我们构建通过实例图片来搜索图的搜索引擎,我们研究如何查询维基数据(Wikidata),并从维基百科中获取适合的基础图片集开始着手。然后,我们将使用预训练网络为每个图片赋值,我们将研究主成分分析(principal components analysis,PCA)作为可视化展现图与图之间关系的一种方法。
在现实世界中,我们往往需要从一幅图像中检测提取多个目标对象的信息,这是图像处理中经典任务,也是一个十分活跃的研究领域,在Keras上的Python notebook中重现其中最先进的算法较为棘手。
在第11章我们使用Faster RCNN进行训练完成目标检测任务,Faster RCNN在用于训练图像分类器的同一个特征图上并行训练区域建议模型,而不是单独处理区域建议问题。
使用计算机来“魔术”渲染图像很有趣,在第12章我们将探讨一些用于可视化展现卷积网络进行图像分类时所见内容的技术。
然后,我们将介绍尺度(octaves)、深度梦想(deep dreaming)技术、格拉姆矩阵(gram matrices)等,之后,我们进一步将这种技术应用于现有图像,并采用文森特·梵高的名画《星空》的绘画风格渲染照片,使用两种样式的图像渲染同一张图片,从而获得一个两种风格之间的渲染结果。
基于实例生成图像是一个热门的研究领域,在该领域中每月都会涌现出新想法和新突破。
在第13章,我们将研究一个略有局限性的领域:手绘草图,从Google的Quick Draw数据集开始着手,建立一个能够学习“猫属性”的自编码器模型。我们还研究条件变分自编码器(conditional variational autoencoders),它在训练时会考虑图像标签,因此能够以随机样式再现特定类的图像。
在线搜索“免费图标”可以得到很多搜索结果。但是,这些结果并不是真正免费的(即没有任何使用限制的免费使用),大部分结果只是让用户感觉好像不需要花钱。此外,你还不能免费地重用这些图标,并且通常情况下网站会强烈建议你购买它们。
因此,在第14章,我们使用条件变分自编码器、生成式对抗网络(generative adversarial network,GAN)、RNN三种深度网络生成图标,从如何下载、提取,并将图标处理成可使用的标准格式。
音乐处理
语音识别和语音合成技术使得亚马逊Alexa和GoogleHome成为可能,然而,语音处理任务实际上是在亚马逊、Google或苹果的数据中心运行的,因此我们还不认为这些是真正的深度学习试验。尽管Mozilla的深度语音(Deep Speech)已取得了令人瞩目的进步,建立最先进的语音识别系统还是十分困难的。
第15章关注的重点是音乐,我们从训练音乐分类器模型开始,该模型可以告诉我们正在听的是什么音乐。然后,我们使用模型结果建立本地MP3索引,使用Spotfy API建立公开播放列表语料库,并用该库建立音乐推荐系统。
最后,该书在第16章介绍了在实际生产系统中使用模型的内容,让模型在真实的服务器或移动设备上运行。
近年,全球人工智能研究机构、研究院相继成立,深度学习成为人工智能的核心必备工具。对于深度学习研究人员,特别是应用开发工程师而言,如何摆脱深度学习模型的“黑盒”困境、如何让深度学习模型设计更加简洁高效、如何将深度学习快速地应用到具体的业务领域,该书进行了详细的介绍及代码示例,在每个实例场景,作者还提供具有重要价值的实践经验提点。读者如果想要进一步了解相关内容,可以参阅该书相关部分。
认真学完本书,读者将具备或提高两种能力:一是掌握深度学习的Python代码设计;二是能够自行开发深度学习具体应用。
《深度学习实战》
作者:杜威·奥辛格
出版时间:2019年5月
扫码购买
推荐理由:
本书是一本聚焦深度学习实际应用的开发指南。作者曾是Google的软件工程师,对深度学习研究及实践有着丰富的积累。本书记录了作者从实际工作中总结出来的很多开发技巧, 不仅涵盖与深度神经网络调试相关的通用技巧,包括排查错误、检查结果、选择激活函数、正则化和Dropout、设置训练参数等技巧,还通过实际例子介绍深度学习在文本处理、图像处理、音乐处理等方面的技巧,而且还从实际使用的角度阐述如何在生产系统中部署机器学习应用,非常适合开发实际应用的深度学习工程师阅读和参考。
扫码购买
公告
今天是码书商店618活动最后一天啦,现在购买书籍和科技好物可享8.8折优惠价哦,还可享受满300减30元,进入活动专题页还可领取5元随机券,三种优惠叠加使用,仅限今天啦,点此进入码书商店查看详情~
同时作为码书商店的运营人员,诚邀你们进入我们的“CSDN码书福利群”,群里会不定时的给大家赠书书籍、优惠券等,上一期的赠书活动已出炉,下一期的奖品是可擦笔记本,或有书籍推荐或者物流方面信息也可群里咨询~目前群已满100人,需要加群的请扫下方二维码添加微信,拉你入群哦~
相关文章:

小波矩特征提取matlab代码
这是我上研究生时写的小波矩特征提取代码: %新归一化方法小波矩特征提取---------------------------------------------------------- Fimread(a1.bmp);Fim2bw(F);Fimresize(F,[128 128]);%求取最上点for i1:128 for j1:128 if (F(i,j)1) yt…

hadoop生态搭建(3节点)-06.hbase配置
# http://archive.apache.org/dist/hbase/1.2.4/ # 安装 hbase tar -zxvf ~/hbase-1.2.4-bin.tar.gz -C /usr/local rm –r ~/hbase-1.2.4-bin.tar.gz # 配置环境变量# node1 node2 node3 vi /etc/profile# 在export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL下添…

异类框架BigDL,TensorFlow的潜在杀器!
作者 | Nandita Dwivedi译者 | 风车云马责编 | Jane出品 | AI 科技大本营(id:rgznai100)【导读】你能利用现有的 Spark 集群构建深度学习模型吗?如何分析存储在 HDFS、Hive 和 HBase 中 tb 级的数据吗?企业想用深度学习…

对IsUnderPostmaster变量初步学习
开始 在postmaster.c 中的 BackendStartup 中,有如下的代码: 其中定义了 IsUnderPostmastertrue。 而bgwriter 作为 postmaster 的子进程,它的 IsUnderPostmaster 也是为真。 * BackendStartup -- start backend process** returns: STATUS_…

C++读写ini配置文件GetPrivateProfileString()WritePrivateProfileString()
转自:http://hi.baidu.com/andywangcn/blog/item/10ba730f48160eeb37d122e9.html 配置文件中经常用到ini文件,在VC中其函数分别为: #include <Windows.h> //wince,WMobile.ppc不支持这几个函数 写入.ini文件:bool WritePriv…

地图下载2之天超图瓦片格式
接上一篇《地图下载1之天地图瓦片解析》,我们已经知道了天地图的瓦片格式,现在来分析一下超图中瓦片的存储结构。 其实,在GIS领域,只有像ESRI这样强大公司的SHP文件等能通用外,很多数据、格式等都不通用,都…

server 2003登录界面黑屏的解决办法
1、备份注册表(为了安全起见)具体办法:开始-> 运行窗口输入“regedit.exe”->回车->找到注册表->文件->导出->完成; 2、复制下面的文件内容到记事本然后另存为格式为.reg注册表扩展名导入注册表; Wi…

“学了半年后,我要揭开Python 3宗罪!”
有人曾说,未来只有2种人,会Python的人和....不懂Python的小学生,虽有夸张,这也意味着Python越来越重要了,究竟这门语言厉害在哪里?以下为你总结了Python3宗“罪”!Python凭啥这么优秀࿱…

连表/子查询/计算的sql
看不懂的sql语句 1.select om.*,money,cus.c_type,cus.c_weixin_name,isnull(cus.c_discount,0) c_discount,isnull(om.o_money-om.o_money*cus.c_discount,0) money1,isnull(money*(i_year_pointi_month_potinti_piece_point),0) money2,isnull((om.o_money-om.o_money*cus.c_…

vc6静态库的生成和调用
1、静态库的生成: 在vc6.0中CtrlN选择Projects下的Win32 Static Library,Project name:SumLib,点击OK,下一页中的两项可选可不选,点击Finish完成。 在此工程中新建lib.h和lib.cpp两个文件,源码如下: //lib.…

实例变量的访问及数据封装
你已经看到处理分数的方法如何通过名称直接访问两个实例变量numerator和denominator。事实上,实例方法总是可以直接访问它的实例变量的。然而,类方法则不能,因为它只处理本身,并不处理任何类实例(仔细想想)…

清华成立视觉智能研究中心,邓志东任中心主任
整理 | 阿司匹林出品 | AI科技大本营(ID: rgznai100)6月21日,清华大学人工智能研究院视觉智能研究中心正式成立,清华大学副校长、清华大学人工智能研究院管委会主任尤政院士,清华大学人工智能研究院院长张钹院士出席成…
Java并发编程(一)Thread详解
一、概述 在开始学习Thread之前,我们先来了解一下 线程和进程之间的关系: 线程(Thread)是进程的一个实体,是CPU调度和分派的基本单位。 线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制。 线…

MFC如何打开文件路径
转自:http://linyangmumu.blog.163.com/blog/static/6903134920101024419380/ 1.void OpenFile() { CString m_FileDir; BROWSEINFO bi; ZeroMemory(&bi, sizeof(BROWSEINFO)); bi.hwndOwner m_hWnd; bi.ulFlags BIF_RETURNONL…

HDOJ_ACM_数塔
Problem Description在讲述DP算法的时候,一个经典的例子就是数塔问题,它是这样描述的:有如下所示的数塔,要求从顶层走到底层,若每一步只能走到相邻的结点,则经过的结点的数字之和最大是多少?已经…

会数据分析的人别再低调了,我怕你会因此错失100万奖金
大家好我是一般周一不冒头一冒头就不一般的柚柚今天我给大家带来了一个好消息那就是“易观方舟Argo杯数据创客大赛”开始接受报名了!请不要怀疑就是那个国内领先的大数据公司——『易观』联合20家创新企业筹备了整整两个月的大赛正规、专业、含金量极高!…

CxImage类库的简介
转自:http://www.sudu.cn/info/html/edu/20080403/259688.html CxImage类库是个优秀的图像操作类库。他能快捷地存取、显示、转换各种图像。有的读者可能说,有那么多优秀的图像库,如OpenIL,FreeImage,PaintLib等等,他们可谓是功能…

MySQL 5.5 服务器变量详解(二)
innodb_adaptive_flushing{ON|OFF} 设定是否允许MySQL服务器根据工作负载动态调整刷写InnoDB buffer pool中的脏页的速率。动态调整刷写速率的目的在于避免出现IO活动尖峰。默认值为ON。作用范围为全局级别,可用于选项文件,属动态变量。innodb_adaptive_…

一文掌握异常检测的实用方法 | 技术实践
作者 | Vegard Flovik译者 | Tianyu责编 | Jane出品 | AI科技大本营(ID: rgznai100)【导读】今天这篇文章会向大家介绍几个有关机器学习和统计分析的技术和应用,并展示如何使用这些方法解决一些具体的异常检测和状态监控实例。相信对一些开发…

票据自动处理系统著名研究团队
国际上对票据自动处理系统的研究始于上世纪80年代,俄罗斯、美国、加拿大、日本、巴西等国在这个领域的研究工作开展得比较深入,著名的研究团体如加拿大Concordia大学的CENPARMI中心、MIT的PROFIT实验室、俄罗斯ABBYY软件公司、Mitek Systems公司CheckQue…

iOS开发之AVKit框架使用
2019独角兽企业重金招聘Python工程师标准>>> iOS开发之AVKit框架使用 一、引言 在iOS开发框架中,AVKit是一个非常上层,偏应用的框架,它是基于AVFoundation的一层视图层封装。其中相关文件和类都十分简单,本篇博客主要整…

DirectX10 学习笔记2:在多文档框架中初始化DirectX 10
显示功能是在视图类中完成的,所以DX10的初始化及绘制工作都是视图类中完成。 首先建立一个多文档工程,工程名为02_01,在视图类头文件中加载相关的库,并包含头文件: 在视图类的头文件中添加DX10相关的成员: …

碾压Bert?“屠榜”的XLnet对NLP任务意味着什么
作者张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队 AI Lab 负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍…

ORACLE中通过DBMS_CRYPTO包对表敏感字段进行加密
http://doc.primeton.com/pages/viewpage.action?pageId4917998

02 使用百度地图获得当前位置的经纬度
O 需求 通过百度地图,获取用户当前位置的经纬度 一 准备 确保你已按照上篇《01 如何将百度地图加入IOS应用程序?》完成了相关功能。本篇将在上一篇的基础上进行修改。 二 编码 (New标示本次新添加的代码;Delete表示本次需要删除的代码&#x…

中文NLP的分词真有必要吗?李纪为团队四项任务评测一探究竟 | ACL 2019
作者| Yuxian Meng、Xiaoya Li、Xiaofei Sun、Qinghong Han、Arianna Yuan、 Jiwei Li译者 | Rachel责编 | Jane出品 | AI科技大本营(ID: rgznai100)【导读】通常,中文文本处理的第一步称为分词,这好像已经成为一种“共识”&#…

Netty 粘包 拆包 编码 解码 序列化 介绍
目录: 粘包 & 拆包及解决方案 ByteToMessageDecoder基于长度编解码器基于分割符的编解码器google 的 Protobuf 序列化介绍其他的前言 Netty 作为一个网络框架,对 TCP 连接中的问题都做了全面的考虑,比如粘包拆包导致的半包问题࿰…

matlab 全局变量
转自:http://matlab.net.cn/matlabjichu/2010/201005/265.html 如果你要多于一个函数共用一个简单的变量,简单的处理方法就是把这个变量在所有函数中定义为global全局变量。在命令行做同样的事情,如果你要工作空间访问上述变量。这个全局变量…

java 解决Html table的rowspan问题(osc处女作)
2019独角兽企业重金招聘Python工程师标准>>> 假如有如下html代码需要解析 <table border"1"><tr><td rowspan"3">1</td><td>1</td><td>1</td><td>1</td></tr><tr>&l…

基于C++的OpenCV常用函数
C版本的好处: 1、在于可以尽量避免使用指针这种危险的东西; 2、不用费心去release资源了,因为在其destructor里面,系统会自动帮你搞定。 3、在某些情况下会比C版本运行速度快。 在文件中包含 using namespace cv; 1. i…