基于PyTorch,如何构建一个简单的神经网络
本文为 PyTorch 官方教程中:如何构建神经网络。基于 PyTorch 专门构建神经网络的子模块 torch.nn 构建一个简单的神经网络。
完整教程运行 codelab→
https://openbayes.com/console/open-tutorials/containers/OgcYkLjKw89
torch.nn 文档→
https://pytorch.org/docs/stable/nn.html
神经网络由对数据执行操作的层/模块组成。torch.nn 提供了构建神经网络所需的所有模块。
PyTorch 中的每个模块都是 nn.module 的子类。
在下面的部分中,我们将构建一个神经网络来进行10种类别的分类。
建立神经网络
神经网络由对数据执行操作的层/模块组成。torch.nn 提供了构建神经网络所需的所有模块。PyTorch 中的每个模块都是 nn.module 的子类。
在下面的部分中,我们将构建一个神经网络来进行10种类别的分类。
import osimport torchfrom torch import nnfrom torch.utils.data import DataLoaderfrom torchvision import datasets, transforms
加载训练设备
我们希望能够在硬件加速器,比如 GPU 上训练我们的模型。可以通过 torch.cuda 来检测 GPU 是否可用。
device = 'cuda' if torch.cuda.is_available() else 'cpu' #检测gpu是否可用,不可用使用cpuprint('Using {} device'.format(device)) #输出使用设备类型
定义类
我们通过 nn.Module 来定义神经网络,并在__init__ 中初始化神经网络。每个 nn.Module 子类在 forward 方法中实现对输入数据的操作。
class NeuralNetwork(nn.Module): def __init__(self): #定义网络结构 super(NeuralNetwork, self).__init__() self.flatten = nn.Flatten() self.linear_relu_stack = nn.Sequential( nn.Linear(28*28, 512), nn.ReLU(), nn.Linear(512, 512), nn.ReLU(), nn.Linear(512, 10), nn.ReLU() )def forward(self, x): #前向传播 x = self.flatten(x) logits = self.linear_relu_stack(x) return logits
在使用模型前需要先实例化模型,并将其移动到 GPU 上
model = NeuralNetwork().to(device) #实例化模型print(model)
为了在模型的输入和输出之间创建复杂的非线性映射,需要使用非线性的激活函数。
它们在线性变换后引入非线性,帮助神经网络学习各种各样的复杂映射。在这个模型中,我们在线性层之间使用 nn.ReLU,也可以使用其他激活函数来引入非线性。
X = torch.rand(1, 28, 28, device=device) #生成(1,28,28)的数据logits = model(X) #向模型输入数据pred_probab = nn.Softmax(dim=1)(logits) #调用softmax 将预测值映射为(0,1)间的概率y_pred = pred_probab.argmax(1) #最大概率对应分类print(f"Predicted class: {y_pred}")
神经网络各层说明
接下来,我们分解网络来具体讲述每一层的功能。
为了说明这一点,我们将取小批量的3个尺寸为28x28的图像样本输入网络
input_image = torch.rand(3,28,28) #生成(3,28,28)的数据print(input_image.size())
nn.Flatten 层
Flatten 层用来把多维的输入一维化,常用在从卷积层到全连接层的过渡。
nn.Flatten 层,可以将每个 28x28 图像转换 784 ($28\times 28=784$)个像素值的连续数组(批量维度保持为3)。
flatten = nn.Flatten() flat_image = flatten(input_image) #(3,28,28)转换为(3,784)print(flat_image.size())
nn.Linear 层
nn.Linear 层,即线性层,是一个使用权重和偏差对输入数据作线性变换的模块。
layer1 = nn.Linear(in_features=28*28, out_features=20) #输入(3,28*28) 输出(3,20)hidden1 = layer1(flat_image)print(hidden1.size())
nn.ReLU 层
为了在模型的输入和输出之间创建复杂的非线性映射,需要使用非线性的激活函数。它们在线性变换后引入非线性,帮助神经网络学习各种各样的复杂映射。
在这个模型中,我们在线性层之间使用 nn.ReLU,也可以使用其他激活函数来引入非线性。
print(f"Before ReLU: {hidden1}\n\n")hidden1 = nn.ReLU()(hidden1)print(f"After ReLU: {hidden1}")
nn.Sequential 层
神经网络的最后一个线性层返回 logits,即值域区间在$[-\infty,\infty]$中的原始值。这些值传递给nn.Softmax模块后,logit被缩放为$[0,1]$区间中,表示模型对每个类的预测概率。
dim参数表示每一维度进行运算的位置,运算结果相加为1。
softmax = nn.Softmax(dim=1)pred_probab = softmax(logits)
输出模型结构
神经网络中的许多层都是参数化的,即具有相关联的权重和偏差,这些参数在训练中被迭代优化。
子类 nn.Module 自动跟踪模型对象内部定义的所有字段,并使用模型的 parameters() 或 named_parameters() 方法访问所有参数。
我们可以通过模型迭代每个参数,并输出其尺寸和值。
print("Model structure: ", model, "\n\n")
for name, param in model.named_parameters(): print(f"Layer: {name} | Size: {param.size()} | Values : {param[:2]} \n")
最终输出结果可访问完整教程:
https://openbayes.com/console/open-tutorials/containers/OgcYkLjKw89
相关文章:

C#语言的几个层次
作者: 李建忠 接到一位前不久C#培训学员的来信,这位学员虽然以前功底欠缺,但学习劲头很足,在培训中成长很快。即便基本吃透《.NET框架(修订版)》还嫌不够过瘾,一心要成为高手中的高手。来信的目…

确定安全威胁与漏洞-A
1、社会工程学攻击是一种使用欺骗和诡计说服不知情的用户提供敏感信息或做出违背安全准则行为的攻击类型。通常通过人、电子邮件、电话等方式表现出来。 2、社会工程学攻击类型主要有电子欺骗、冒名顶替、骗局、网络钓鱼、电话钓鱼、大型网络钓鱼(鱼叉式网络钓鱼&am…

C# 特性(Attribute)学习。
特性(attribute)是被指定给某一声明的一则附加的声明性信息。 在C#中,有一个小的预定义特性集合。在学习如何建立我们自己的定制特性(custom attributes)之前,我们先来看看在我们的代码中如何使用预定义特性…

JMeter学习(二十三)关联
话说LoadRunner有的一些功能,比如:参数化、检查点、集合点、关联,Jmeter也都有这些功能,只是功能可能稍弱一些,今天就关联来讲解一下。 JMeter的关联方法有两种:后置处理器-正则表达式提取器与X…

程序员千万不要选全栈开发
作者 | 千鸟(网名) 小路助手开发者责编 | 晋兆雨出品 | CSDN(ID:CSDNnews)对于大多数人来说,大学毕业后选择一家满意的公司,一路升职加薪才是正解,但他却偏偏选择了一条鲜有人知的…

手动初始化设置3PAR存储系统
准备工作 1. 具备串口的终端电脑(USB to serial). 2. 使用标记为“180-055”灰色适配器(3par自带). 3. 标准RJ45网线. 4. 下载HP 3par OS及SP Patch包. 5. PuTTY软件(或其他串口软件) 其他说明 手动设置存储系统…

C# 里怎样得到当前执行的函数名,当前代码行,源代码文件名。
得到函数名: System.Diagnostics.StackTrace st new System.Diagnostics.StackTrace(); this.Text st.GetFrame(0).ToString(); 得到代码行,源代码文件名: StackTrace st new StackTrace(new StackFrame(true));Consol…

特斯拉Model 3国内起售价下调至23.59万元
7月30日11:00,特斯拉官方微博宣布,即日起,特斯拉Model 3标准续航升级版的价格下调15000元人民币,调整后的价格为235900元人民币(此为补贴后起售价)。此次价格调整反映了成本波动的实际情况。特斯拉一直秉承…

Maven内置变量
1、Maven内置变量说明: ${basedir} 项目根目录${project.build.directory} 构建目录,缺省为target${project.build.outputDirectory} 构建过程输出目录,缺省为target/classes${project.build.finalName} 产出物名称,缺省为${proje…

在客户端调用MOSS的搜索服务,实现更加灵活的搜索控制
MOSS中提供了很多web services的服务,都放在http://<Site>/_vti_bin下 我们可以在其他地方,比如winForm,webForm中调用,对MOSS的对象进行灵活操作。 下面我简单列一下调用一个MOSS中的搜索服务的方法: 1、在VS…

年收入百万美元AI科学家的烦恼与思考
AI 研究科学家 Alexis Conneau 只需敲击了几下键盘,包含数千亿字的信息洪流,就能在他的电脑屏幕窗口中滚动起来。多年来,自动化 “爬虫” 用 100 种语言将互联网中的古老诗歌、愤怒的评论、甜点食谱和其他一切信息吸进庞大的数据库中。作为人…

web架构设计经验分享
本人作为一位web工程师,着眼最多之处莫过于 性能与架构,本次幸得参与sd2.0大会,得以与同行广泛交流,于此二方面,有些心得,不敢独享,与众博友分享,本文是这次参会与众同撩交流的心得,…

BOM和DOM的区别
为什么80%的码农都做不了架构师?>>> BOM 浏览器对象模型提 供了独立于内容而与浏览器窗口进行交互的对象。描述了与浏览器进行交互的方法和接口,可以对浏览器窗口进行访问和操作,譬如可以弹出新的窗口,改变状态栏 中的…

C#编码简单性之语义篇(如何编写简短的C#代码,随时更新)
以前写C的时候曾经在自己网站上发表过一个编码“简单性”之文章,现在编写C#了才发现自己无意之间就会写下一些浪费屏幕的代码。下面是自己编码中偶然发现的一些案例,欢迎中等水平的编程者参考。因为要积累案例,所以随时更新。---------------…

网站性能越来越差怎么办?
新的一年,你的老板或客户,是否曾和你抱怨公司的网站性能愈来愈差?网站大家都会写,自从有了 Visual Studio 之后,连你家楼下的正妹小喵和隔壁的王大婶都会写 ASP.NET。但同样的一个画面,背后的性能却可能是天…

如何设计一个高性能CPU?
任何一种技术都会经历从阳春白雪到下里巴人的过程,就像我们对计算机的理解从“戴着鞋套才能进的机房”变成了随处可见的智能手机。在前面20年中,大数据技术也经历了这样的过程,从曾经高高在上的 “火箭科技(rocket science&#x…

Python包管理工具Distribute的安装
Python包管理工具Distribute的安装Python的包管理工具常见的有easy_install, setuptools, 还有pip, distribute,那麽这几个工具有什么关系呢,看一下下面这个图就明白了:可以看到distribute是setuptools的替代方案,pip是easy_insta…

如何用 Graylog 管理日志?- 每天5分钟玩转 Docker 容器技术(93)
上一节已经部署好了 Graylog,现在学习如何用它来管理日志。 首先启动测试容器。 docker run -d \ --log-drivergelf \ --log-opt gelf-addressudp://localhost:12201 \ --log-opt tag"log-test-container-A" \ b…

php调用C代码的方法详解
在php程序中需要用到C代码,应该是下面两种情况: 1 已有C代码,在php程序中想直接用2 由于php的性能问题,需要用C来实现部分功能针对第一种情况,最合适的方法是用system调用,把现有C代码写成一个独立的程序。…

如何在Django中接收JSON格式的数据
Django做了大量工作简化我们的Web开发工作, 这其中当然也包括接收来自客户端的数据这一普遍需求. 大部分时候,从客户端传入的数据主要是FORM的POST数据,和来自URL的GET数据, 在Django中对应了HttpRequest对象的POST和GET属性, 例如读取FORM表单中的用户名username输入框的内容:…

写了篇爬虫文章,收到律师函,怎么办
大家好,我是早起。从写公众号开始,不论是私信还是交流群,常常都会有粉丝会问出类似下面的问题xx网站能不能爬?爬xx数据有没有风险?其实我并不是爬虫从业人员,充其量算爬虫爱好者,去年也转载过一…

在SQL中使用CRL函数示例
在SQL中使用CRL函数 实验目标: 1. 在SQL中创建CRL函数,使之能够向指定的计算机发送消息 实验步骤 2. 在VS中创建类发送消息的类 3. 将以下代码黏贴进去 using System; using System.Collections.Generic; using System.Text; using System.Net.Sockets; …

ASP.NET的(HttpModule,HttpHandler)
在以前的ASP时候,当请求一个*.asp页面文件的时候,这个HTTP请求首先会被一个名为inetinfo.exe进程所截获,这个进程实际上就是www服务。截获之后它会将这个请求转交给asp.dll进程,这个进程就会解释这个asp页面,然后将解释…

页面GBK,用jquery.post乱码问题
2019独角兽企业重金招聘Python工程师标准>>> jquery ajax默认为UTF-8,所以页面上要 encodeURIComponent ("内容") 后台代码 再 URLDecoder.decode("内容" "utf-8") 转载于:https://my.oschina.net/wangchongya/blog/34651…

专访陈天桥:把钱投给甘坐冷板凳的AI研究员
作者:钱童心 责编:刘佳“别的投资人听陶虎说,要10年才能做出消费级产品,就不投了,我跟陶虎说,我给你20年时间做。”人工智能(AI)技术正在为各行各业赋能,这使得一场人才…

使用DPM2007备份还原Exchange2007邮箱数据库
创建演示环境1. 在这里,由于要演示备份和还原,所以我们先让用户bob给alice发一封信以作测试验证。2. 用户alice登录OWA后,可以看到bob发来的一封信,主题为“DPM Test For Exchange”,如图1.创建保护组并备份Exchange…

大有乾坤,售前机器人背后的 AI 技术
作者 | 伍杏玲出品 | AI科技大本营(ID:rgznai100)我们在网上购物时,无论多晚找客服咨询,对面均会回复一句“在呢,请问有什么可以帮助您?”,屏幕背后大部分为智能客服机器人。在不同业务场景对话…

c3p0数据库连接池使用报错【 You can't operate on a closed Connection!!!】解决方案
一般情况下,我们的项目中都有一个获取数据库连接的方法。我获取数据库连接的方法是这样实现的:1. 创建一个 ComboPooledDataSource对象,使用它的getConnection()方法获取连接。2. 创建一个泛型为Connection的ThreadLocal<Connection>对…

Asp.Net下通过切换CSS换皮肤
换皮肤的方式有很多种,最简单的通常就是切换页面CSS,而CSS通常写在外部CSS文件里。那么切换css其实就是更换html里的link href路径。我在网上搜索了下。一般有两种方式: 1,在页面放一个holder控件。然后用编程方式把当前用户的风格css link写…

用 Label 控制 Service 的位置 - 每天5分钟玩转 Docker 容器技术(106)
上一节我们讨论了 Service 部署的两种模式:global mode 和 replicated mode。无论采用 global mode 还是 replicated mode,副本运行在哪些节点都是由 Swarm 决定的,作为用户我们有没有可能精细控制 Service 的运行位置呢? 答案是&…