当前位置：移动技术网 > IT编程>脚本编程>Python > 小鱼的Pytorch撞墙到撞墙墙到撞墙墙墙的精通之路二：自动微分

小鱼的Pytorch撞墙到撞墙墙到撞墙墙墙的精通之路二：自动微分

2020年07月03日 | 移动技术网IT编程 | 我要评论

自动微分篇

autograd

requires_grad && grad_fn
tensor.backward && tesnor.grad

总结&&参考文献

基于官方教程，记载小鱼的个人理解，记录些许项目，以及不断遇到的离奇的bug及杀虫方法。

autograd

autograd是pytorch之中的一个核心计算，提供了自动计算微分、跟踪微分过程、反向传播的方法，可以让我们在建立好神经网络之后，直接调用反向传播等autograd中包含的方法，高效训练神经网络。本文中只简单介绍一些常用的autograd方法，在后续的机器学习实战中，小鱼将展现给你autograd的用法。

requires_grad && grad_fn

设置tensor的requires_grad属性为True，代表记录tensor进行的运算操作。对于编程员自己声明的tensor，默认requires_grad=False，而对于计算得到的tensor，默认requires_grad=True

import torch
x=torch.ones(9,5,requires_grad=True)
y=x+2
print(x)
print(y)

tensor([[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.]], requires_grad=True)
tensor([[3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.],
        [3., 3., 3., 3., 3.]], grad_fn=<AddBackward0>)

grad_fn则记录了tensor的计算方法。

tensor.backward && tesnor.grad

为了计算某个out对于值x的微分，需要先将out进行反向传播，再运算x.grad即out对于x的微分值。

z=3*y*y
out=z.mean()
print(z)
print(out)
out.backward(retain_graph=True)
print(x.grad)
v=torch.ones(9,5)
z.backward(v)
print(x.grad)

tensor([[27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.],
        [27., 27., 27., 27., 27.]], grad_fn=<MulBackward0>)
tensor(27., grad_fn=<MeanBackward0>)
tensor([[0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000],
        [0.4000, 0.4000, 0.4000, 0.4000, 0.4000]])
tensor([[18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000],
        [18.4000, 18.4000, 18.4000, 18.4000, 18.4000]])

由于out是一个值，x则是 $9\times5$ 矩阵，所以out对x的微分用矩阵表示，矩阵中每个值，即out对该位置的值的微分。而且由于out是一个值，所以out.backward不需要填写参数，默认参数为torch.tensor(1.)。文中还设置了retain_graph=True，是为了下文再进行backward操作，否则后续backward操作会报错。而反向传播矩阵z时，我们则需要设置一个同规模的简单矩阵，以之为参数进行反向传播。
关于原理可以参考官方文档中的这部分内容。从x到out的计算过程相同，区别在于官方文档的x规模为 $2\times2$ ：
在这里插入图片描述

总结&&参考文献

神经网络中常用的即tensor.backward()方法和tensor.grad()方法，熟练使用可以高效编写神经网络代码。
PyTorch官方教程中文版：http://pytorch123.com/

本文地址：https://blog.csdn.net/StarfishCu/article/details/107061873

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

详解C语言和Python中的线程混用

问题你有一个程序需要混合使用c、python和线程，有些线程是在c中创建的，超出了python解释器的控制范围。并且一些线程还使用了python c api... [阅读全文]
Python如何输出警告信息

问题你希望自己的程序能生成警告信息（比如废弃特性或使用问题）。解决方案要输出一个警告消息，可使用 warning.warn() 函数。例如：import war... [阅读全文]
Python如何实现线程间通信

问题你的程序中有多个线程，你需要在这些线程之间安全地交换信息或数据解决方案从一个线程向另一个线程发送数据最安全的方式可能就是使用 queue 库中的队列了。创建... [阅读全文]
Python3以GitHub为例来实现模拟登录和爬取的实例讲解

我们先以一个最简单的实例来了解模拟登录后页面的抓取过程，其原理在于模拟登录后 cookies 的维护。1. 本节目标本节将讲解以 github 为例来实现模拟登... [阅读全文]
Python3爬虫中识别图形验证码的实例讲解

本节我们首先来尝试识别最简单的一种验证码，图形验证码，这种验证码出现的最早，现在也很常见，一般是四位字母或者数字组成的，例如中国知网的注册页面就有类似的验证码，... [阅读全文]
Python3爬虫关于识别检验滑动验证码的实例

上节我们了解了图形验证码的识别，简单的图形验证码我们可以直接利用 tesserocr 来识别，但是近几年又出现了一些新型验证码，如滑动验证码，比较有代表性的就是... [阅读全文]
Python3爬虫关于识别点触点选验证码的实例讲解

上一节我们实现了极验验证码的识别，但是除了极验其实还有另一种常见的且应用广泛的验证码，比较有代表性的就是点触验证码。可能你对这个名字比较陌生，但是肯定见过类似的... [阅读全文]
Python3爬虫里关于识别微博宫格验证码的知识点详解

本节我们来介绍一下新浪微博宫格验证码的识别，此验证码是一种新型交互式验证码，每个宫格之间会有一条指示连线，指示了我们应该的滑动轨迹，我们需要按照滑动轨迹依次从起... [阅读全文]
Python 如何创建一个简单的REST接口

问题你想使用一个简单的rest接口通过网络远程控制或访问你的应用程序，但是你又不想自己去安装一个完整的web框架。解决方案构建一个rest风格的接口最简单的方法... [阅读全文]
Python3爬虫里关于代理的设置总结

在前面我们介绍了多种请求库，如 requests、urllib、selenium 等。我们接下来首先贴近实战，了解一下代理怎么使用，为后面了解代理池、adsl ... [阅读全文]