当前位置：移动技术网 > IT编程>脚本编程>Python > Softmax用于手写数字识别（Tensorflow实现）-个人理解

Softmax用于手写数字识别（Tensorflow实现）-个人理解

2019年12月18日 | 移动技术网IT编程 | 我要评论

姓名签名设计,鹿晗摔倒,小张帝南昌演唱会

softmax函数的作用

对于分类方面，softmax函数的作用是从样本值计算得到该样本属于各个类别的概率大小。例如手写数字识别，softmax模型从给定的手写体图片像素值得出这张图片为数字0~9的概率值，这些概率值之和为1。预测的结果取最大的概率表示的数字作为这张图片的分类。

可以从下面这张图理解softmax

x1,x2,x3代表输入的值，b1,b2,b3代表类别1，2，3的偏置量，是因为输入的值可能存在无关的干扰量。
将上图写成等式
\[ \left[\begin{matrix}temp_1\\temp_2\\temp_3\end{matrix}\right] =\left(\begin{matrix}w_{1,1}x_1+w_{1,2}x_2+w_{1,3}x_3+b_1\\ w_{2,1}x_1+w_{2,2}x_2+w_{2,3}x_3+b_2\\ w_{3,1}x_1+w_{3,2}x_2+w_{3,3}x_3+b_3\end{matrix}\right)\\ \left[\begin{matrix}y_1\\y_2\\y_3\end{matrix}\right] =softmax\left(\begin{matrix}temp_1\\ temp_2\\ temp_3\end{matrix}\right)\\ 其中y_i = softmax(temp_i) = \frac{exp(temp_i)}{\sum_{j=0}^{n}exp(temp_j)}\\ y_1,y_2,y_3分别表示该样本属于类别1，2，3的概率值。 \]
在神经网络中，通过训练集训练模型中的权重值w和偏置值b，来提高分类的准确性。
（训练方法是定义一个损失函数（代表预测值与真实值之间的差异），然后采用梯度下降法（通过对w,b求偏导）来最小化这个损失函数，具体过程有点复杂，下面只是直接拿tensorflow的函数来实现，后面有空的话再来补充原理）

用tensorflow实现手写数字识别

首先从tensorflow导入mnist数据集，里面包含了手写数字图片的像素矩阵，以及这些图片所对应的数字类别：

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("mnist_data/", one_hot=true)

说明一下图片的像素矩阵是将28x28压平为[1x784]大小的向量；标签是[1x10]的向量，其中某一个数是1，其余全为0，比如说如果标签表示的是数字5，那么这个标签向量为[0,0,0,0,1,0,0,0,0,0]。
构建模型：

x = tf.placeholder("float",[none,784])
#一个二维向量的占位符，none表示第一位可以是任意长度，784表示一张图片压平后的长度
w = tf.variable(tf.zeros([784,10]))
b = tf.variable(tf.zeros([10]))

#temp = x*w + b
#softmax(temp)得到一个[none,10]的向量，表示none个图片可能代表0~9的概率。
y = tf.nn.softmax(tf.matmul(x,w)+b)

构建模型训练过程：定义损失函数，最小化这个损失函数，从而得到w，b

y_ = tf.placeholder("float",[none,10])
#这里用占位符来代表y_（每个图片的真实类别），后面运行时会将真实类别填给占位符。
cross_entropy = -tf.reduce_sum(y_*tf.log(y))
#y是模型的预测类别，y_是真实类别，用交叉熵来代表损失函数（说明预测值和真实值之间的差异）
train_step = tf.train.gradientdescentoptimizer(0.01).minimize(cross_entropy)
#用梯度下降法来最小化损失函数

运行之前构造的模型：

init = tf.initialize_all_variables()#init表示初始化所有变量
sess = tf.session()#启动会话，用于运行模型
sess.run(init)#运行init才真正的使所有变量初始化
for i in range(1000):#训练模型1000遍
    batch_xs,batch_ys = mnist.train.next_batch(100)
    #从数据集中取出100个样本
    sess.run(train_step, feed_dict={x:batch_xs, y_:batch_ys})
    #将样本填入之前定义的占位符，然后运行刚才构建的训练过程

评估模型：

correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))
#逐个判断预测值和真实值是否相等，返回一个矩阵。
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
#tf.cast将bool型转化为float型，reduce_mean计算平均值（即正确率）
print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))
#将测试集填入之前的占位符，运行之前的模型，得到正确率

输出结果为：
0.9181

总结

tensorflow让用户先从更大的层面上构建模型，其中需要的数据先由占位符代替，然后在运行模型时再填入对应的数据。用户不需要对具体运算过程一步步编程实现，使得神经网络的构建简便了许多。

正在学习tensorflows时写的笔记，欢迎评论探讨！

参考网址：

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

python如何查看网页代码

用python查看网页代码的方法：1、使用“import”导入requests包import requests2、使用requests包的get()函数通过网页... [阅读全文]
Python如何用wx模块创建文本编辑器

用python的wx模块创建文本编辑器的方法：1、设置按钮的位置import wxapp = wx.app()win = wx.frame(none,title... [阅读全文]
python如何保存文本文件

python保存文本文件的方法：使用python内置的open()类可以打开文本文件，向文件里面写入数据可以用write()函数，写完之后，使用close()函... [阅读全文]
python如何编写win程序

python可以编写win程序。win程序的格式是exe，下面我们就来看一下使用python编写exe程序的方法。编写好python程序后py2exe模块即可将... [阅读全文]
Python替换NumPy数组中大于某个值的所有元素实例

我有一个2d(二维) numpy数组，并希望用255.0替换大于或等于阈值t的所有值。据我所知，最基础的方法是：shape = arr.shaperesult ... [阅读全文]
使用Numpy对特征中的异常值进行替换及条件替换方式

原始数据为excel文件，由传感器获得，通过pyhton xlrd模块读入，读入后为数组形式，由于其存在部分异常值和缺失值，所以便利用numpy对其中的异常值进... [阅读全文]
Python 实现将numpy中的nan和inf,nan替换成对应的均值

nan：not a numberinf：infinity;正无穷numpy中的nan和inf都是float类型t!=t 返回bool类型的数组(矩阵)np.co... [阅读全文]
给ubuntu18安装python3.7的详细教程

参考文章准备工作安装工具sudo apt updatesudo apt upgradesudo apt install gccsudo apt install ... [阅读全文]
python爬虫把url链接编码成gbk2312格式过程解析

1. 问题　　抓取某个网站，发现请求参数是乱码格式，这是点击 textview，发现请求参数如下图所示3. 那么=%b9%fa%ce%f1%d4%ba%b7%a... [阅读全文]
pyecharts在数据可视化中的应用详解

使用pyecharts进行数据可视化安装 pip install pyecharts也可以在pycharm软件里进行下载pyecharts库包。下载成功后进行查... [阅读全文]