当前位置：移动技术网 > IT编程>脚本编程>Python > 深度学习图像生成标题

深度学习图像生成标题

2020年07月24日 | 移动技术网IT编程 | 我要评论

图像生成标题是RNN中的1：N模型
在这里插入图片描述

原理：
训练过程：

输入一张图片，获得每张图片的逻辑值
将每张图片的逻辑值和输入的标签值进行交叉熵操作得到损失值
梯度下降更新模板，使训练更加的吻合

代码实现（Tensors类）

import tensorflow as tf

class MySubTensors:
	def __init__(self):
		self.x = tf.placeholder(tf.float64, [None, 224, 224, 3], 'x'] # 输入图片
		self.y = tf.placeholder(tf.ini64, [None, 50], 'y')  # 输入标题
		x = inception(self.x, name='inception')  # 使用inception神经网络
		x = tf.layers.flatten(x)  # 对卷积后的x进行拍平操作
		x = tf.nn.dropout(x, 0.6)   # 使用dropout防止过拟合
		x = tf.layers.dense(x, 200, name="dense1")  # 对x的数据进行dense操作，获得语义值，语义值的维度是[-1, 200]
		y = tf.one_hot(self.y, 4340)  # 将标签值做one_hot操作，方便计算交叉熵
		cell1 = tf.nn.rnn_cell.LSTMCell(200, name="cell1")  # 使用rnn神经网络
		cell2 = tf.nn.rnn_cell.LSTMCell(200, name="cell2")
		cell = tf.nn.rnn_cell.MultiRNNCell([cell1, cell2])
		state = cell.zero_state(tf.shape(x)[0], x.dtype)
		losses = []  # 定义损失，将损失值添加到损失列表中
		for i in range(50):  # 获得50个字的语义
			yi_predice, state = cell(x, state) 
			yi_predice = tf.layers.dense(yi_predice, 4340, name="dense2")
			tf.get_variable_scope().reuse_variables()
			lossi = tf.nn.softmax_cross_entropy_with_logits_v2(labels=y[:,i,:], logits=yi_predice)
			losses.append(lossi)
		loss = tf.reduce_mean(losses)  #汇总损失值

本文地址：https://blog.csdn.net/qq_38973721/article/details/107517570

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

Python之OpenGL笔记(32)：正交投影画六角星

一、目的1、摄像机应用，正交投影画六角星；二、程序运行结果三、摄像机的设置吴亚峰《OpenGL ES 3.... [阅读全文]
牛客多校第三场 A-Clam and Fish【贪心】+ B-Classical String Problem【思维】

目录A-Clam and Fish题意解题思路代码B-Classical String Problem题意解题思... [阅读全文]
329. 矩阵中的最长递增路径深度优先+记忆化递归

329. 矩阵中的最长递增路径难度：困难2020/7/26每日一题打卡题目描述解题思路今天的困难题感觉不是很难诶... [阅读全文]
小白还在纠结选影视建模还是游戏建模？来，建模大师告诉你

小白还在纠结选择影视建模还是选游戏建模？进来建模大神教你！人物的影视建模要求的是精模，影视人物的塑造需要一个好的... [阅读全文]
pythonOCC例子搬运：4.经典瓶子造型

这里返回总目录&gt;&gt;返回总目录core_display_signal_... [阅读全文]
百度之星第二场（前四道签到题）

如果你需要查看题目，请点击下方↓百度之星第二场题目因为是水题嘛，所以就不多赘述了。官方题解也早就出了，如果想看更... [阅读全文]
HDU 6787 Chess（线性动态规划）

这题是2020百度之星初赛第三场1005题意描述一个长度为n的棋盘（1<<<n）附赠奇怪样例i... [阅读全文]
python数字炸弹小游戏

数字炸弹小游戏就是给定一个数字范围，然后在范围内进行数字猜测，不断更新范围的界限，直到有人猜中随机生成的数字结束... [阅读全文]
2017年数模国赛B题第一小题的思路过程(个人思路)

第一题.简单来讲,就是给了一些数据,让我们拟合回归方程.这是附件一的数据(任务相关数据)这是附件二的数据(会员相... [阅读全文]
python下载的库包存放路径

python下载的库包存放位置：打开python的安装目录，双击打开lib文件夹找到“site-packages”文件夹并打开，下载的库包就出来了内容扩展：将依... [阅读全文]

网友评论


验证码：

深度学习 图像生成标题

2020年07月24日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论

深度学习图像生成标题