当前位置：移动技术网 > IT编程>脚本编程>Python > keras打印loss对权重的导数方式

keras打印loss对权重的导数方式

2020年06月18日 | 移动技术网IT编程 | 我要评论

官场新秀无弹窗,齐齐哈尔大学图书馆,塘峡口冷烟低

notes

怀疑模型梯度爆炸，想打印模型 loss 对各权重的导数看看。如果如果fit来训练的话，可以用keras.callbacks.tensorboard实现。

但此次使用train_on_batch来训练的，用k.gradients和k.function实现。

codes

以一份 vae 代码为例

# -*- coding: utf8 -*-
import keras
from keras.models import model
from keras.layers import input, lambda, conv2d, maxpooling2d, flatten, dense, reshape
from keras.losses import binary_crossentropy
from keras.datasets import mnist, fashion_mnist
import keras.backend as k
from scipy.stats import norm
import numpy as np
import matplotlib.pyplot as plt

batch = 128
n_class = 10
epoch = 5
in_dim = 28 * 28
h_dim = 128
z_dim = 2

(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()
x_train = x_train.reshape(len(x_train), -1).astype('float32') / 255.
x_test = x_test.reshape(len(x_test), -1).astype('float32') / 255.

def sampleing(args):
  """reparameterize"""
  mu, logvar = args
  eps = k.random_normal([k.shape(mu)[0], z_dim], mean=0.0, stddev=1.0)
  return mu + eps * k.exp(logvar / 2.)

# encode
x_in = input([in_dim])
h = dense(h_dim, activation='relu')(x_in)
z_mu = dense(z_dim)(h) # mean，不用激活
z_logvar = dense(z_dim)(h) # log variance，不用激活
z = lambda(sampleing, output_shape=[z_dim])([z_mu, z_logvar]) # 只能有一个参数
encoder = model(x_in, [z_mu, z_logvar, z], name='encoder')

# decode
z_in = input([z_dim])
h_hat = dense(h_dim, activation='relu')(z_in)
x_hat = dense(in_dim, activation='sigmoid')(h_hat)
decoder = model(z_in, x_hat, name='decoder')

# vae
x_in = input([in_dim])
x = x_in
z_mu, z_logvar, z = encoder(x)
x = decoder(z)
out = x
vae = model(x_in, [out, out], name='vae')

# loss_kl = 0.5 * k.sum(k.square(z_mu) + k.exp(z_logvar) - 1. - z_logvar, axis=1)
# loss_recon = binary_crossentropy(k.reshape(vae_in, [-1, in_dim]), vae_out) * in_dim
# loss_vae = k.mean(loss_kl + loss_recon)

def loss_kl(y_true, y_pred):
  return 0.5 * k.sum(k.square(z_mu) + k.exp(z_logvar) - 1. - z_logvar, axis=1)


# vae.add_loss(loss_vae)
vae.compile(optimizer='rmsprop',
      loss=[loss_kl, 'binary_crossentropy'],
      loss_weights=[1, in_dim])
vae.summary()

# 获取模型权重 variable
w = vae.trainable_weights
print(w)

# 打印 kl 对权重的导数
# kl 要是 tensor，不能是上面的函数 `loss_kl`
grad = k.gradients(0.5 * k.sum(k.square(z_mu) + k.exp(z_logvar) - 1. - z_logvar, axis=1),
          w)
print(grad) # 有些是 none 的
grad = grad[grad is not none] # 去掉 none，不然报错

# 打印梯度的函数
# k.function 的输入和输出必要是 list！就算只有一个
show_grad = k.function([vae.input], [grad])

# vae.fit(x_train, # y_train, # 不能传 y_train
#     batch_size=batch,
#     epochs=epoch,
#     verbose=1,
#     validation_data=(x_test, none))

''' 以 train_on_batch 方式训练 '''
for epoch in range(epoch):
  for b in range(x_train.shape[0] // batch):
    idx = np.random.choice(x_train.shape[0], batch)
    x = x_train[idx]
    l = vae.train_on_batch([x], [x, x])

  # 计算梯度
  gd = show_grad([x])
  # 打印梯度
  print(gd)

# show manifold
pixel = 28
n_pict = 30
grid_x = norm.ppf(np.linspace(0.05, 0.95, n_pict))
grid_y = grid_x

figure = np.zeros([n_pict * pixel, n_pict * pixel])
for i, xi in enumerate(grid_x):
  for j, yj in enumerate(grid_y):
    noise = np.array([[xi, yj]]) # 必须秩为 2，两层中括号
    x_gen = decoder.predict(noise)
    # print('x_gen shape:', x_gen.shape)
    x_gen = x_gen[0].reshape([pixel, pixel])
    figure[i * pixel: (i+1) * pixel,
        j * pixel: (j+1) * pixel] = x_gen

fig = plt.figure(figsize=(10, 10))
plt.imshow(figure, cmap='greys_r')
fig.savefig('./variational_autoencoder.png')
plt.show()

补充知识：keras 自定义损失自动求导时出现none

问题记录，keras 自定义损失自动求导时出现none，后来想到是因为传入的变量没有使用，所以keras无法求出偏导，修改后问题解决。就是不愿使用的变量×0,求导后还是0就可以了。

def my_complex_loss_graph(y_label, emb_uid, lstm_out,y_true_1,y_true_2,y_true_3,out_1,out_2,out_3):
 
  mse_out_1 = mean_squared_error(y_true_1, out_1)
  mse_out_2 = mean_squared_error(y_true_2, out_2)
  mse_out_3 = mean_squared_error(y_true_3, out_3)
  # emb_uid= k.reshape(emb_uid, [-1, 32])
  cosine_sim = tf.reduce_sum(0.5*tf.square(emb_uid-lstm_out))
 
  cost=0*cosine_sim+k.sum([0.5*mse_out_1 , 0.25*mse_out_2,0.25*mse_out_3],axis=1,keepdims=true)
  # print(mse_out_1)
  final_loss = cost
 
  return k.mean(final_loss)

以上这篇keras打印loss对权重的导数方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

新手学习Python2和Python3中print不同的用法

在python2和python3中都提供print()方法来打印信息,但两个版本间的print稍微有差异主要体现在以下几个方面：1.python3中print是... [阅读全文]
Python基于os.environ从windows获取环境变量

安装python之后，我们往往面临这样一个问题，在命令行输入“python”，竟然出错，难道是没有安装成功吗？非也，其实是你的系统环境变量没有设置好。今天，小编... [阅读全文]
keras实现调用自己训练的模型,并去掉全连接层

其实很简单from keras.models import load_modelbase_model = load_model('model_resenet.h... [阅读全文]
python中def是做什么的

python使用def开始函数定义，紧接着是函数名，括号内部为函数的参数，内部为函数的具体功能实现代码，如果想要函数有返回值, 在expressions中的逻... [阅读全文]
Python xlwt模块使用代码实例

简介写入excle文档安装：pip3 install xlwt导入：import xlwtxlrd 模块方法写入案例import xlwt# 创建对象，设置编码... [阅读全文]
Keras之自定义损失(loss)函数用法说明

在keras中可以自定义损失函数，在自定义损失函数的过程中需要注意的一点是，损失函数的参数形式，这一点在keras中是固定的，须如下形式：def my_loss... [阅读全文]
Python xlrd模块导入过程及常用操作

简介读取excle文档，支持xls，xlsx格式安装：pip3 install xlrd导入：import xlrdxlrd 模块方法读取excelfile =... [阅读全文]
keras打印loss对权重的导数方式

notes怀疑模型梯度爆炸，想打印模型 loss 对各权重的导数看看。如果如果fit来训练的话，可以用keras.callbacks.tensorboard实现... [阅读全文]
keras 使用Lambda 快速新建层添加多个参数操作

keras许多简单操作，都需要新建一个层，使用lambda可以很好完成需求。# 额外参数def normal_reshape(x, shape): return... [阅读全文]
JAVA及PYTHON质数计算代码对比解析

java 实现class primenumber{public static void main(string[] args) {long start=syst... [阅读全文]

网友评论


验证码：

keras打印loss对权重的导数方式

2020年06月18日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论