当前位置: 移动技术网 > IT编程>脚本编程>Python > 对python打乱数据集中X,y标签对的方法详解

对python打乱数据集中X,y标签对的方法详解

2019年06月13日  | 移动技术网IT编程  | 我要评论

商道 王凯,军人帅哥堁体露大鸟,红楼幻世

今天踩过的两个小坑:

一.用random的shuffle打乱数据集中的数据-标签对

index=[i for i in range(len(x_batch))]
# print(type(index))
index=random.shuffle(index)

结果shuffle完以后index变成none了,看了下api,这样说明的:

python打乱数据集中x,y标签

这个函数如果返回值,就返回none,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。

python打乱数据集中x,y标签

因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。

二.整体引用index这个list中的数据

因为index是一个list,所以代码这样写:

x_batch=x_batch[index]

y_batch=y_batch[index]

是有问题的,报错是:typeerror: list indices must be integers or slices, not list.

这是因为我的x_batch,y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果x_batch,y_batch是数组,index是数组,就可以。

所以代码改成了:

x_batch,y_batch=data_generator(data_path)
index=[i for i in range(len(x_batch))]
# print(type(index))
random.shuffle(index)
index=np.array(index)

x_batch=[np.array(x_batch)[index]]
y_batch=[np.array(y_batch)[index]]

参考代码:

python打乱数据集中x,y标签

以上这篇对python打乱数据集中x,y标签对的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持移动技术网。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网