当前位置: 移动技术网 > IT编程>开发语言>.net > Mobilenetv3-ssd训练VOC格式数据集loss出现nan:数据本身出现问题

Mobilenetv3-ssd训练VOC格式数据集loss出现nan:数据本身出现问题

2020年07月26日  | 移动技术网IT编程  | 我要评论

十分感谢链接博主:
https://blog.csdn.net/weixin_40313940/article/details/105915575
在这里插入图片描述
训练一开始就出现nan,调参不能解决,那应该就是数据本身出现问题了,先将batch_size设为1(如果网络有BN层有可能会报错),然后shuffle=False,开始逐张图片进行检查,剔除有问题的即可。

十分感谢参考链接博主给出的问题根源:xml文件中存在min>max的错误情况,导致导入的数据成为了“bad sample”,存在问题的xml文件如下图:
在这里插入图片描述

利用博主给出的脚本就可以快速找到问题xml文件,不过脚本可能有点问题,下面给出修改后的代码:

import os
import xml.etree.ElementTree as ET

xml_dir = 'your Annatations path'


def compare_min_max(xml_dir):
    xmls = os.listdir(xml_dir)
    xmls.sort()
    flag = 0
    count = 0
    for xml in xmls:
        xml_path = os.path.join(xml_dir, xml)
        tree = ET.parse(xml_path)
        root = tree.getroot()
        for elem in root.findall('object'):
            xmin = elem.find('bndbox').find('xmin').text
            ymin = elem.find('bndbox').find('ymin').text
            xmax = elem.find('bndbox').find('xmax').text
            ymax = elem.find('bndbox').find('ymax').text
            #if int(ymin) > int(ymax) or int(xmin) > int(xmax):  # 原代码
            #if ymin > ymax or xmin > xmax:  # 这句代码会得到错误的结果, 不存在min>max
            if int(float(ymin)) > int(float(ymax)) or int(float(xmin)) > int(float(xmax)):  # 修改后的代码
                print('min > max in file:', xml_path)
                flag = 1
        if flag == 1:
            count += 1
            flag = 0
    print('{} files that min > max'.format(count))
    print('finish comparision...')


if __name__ == '__main__':
    compare_min_max(xml_dir)

本文地址:https://blog.csdn.net/weixin_45045906/article/details/107582943

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网