当前位置：移动技术网 > IT编程>脚本编程>Python > 手把手教物体检测——YOLOV4（pytorch）

手把手教物体检测——YOLOV4（pytorch）

2020年07月24日 | 移动技术网IT编程 | 我要评论

摘要

YOLOV4在coco上面达到了43.5%AP ，在Tesla V100 上达到了65FPS。相比今年的其它模型，得分不算高，但是它不是通过提高输入图像的分辨率来提高得分的，而是改进网络结构。创新点主要有一下几个方面：

（1）输入端：这里指的创新主要是训练时对输入端的改进，主要包括Mosaic数据增强、cmBN、SAT自对抗训练。

（2）BackBone主干网络：将各种新的方式结合起来，包括：CSPDarknet53、Mish激活函数、Dropblock

（3）Neck：目标检测网络在BackBone和最后的输出层之间往往会插入一些层，比如Yolov4中的SPP模块、FPN+PAN结构

（4）Prediction：输出层的锚框机制和Yolov3相同，主要改进的是训练时的损失函数CIOU_Loss，以及预测框筛选的nms变为DIOU_nms

训练

本地环境：

Ubuntu20.04

pytorch1.5.1

CUDA10.1

Python3.7

下载代码

本文使用的代码是：https://github.com/Tianxiaomo/pytorch-Yolov4

训练和测试推理代码都已经完成。

下载权重文件

yolov4.conv.137.pth

链接一：https://pan.baidu.com/s/1ovBie4YyVQQoUrC3AY0joA 提取码：kcel

链接二：

https://drive.google.com/open?id=1fcbR0bWzYfIEdLJPzOsn4R5mlvR6IQyA

将下载的权重文件放到data文件夹下面

制作数据集

将Labelme数据集复制到pytorch-YOLOv4-master文件夹下面，如图：

然后用pycharm新建labelme2txt.py文件。写入生成训练集和验证集的代码。

labelme2txt.py代码：

from os import getcwd
from sklearn.model_selection import train_test_split
import json
import glob
wd = getcwd()
"labelme标注的json 数据集转为pytorch版yolov4的训练集"
classes = ["aircraft","oiltank"]

image_ids = glob.glob(r"LabelmeData/*jpg")
print(image_ids)
train_list_file = open('data/train.txt', 'w')
val_list_file = open('data/val.txt', 'w')
def convert_annotation(image_id, list_file):
    jsonfile=open('%s.json' % (image_id))
    in_file = json.load(jsonfile)

    for i in range(0,len(in_file["shapes"])):
        object=in_file["shapes"][i]
        cls=object["label"]
        points=object["points"]
        xmin=int(points[0][0])
        ymin=int(points[0][1])
        xmax=int(points[1][0])
        ymax=int(points[1][1])
        if cls not in classes:
            print("cls not in classes")
            continue
        cls_id = classes.index(cls)
        b = (xmin, ymin, xmax, ymax)
        list_file.write(" " + ",".join([str(a) for a in b]) + ',' + str(cls_id))
    jsonfile.close()

def ChangeData2TXT(image_List,dataFile):
    for image_id in image_List:
        dataFile.write('%s' % (image_id.split('\\')[-1]))
        convert_annotation(image_id.split('.')[0], dataFile)
        dataFile.write('\n')
    dataFile.close()
trainval_files, test_files = train_test_split(image_ids, test_size=0.2, random_state=55)
ChangeData2TXT(trainval_files,train_list_file)
ChangeData2TXT(test_files,val_list_file)

安装运行需要的包

参照requirements.txt安装本机没有的包，版本不一定要保持一致，只要后期不报错就没有事。

修改类别

将coco.names和voc.names里面的类别修改为自己数据集的类别（默认是coco.names，都改了肯定没有错。），顺序和labelme2txt.py中的classes顺序保持一致。

修改配置文件cfg.py

Cfg.use_darknet_cfg = False

Cfg.batch = 2(根据自己的显卡修改，我的显卡是8G的最多可以训练里2个batch)。

Cfg.subdivisions = 1

修改models.py

将51行和53行的inplace=True改为inplace=False。如果不修改，训练的时候会报个错误。

修改train.py文件

找到526行，这个方法的参数是对cfg.py里面参数的更新。

主要修改的参数如下：

parser.add_argument('-g', '--gpu', metavar='G', type=str, default='0',
help='GPU', dest='gpu')#设置GPU使用的GPU

parser.add_argument('-dir', '--data-dir', type=str, default="LabelmeData",
help='dataset dir', dest='dataset_dir')#图片所在的文件夹。

parser.add_argument('-pretrained', type=str, default="data/yolov4.conv.137.pth", help='pretrained yolov4.conv.137')#设置预训练权重文件的路径。

parser.add_argument('-classes', type=int, default=80, help='dataset classes')#物体类别数。

parser.add_argument('-train_label_path', dest='train_label', type=str, default='data/train.txt', help="train label path")#训练集存放的路径。

注释415行到440行的代码，这段代码在验证的时候一直报错，我找不到原因。后续找到原因再更新。

将以上的内容修改完成后就可以点击run开始训练了。

参考文章：

深入浅出Yolo系列之Yolov3&Yolov4核心基础知识完整讲解

https://blog.csdn.net/nan355655600/article/details/106246625?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.nonecase

本文地址：https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/107521737

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

C语言调用Python代码的方法

问题你想在c中安全的执行某个python调用并返回结果给c。例如，你想在c语言中使用某个python函数作为一个回调。解决方案在c语言中调用python非常简... [阅读全文]
Python绘图之柱形图绘制详解

前言用python编程绘图，其实非常简单。中学生、大学生、研究生都能通过这10篇教程从入门到精通！快速绘制几种简单的柱状图。1垂直柱图（普通柱图）绘制普通柱图的... [阅读全文]
python的一个小游戏

最近前言游戏规则素材代码最后前言因为python没学完的我在爬虫领域停了蛮久，所以最近都在学小甲鱼的python... [阅读全文]
Leetcode rever-Integer

题目描述将给出的整数x翻转。例1:x=123，返回321例2:x=-123，返回-321你有思考过下面的这些问题... [阅读全文]
【状压dp】[HDU1400 & poj2411] Mondriaan‘s Dream

对于棋盘上每个点，都有几种可能，1.不放 2.横放的前一个 3.横放的后一个 4.竖放的上一个 5.竖放的下一个... [阅读全文]
游戏过关之弹球步长（四）

游戏过关之弹球步长（四）01实现内容介绍弹球游戏共有五个关卡，本次我们实现关卡4。关卡4难度也是非常的简单的，规... [阅读全文]
Qt + Python + OpenCV图标替换工具之 Qt界面设计（四）

目录上一篇博文程序的下载地址以及源码Qt界面设计上一篇博文Qt + Python + OpenCV图标替换工具 ... [阅读全文]
每天一道算法题之跳跃游戏

题目描述:给定一个非负整数数组，你最初位于数组的第一个位置。数组中的每个元素代表你在该位置可以跳跃的最大长度。... [阅读全文]
283. 移动零

题目给定一个数组 nums，编写一个函数将所有 0 移动到数组的末尾，同时保持非零元素的相对顺序。示例:输入: ... [阅读全文]
2020百度之星初赛第二场

PokerProblem Description小沃沃在玩一个有趣的游戏。初始他有 n 块钱，每一轮他需要投入至... [阅读全文]