当前位置：移动技术网 > IT编程>脚本编程>Python > 【OpenCV】【python】车道线定位及拟合（np.ployfit，cv2.fillPoly）

【OpenCV】【python】车道线定位及拟合（np.ployfit，cv2.fillPoly）

2020年07月03日 | 移动技术网IT编程 | 我要评论

课程目录

API使用流程
参考文章
代码思路
完整代码
遇到的问题
效果展示

>>> 点击进入：OpenCV专栏<<<

API使用流程

通过鸟瞰图计算直方图→用移动滑窗计算满足阈值个数的像素点→输出拟合曲线

参考文章

代码思路

1.创建二值像素直方图，把左边和右边数据分开，统计累计值最多的点坐标为中心。
2.设置一个宽度margin（窗口宽度一半），设置Y方向的滑动窗口个数（Y方向被切分成几份）
3.设置像素点阈值，如果超过阈值，则保留全部像素点坐标，最后得到一个全部符合的像素点坐标list。
4.使用np.ployfit最小二乘法拟合，计算出曲线的系数，这里使用二次曲线拟合。
5.使用cv2.fillPoly填充曲线内部的面积。

完整代码

# -*- coding:utf-8 -*-
'''
@Author: knocky
@Blog: https://blog.csdn.net/zzx188891020
@E-mail: 188891020@qq.com
@File: cal_line_param.py
@CreateTime: 2020/6/11 15:55
'''
import numpy as np
import cv2
import matplotlib.pyplot as plt
from perspect_transform import *


# 精确定位车道线
def cal_line_param(binary_warped):
    # 1.确定左右车道线的位置
    # 统计直方图
    histogram = np.sum(binary_warped[:, :], axis=0)  #histogram.shape (1280, )
    # plt.plot(histogram)
    # plt.show()
    # 在统计结果中找到左右最大的点的位置，作为左右车道检测的开始点
    # 将统计结果一分为二，划分为左右两个部分，分别定位峰值位置，即为两条车道的搜索位置
    midpoint = np.int(histogram.shape[0] / 2)
    leftx_base = np.argmax(histogram[:midpoint])
    rightx_base = np.argmax(histogram[midpoint:]) + midpoint
    # 2.滑动窗口检测车道线
    # 设置滑动窗口的数量，计算每一个窗口的高度
    nwindows = 9
    window_height = np.int(binary_warped.shape[0] / nwindows)
    # 获取图像中不为0的点
    # nonzero函数是numpy中用于得到数组array中非零元素的位置（数组索引）的函数
    # nonzero解释参见https://blog.csdn.net/lilong117194/article/details/78283358
    nonzero = binary_warped.nonzero()
    nonzeroy = np.array(nonzero[0])
    nonzerox = np.array(nonzero[1])
    # 车道检测的当前位置
    leftx_current = leftx_base
    rightx_current = rightx_base
    # 设置x的检测范围，滑动窗口的宽度的一半，手动指定
    margin = 100
    # 设置最小像素点，阈值用于统计滑动窗口区域内的非零像素个数，小于50的窗口不对x的中心值进行更新
    minpix = 50
    # 用来记录搜索窗口中非零点在nonzeroy和nonzerox中的索引
    left_lane_inds = []
    right_lane_inds = []

    # 遍历该副图像中的每一个窗口
    for window in range(nwindows):
        # 设置窗口的y的检测范围，因为图像是（行列）,shape[0]表示y方向的结果，上面是0
        win_y_low = binary_warped.shape[0] - (window + 1) * window_height
        win_y_high = binary_warped.shape[0] - window * window_height
        # 左车道x的范围
        win_xleft_low = leftx_current - margin
        win_xleft_high = leftx_current + margin
        # 右车道x的范围
        win_xright_low = rightx_current - margin
        win_xright_high = rightx_current + margin

        # 确定非零点的位置x,y是否在搜索窗口中，将在搜索窗口内的x,y的索引存入left_lane_inds和right_lane_inds中
        good_left_inds = ((nonzeroy >= win_y_low) & (nonzeroy < win_y_high) &
                          (nonzerox >= win_xleft_low) & (nonzerox < win_xleft_high)).nonzero()[0]
        good_right_inds = ((nonzeroy >= win_y_low) & (nonzeroy < win_y_high) &
                           (nonzerox >= win_xright_low) & (nonzerox < win_xright_high)).nonzero()[0]
        left_lane_inds.append(good_left_inds)
        right_lane_inds.append(good_right_inds)

        # 如果获取的点的个数大于最小个数，则利用其更新滑动窗口在x轴的位置
        if len(good_left_inds) > minpix:
            leftx_current = np.int(np.mean(nonzerox[good_left_inds]))
        if len(good_right_inds) > minpix:
            rightx_current = np.int(np.mean(nonzerox[good_right_inds]))

    # 将检测出的左右车道点转换为array
    left_lane_inds = np.concatenate(left_lane_inds)
    right_lane_inds = np.concatenate(right_lane_inds)

    # 获取检测出的左右车道点在图像中的位置
    leftx = nonzerox[left_lane_inds]
    lefty = nonzeroy[left_lane_inds]
    rightx = nonzerox[right_lane_inds]
    righty = nonzeroy[right_lane_inds]

    # 3.用曲线拟合检测出的点,二次多项式拟合，返回的结果是系数
    left_fit = np.polyfit(lefty, leftx, 2)
    right_fit = np.polyfit(righty, rightx, 2)
    return left_fit, right_fit

# 填充车道线之间的多边形
def fill_lane_poly(img, left_fit, right_fit):
    # 获取图像的行数
    y_max = img.shape[0]
    # 设置输出图像的大小，并将白色位置设为255
    out_img = np.dstack((img, img, img)) * 255
    # 在拟合曲线中获取左右车道线的像素位置
    left_points = [[left_fit[0] * y ** 2 + left_fit[1] * y + left_fit[2], y] for y in range(y_max)]
    right_points = [[right_fit[0] * y ** 2 + right_fit[1] * y + right_fit[2], y] for y in range(y_max - 1, -1, -1)]
    # 将左右车道的像素点进行合并
    line_points = np.vstack((left_points, right_points))
    # 根据左右车道线的像素位置绘制多边形

    cv2.fillPoly(out_img, np.int_([line_points]), (0, 255, 0))
    return out_img


if __name__ == '__main__':
    img_transform = cv2.imread('perspect_img/img_straight_transform.jpg',0)
    # 这里的点，是之前直线确认好的点。不是test3的标定点
    points = [[601, 448], [683, 448], [230, 717], [1097, 717]]
    # 计算透视变化矩阵
    M, M_inverse = cal_perspective_params(img_transform, points)
    # trasform_img = img_perspect_transform(img_transform, M)
    # 拟合左右车道线
    left_fit, right_fit = cal_line_param(img_transform)
    result = fill_lane_poly(img_transform, left_fit, right_fit)
    cv2.imshow('result',result)
    cv2.waitKey(0)
    img_transform = img_perspect_transform(result, M_inverse)
    cv2.imshow('img_transform', img_transform)
    cv2.waitKey(0)
    #彩色图片效果融合
    img = cv2.imread('../test/straight_lines2.jpg')
    img_transform_RGB = cv2.addWeighted(img,1,img_transform,0.5,0)
    cv2.imshow('img_transform_RGB', img_transform_RGB)
    cv2.waitKey(0)

遇到的问题

在这里插入图片描述
查看问题点：
导入的图片显示的是黑白的，但是保存以后居然是RGB三通道，看来是设置问题了。这里正确的应该是（1280，）

调试代码时遇到的坑：
　　用cv2.imread读取灰度图，发现获得的图片为3通道，经查证发现，cv2.imread()函数默认读取的是一副彩色图片，想要读取灰度图，则需要设置参数。

使用函数cv2.imread(filepath,flags)读入一副图片
filepath：要读入图片的完整路径
flags：读入图片的标志
cv2.IMREAD_COLOR：默认参数，读入一副彩色图片，忽略alpha通道
cv2.IMREAD_GRAYSCALE：读入灰度图片
cv2.IMREAD_UNCHANGED：顾名思义，读入完整图片，包括alpha通道

img = cv2.imread(‘color_binary.jpg’,0) 这里写0，读取的就是灰度，不写就是彩色。

出现了这个问题
在这里插入图片描述
最后发现是由于打散源代码的时候，为了输出效果，乘以了255，然后代码里又乘以了255

#将这个代码的255去掉即可
out_img = np.dstack((img, img, img)) * 255
#这样就行了
out_img = np.dstack((img, img, img))

在这里插入图片描述

效果展示

统计0-1280宽度方向的，每一个像素列的像素值统计分布，效果一目了然
在这里插入图片描述
换了另一个图的效果

拟合效果
在这里插入图片描述
填充以后的效果

逆转换效果：

在这里插入图片描述

图像融合效果：
在这里插入图片描述

本文地址：https://blog.csdn.net/zzx188891020/article/details/106690655

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

Python改变对象的字符串显示的方法

问题你想改变对象实例的打印或显示输出，让它们更具可读性。解决方案要改变一个实例的字符串表示，可重新定义它的 __str__() 和 __repr__() 方法。... [阅读全文]
Python接收手机短信的代码整理

python解决接口测试获取手机验证码问题的方法：android在收到短信后会发送一个action为android.provider.telephony.sms... [阅读全文]
python缩进长度是否统一

python 对代码的缩进要求非常严格，同一个级别代码块的缩进量必须一样，否则解释器会报 syntaxerror 异常错误。在 python 中，对于类定义、函... [阅读全文]
python线程里哪种模块比较适合

在python中可使用的多线程模块主要有两个，thread和threading模块。thread模块提供了基本的线程和锁的支持，建议新手不要使用。threadi... [阅读全文]
Python 如何在字符串中插入变量

问题你想创建一个内嵌变量的字符串，变量被它的值所表示的字符串替换掉。解决方案python并没有对在字符串中简单替换变量值提供直接的支持。但是通过使用字符串的 ... [阅读全文]
Python实现一个简单的递归下降分析器

问题你想根据一组语法规则解析文本并执行命令，或者构造一个代表输入的抽象语法树。如果语法非常简单，你可以不去使用一些框架，而是自己写这个解析器。解决方案在这个问... [阅读全文]
Python实现数字的格式化输出

问题你需要将数字格式化后输出，并控制数字的位数、对齐、千位分隔符和其他的细节。解决方案格式化输出单个数字的时候，可以使用内置的 format() 函数，比如：&... [阅读全文]
Python 执行矩阵与线性代数运算

问题你需要执行矩阵和线性代数运算，比如矩阵乘法、寻找行列式、求解线性方程组等等。解决方案numpy 库有一个矩阵对象可以用来解决这个问题。矩阵类似于3.9小节中... [阅读全文]
Python 日期与时间转换的方法

问题你需要执行简单的时间转换，比如天到秒，小时到分钟等的转换。解决方案为了执行不同时间单位的转换和计算，请使用 datetime 模块。比如，为了表示一个时间... [阅读全文]
Python 如何展开嵌套的序列

问题你想将一个多层嵌套的序列展开成一个单层列表解决方案可以写一个包含 yield from 语句的递归生成器来轻松解决这个问题。比如：from collecti... [阅读全文]

网友评论


验证码：