基于单目摄像头的视觉识别技术在机动车驾驶考试中的应用
来源:用户上传
作者:
摘要:随着科技的日新月异,计算机视觉识别技术已经被应用于各行各业之中。机动车驾驶考试也在逐渐采用了视觉识别技术取代人工评分的方式实现对考生驾驶表现进行客观评分,以维护考试的公平,提高考试效率。为此,本文将着重探讨基于单目摄像头的视觉识别技术在机动车驾驶考试中的应用。
关键词:视觉识别技术;单目摄像头;机动车驾驶考试
一、前言
近些年来随着经济的飞速增长,私家车已经逐渐成为人们首要选择的代步工具,由此也掀起了一波驾驶技能考试浪潮。而在道路驾驶技能考试中科目三属于难度较大的驾驶技能实战性考试。考生需要在规定的时间之内连串地完成一系列驾驶动作。考试的过程中会由考试委员会派一名主考官坐在考生所驾驶车辆的副驾驶座位上,对考生的整体表现进行评分,以决定考生最终是否能够通过考试。这种人工评分的方法存在着一定的弊端,主考官未并就能够公平客观地对考生进行评分,而且每次考试也都耗费许多多余的人力物资。为此近些年来业内的相关专家和学者都在研究与推行智能化机动车驾驶证科目三道路驾驶技能考试。基于上述原因,本文将着重探讨基于单目摄像头的视觉识别技术在机动车驾驶考试中的应用。
二、视觉识别技术理论基础
1、粒子滤波器
粒子滤波器是建构于 Monte Carlo 技术上非常成熟的数值方法,在高维度或是变因复杂的环境下能有效又准确的计算出传统方式无法计算出的数学方程式,Monte Carlo 主要是基于当求解的问题为某种事物出现的机率或者随机变量的期望值时,可透过实验证明的方式,以求得该事物出现的机率或该变量的平均值,以作为此问题的解。Monte Carlo 最重要的精神为:仿真和取样,仿真指的是提供近似于实际现象的随机程序并以数学方法来表示,而取样则是透过少量粒子来模仿整个群体的概念。所以 Monte Carlo 是随机过程与机率统计的重大理论,当取样越多次时,代表实验进行了越多次也越接近真实的问题解答。而粒子滤波器建构在 Monte Carlo 上,以粒子在空间中运动的概念,对于物体的运动进行仿真以求出最佳解。而当粒子数越多时,亦代表了在空间中涵盖面积越多,正确率当然会越高。当相反地粒子数越多,每个粒子的状态都需要估计,计算时间也越久。故采用一定量的粒子进行状态上的估测。而粒子滤波器也是卡曼滤波器(Kalman filter)的衍生,因卡曼滤波器是基于物体是以线性移动,而粒子滤波器则可以非线性进行运动。粒子滤波器主要是以一定数量随机样本例子来表示系统状态的事后机率(posterior)分布,并以事前机率和转移模型来表示下个状态的推演,最后将粒子的期望值当作最终的估测结果[1]。
2、积分影像
由于计算矩形特征最大的计算在于计算黑色区域以及白色区域间的像素加总,而矩形特征越大所需进行的加总将越多,而曾经加总过的区域在记算下一个矩形特征时将得重新计算,如此重复累计的行为[2]。请考虑假设有 30 个矩形特征,而切割出的子影像为 1000 张,则先得进行 30000 次的矩形特征计算,若每个矩形特征为 50*50 则需计算2500 次的像素加总,如此一来计算次数将为七千五百万次,但这只是考虑矩形特征为相同区域涵盖的情形,故考虑此点的情形下,若能在此点下手每次计算矩形特征的时间能得以缩短,将会加速整个运算的步骤,所以在此使用了积分影像进行加速。而所谓积分影像,其实是与输入影像相同大小的矩阵,而矩阵中将储存像素值的加总并从左上角开始储存,矩阵特征将可利用此影像来作查表的动作,进行加速的动作[3]。
3、Adaboost 算法
根据先前提到每个矩形特征根据不同大小、位置皆可以当作一个弱分类器,但并非每个弱分类器皆是对于人脸的分类判断是有益处,所以我们需要一个方法来判断出这些弱分类器是否能辨别人脸,Adaboost算法即是拿来进行特征的挑选,选出对于人脸辨识有用的特征,如此可大幅降低系统的计算量[4]。
三、实验仿真
目前绝大多数道路驾驶技能路考考试的考场都会在关键位置设置单目摄像头捕抓考生驾驶过程中观察后视镜、低头看挡、观察交通等动作是否在规定的时间内完成,并根据相关标准对考生的道路驾驶技能路考考试成绩进行评分。本次实验将以2018年10月的C1驾驶证科目三道路驾驶技能考试为研究对象,利用粒子滤波器、积分影像和Adaboost 算法实现对参考考试的考生进行人脸侦测定位,并实现对观察后视镜、低头看挡、观察交通等关键动作进行评分。我们有六位不同的驾驶者分别于晴天、阴天和雨天的情况下,针对了不同的光影变化路段进行测试,而所经过光影变化的情形有涵洞、不同亮度的隧道、大楼间阴影、地下道、涵洞、高架陆桥以及前方煞车灯映像于驾驶脸上的情形。
实验过程中考场上的单目摄像頭实时地捕捉考生的动作。当影像进入初期,会经过是否影像补偿的验证动作,接下来我们为了要确认侦测结果正确会先对脸部侦测进行三次的量测,量测过程采用下述公式进行表示:
Dt-1表示的是在t-1时间的侦测结果,而Dt则是t时刻的侦测结果,而是一个门坎值,若是在初始时期侦测结果连续符合门坎值,则我们判定我们已经藉由脸部侦测的方式获得脸部信息,接下来将启动追踪的机制,而追踪在此处我们是当作预测(prediction)的方式来使用,而侦测则是确认(confirmation)的机制,在上一小节,我们曾提到使用 Adaboost 的方法来进行脸部侦测以及粒子群最佳化为基础的粒子滤波器来进行追踪,以下是我们将这两个方法一起运用的机制:
(1)将前一个时间点,人脸侦测的结果给予粒子群优化为基础的粒子滤波器进行追踪,而在终止条件达到时,我们将取出群体优化的粒子以及个体优化适应值最佳的前两名粒子。
(2)根据粒子自身的状态(脸部中心坐标、脸部范围大小),将在影像平面上以交集的方式建构一个侦测的感兴趣区域范围(detection ROI)。
(3)以此建构范围,进行 Adaboost 人脸侦测的新范围。
(4)在最后,若追踪的结果以及侦测的结果在门坎值以内,我们将相信侦测的结果,并予以输出。相关公式如下所示:
(5)假若侦测失败,将侦测的结果于以输出如下公式所示。但在下一个回合预测时会将追踪的结果放大并重新侦测,若连续侦测失败,以累加的方式在五次内将侦测范围放大到整张影像。同时采用粒子滤波器和积分影像对于单目摄像头捕抓考生驾驶过程的动作影像进行影像补偿,以提高识别的准确性。
本研究仿真实验结果显示,基于单目摄像头的视觉识别技术在机动车驾驶考试中捕抓考生驾驶过程中观察后视镜、低头看挡、观察交通等动作是否在规定的时间内完成,并根据相关标准对考生的道路驾驶技能路考考试成绩进行评分,切实提高了考试效率。
四、结语
本文主要研究基于单目摄像头的视觉识别技术在机动车驾驶考试中的应用,利用粒子滤波器、积分影像和Adaboost 算法实现对参考考试的考生进行人脸侦测定位,并实现对观察后视镜、低头看挡、观察交通等关键动作进行评分。仿真实验结果显示,基于单目摄像头的视觉识别技术在机动车驾驶考试中捕抓考生驾驶过程中观察后视镜、低头看挡、观察交通等动作是否在规定的时间内完成,并根据相关标准对考生的道路驾驶技能路考考试成绩进行评分,切实提高了考试效率。
参考文献
[1]范晓娟,胡坤福,段海艳,et al.基于单目视觉的车辆检测技术[J].物联网技术,2017(06):18-22.
[2]唐明会,王琪,高进可.基于单目视觉的智能车系统软件设计与实现[J].自动化与仪器仪表,2018(5):12-13.
[3]曾鹏.单目视觉引导机器人在视觉检测中的应用[J].电子技术与软件工程,2017(10):97-98.
[4]单目视觉在棒料全自动上下料系统中的应用[J].传感器与微系统,2017(1):12-15.
转载注明来源:https://www.xzbu.com/1/view-14850424.htm