您好, 访客   登录/注册

基于改进HOG特征和SVM分类器的行人检测

来源:用户上传      作者:

  摘  要: 本文首先研究了行人检测的方法和面临的难点,然后根据高斯平滑滤波器和双线性插值法对传统方向梯度直方图做了改进,并搭建了支持向量机模型,从而构建了基于改进HOG特征和SVM分类器的行人检测系统。实验结果显示,在明亮且无遮挡的场景下,矩形框精确地定位行人,在光照不足或存在轻微遮挡时可以大体定位到行人,表明该系统在明亮无遮挡的情况下有准确的结果,并且在昏暗和轻度遮挡下检测效果良好,最后通过对比可以得出,本文提出的方法总体效果优于传统HOG特征和SVM分类器的方法。
  关键词: 行人检测;HOG特征;SVM分类器;跟踪算法;梯度;最佳分类表面
  中图分类号: TP391.41    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.02.015
  【Abstract】: This paper first studies the pedestrian detection method and the difficulties it faces, then improves the traditional direction gradient histogram according to Gaussian smoothing filter and bilinear interpolation method, and builds the support vector machine model to construct the improved HOG feature. And the pedestrian detection system of the SVM classifier. The experimental results show that in a bright and unobstructed scene, the rectangular frame accurately locates the pedestrian, and when the brightness is not bright enough or there is slight occlusion, the pedestrian can be generally positioned, indicating that the system has accurate results in the case of bright unobstructed, and The detection effect is good under dim and light occlusion. It can be concluded that the overall effect of the proposed method is better than the traditional HOG feature and SVM classifier.
  【Key words】: Pedestrian detection; HOG features; SVM classifier; Tracking algorithm; Gradient; Optimum classification surface
  0  引言
  行人检测是一项具有挑战性的任务,近年来的应用引起了很多关注,它的研究成果可应用于视频分析[1],智能视频监控[2],人机交互[3],作为道路交通检测的一部分[4],行人检测面临的主要问题有复杂多样的背景环境、行人与摄像机之间动态变化的场景、系统实时性与稳定性的严格要求等[5]。                                                                                                                           作为一种非网格体,行人有许多姿势,可能出现在不同的道路场景中,穿有各種颜色和图案的衣服,行人通常走在复杂的背景中,从图像到图像有不同的颜色和光照,只有部分行人可见是处理的另一个难题。这些条件使我们的工作非常复杂,也非常具有挑战性。   在对目标进行跟踪时,很多因素会对跟踪算法的效果造成影响,如光照强弱、目标有无遮挡、目标运动速度较快、复杂或者模糊的背景的干扰等。尤其是在实际的应用环境中,采用视觉对目标进行跟踪依然面临着很多复杂的因素的干扰,这些因素叠加在一起对目标识别的稳定性产生了极大的影响[6],目前已有的跟踪算法尚不能适应各种各样复杂的环境[7]。
  文献[8]是基于传统HOG和SVM展开的研究,当样本中行人数量很少时,检测结果较为准确,但行人数量增多后实验效果不佳,另外,光线明暗与遮挡部分的多少对结果的影响很大。文献[9]将传统HOG特征改进为MultiHOG,提取了行人的轮廓特征, 从而有效地减小了冗余特征的影响,但对远处的行人漏检率偏高,而且容易将其它物体错误地识别成行人。本文同样对HOG特征进行改进,采用的是高斯平滑滤波器和双线性插值法,这样可以更好地提取行人的HOG特征,得到更准确的实验结果。
  1  传统HOG特征提取
  方向梯度直方图(Histogram Oriented Gradient)的基本特征是梯度直方图的统计[10]。HOG描述符先将图像划分为小区域单元,然后捕获每个像素点的梯度直方图单元,最后把该直方图组合起来构成HOG特征描述符。HOG描述符具有独特的优点:它不仅可以捕获边缘或梯度结构,还可以捕获对局部几何和光学变换不敏感的特征。它与行人检测的联系十分紧密[11],传统的HOG特征提取过程如下所述:
  1.2  块和单元格
  局部归一化需要将单元组合在一起形成更大的空间连接块。然后,HOG描述符是来自所有块区域的归一化小区直方图分量的矢量。这些块通常重叠,这意味着每个单元对最终描述符贡献不止一次。块几何形状是矩形RHOG块。每块的单元数是2×2,每单元的通道数是9,每单元的像素数是: 。
  1.3  梯度方向直方图特征
  每个单元格中的每个像素统计梯度方向从而得到直方图,直方图x轴是方向直方图通道,y轴是梯度值的总和对应的方向。最后我们可以得到一个特征向量。HOG特征提取算法步骤如下图所示。
  SVM的主要思想可归纳为两点:
  (1)旨在分析线性可分的情况。在线性不可分的情况下,利用非线性映射算法将低维输入空间不可分线性样本转化为高维特征空间可分线性样本。
  (2)基于结构风险最小化理论。构造特征空间中的最优超平面分割,使学习编辑得到全局最优解,并使样本空间的期望风险满足在一定概率上界的要求。
  
  图3  支持向量与间隔
  Fig.3  Support vector and interval
  选择不同的核函数,可以生成不同的SVM[13],以下是四个基本内核:
  (1)线性:
  (2)多项式:
  (3)径向基函数(RBF): 
  (4)二層神经网络:
  4  实验步骤和流程
  本文的实验步骤为:先将从数据库收集的合适样本用本文提出的改进HOG算法提取对象特征,然后将提取的特征放入SVM进行分类训练,最后输入待检测图像,查看实验结果。
  本文的SVM训练模型如下。
  本文系统的实验环境为MATLAB R2016a,实验结果如图6所示。本文训练样本图像和测试样本图像中的行人数量有一到多个,所有样本的像素都是64×128,训练过程耗时6 min左右,得到的行人检测模型准确率达92%以上。   从实验结果可以看到,在明亮且无遮挡的场景下,文献[8]和本文都能清晰、准确地锁定行人。在光线不足的情况下,文献[8]出现漏检,而本文的结果不存在漏检,只是没有把所有行人单独检测出来,存在个别“一框定两人”的现象,对比可以得到,昏暗场景下,本文方法更好。
  为了对轻度遮挡场景下两种方法的效果进行更直观的比较,对同一张彩色图像分别进行实验,结果如下。
  对第一幅图像的这两个结果比较可知,本文方法可以检测出文献[8]无法检测到的远处的行人。在第二幅图像中,本文提出的方法能检测到文献[8]漏检的人,并且将文献[8]用一个框定位的两个人分别检测出来。由此可见,本文的基于改进HOG特征和SVM分类器的行人检测方法比文献[8]识别率更高。
  5  结论
  本文主要通过方向梯度直方图和支持向量机对行人检测进行了研究,分析了目前面临的问题并介绍了行人检测的研究方法,用高斯平滑滤波器和双线性插值法对传统的HOG做了改进,而且搭建了SVM模型,根据算法训练了一个改进HOG特征和SVM分类器相结合的行人检测模型,该模型对两种属性(明亮和昏暗,无遮挡和轻度遮挡)变化下行人检测的效果通过实验得到了验证,经过对比得出,本文提出的方法比文献[8]的有效性更高。在光线不足的条件下,本文方法对行人的识别率明显低于光线良好的情况,且有极小的可能误检测出非行人,在今后的研究中,重点在于提高昏暗场景下行人检测的准确率。
  参考文献
  张闯, 张海涛, 李文生. 异构视频监控系统媒体资源共享与发现机制研究[J]. 软件, 2015, 36(12): 16-21.
  张明军, 俞文静, 袁志, 黄志金. 视频中目标检测算法研究[J]. 软件, 2016, 37(04): 40-45.
  Siddharth S. Rautaray, Anupam Agrawal. Vision based hand gesture recognition for human computer interaction: a survey[J]. Artificial Intelligence Review, 2015, 43(1).
  厉双华. 道路交通检测系统的设计和实现[J]. 软件, 2015, 36(12): 206-208.
  闫江南, 杨帅, 崔育帅. 基于视频分析的公交客流统计系统的研究[J]. 软件, 2018, 39(06): 155-159.
  郑茂凯. 运动目标识别与跟踪方法的研究[D]. 沈阳工业大学, 2019.
  李盈盈, 李菲菲. 基于改进HOG共生概率特征的行人检测算法[J]. 电子科技, 2018, 31(09): 4-8.
  岳鑫. 基于HOG特征和SVM分类器的行人检测研究[J]. 科技创新与应用, 2016(05): 62-63.
  田仙仙, 鲍泓, 徐成. 一种改进HOG特征的行人检测算法[J]. 计算机科学, 2014, 41(09): 320-324.
  Dandan Wang, Tongei Lu, Yanduo Zhang. HOG pedestrian detection based on edge symmetry and trilinear interpolation[P]. International Symposium on Multispectral Image Processing and Pattern Recognition, 2018.
  高琦煜. 多卷积特征融合HOG行人检测算法[J]. 計算机科学, 2017, 44(S2): 199-201+232.
  王宏涛, 孙剑伟. 基于BP神经网络和SVM的分类方法研究[J]. 软件, 2015, 36(11): 96-99.
  Guangyuan Zhang, Fei Gao, Cong Liu, Wei Liu, Huai Yuan. A pedestrian detection method based on SVM classifier and optimized Histograms of Oriented Gradients feature[P]. Natural Computation (ICNC), 2010 Sixth International Conference on, 2010.
  
转载注明来源:https://www.xzbu.com/8/view-15233563.htm