基于混合高斯和HOG+SVM的行人检测模型
龚露鸣1, 徐美华1,2, 刘冬军2, 张发宇1
【摘 要】摘要: 为了提高行人检测系统的检测率,提出了一种基于混合高斯背景建模结合方向梯度直方图(histogram of oriented gradient,HOG)+支持向量机(support vector machine,SVM)的行人检测模型.首先,采用混合高斯模型进行前景分割,有效提取出运动目标区域;然后,在行人识别部分通过缩小检测窗口尺寸来降低HOG特征维数;另外,利用误识别区域,对样本库的信息进行二次更新,以优化SVM分类器;最后,以随机视频帧为测试样本进行模型性能验证.结果表明,在保证检测率和检测速率的情况下,该混合高斯结合HOG+SVM模型的误检率仅为4%,说明该模型能够在复杂场景下实时准确地进行行人检测. 【期刊名称】上海大学学报(自然科学版) 【年(卷),期】2018(024)003 【总页数】11
【关键词】关键词:行人检测;混合高斯模型;区域提取;梯度方向直方图;降维 行人检测是机器视觉领域的研究热点,在智能监控、辅助驾驶、人机交互等系统中都有着广泛的应用,如超市中的人流量监测等.然而,由于在视频摄取过程中存在多种干扰,易导致图像分辨率低,特征信息不显著,再加上在实际情况下行人姿态多样化、复杂现实场景变动频繁等原因,故行人检测的准确率受到了较大的制约.
基于机器视觉的行人检测主要分为2个部分:运动目标区域提取和行人识别[1].目前,运动目标区域提取的主流算法有如下几种:①光流法[2-4].该方法在进行运动目标提取时,虽然无需预先知道场景信息,但易受光线变化影响,且计算量大,实
时性差.②帧间差分法[5].通过直接比较相邻两帧之间对应的像素点值的变化,能简单快速地提取出运动目标,但该方法对噪声非常敏感,当目标运动较慢、形变较小或相邻帧重叠时,易出现运动目标的错提取或漏提取.③背景建模法[6].该算法具有简单易实现、提取结果完整、适合实时处理等优点,得到了广泛研究与应用,其中高斯模型是应用最为广泛的背景建模模型.在简单场景中,对于背景变化平缓的视频帧序列,单高斯背景模型取得了较好的效果[7];而在复杂场景下,由于环境突变,背景像素值呈多峰分布现象,故该模型无法建立相应的背景模型.Stauあer等[8-9]以单高斯背景模型为基础,提出了混合高斯模型(Gaussian mixture model,GMM),该模型能随背景不断变化,提高了算法的鲁棒性.本工作正是利用背景建模算法中的GMM进行了运动目标区域的提取,以此减小行人检测的搜索区域.
但是,以上提到的算法只能进行前景图像的提取,而无法识别其前景图像中所包含的信息类别.因此,为了快速构建前景图像并进行行人识别,本工作提出了一种基于混合高斯背景建模结合梯度方向直方图(histogram of oriented gradient,HOG)+支持向量机(support vector machine,SVM)的行人检测模型,该模型总体结构如图1所示.首先,将待检测的原始视频图像输入到运动目标区域后提取模块,利用混合高斯背景建模,提取其前景图像;然后,对前景图像进行去噪连通等处理,提取最终的运动目标区域;最后,对于行人识别部分,本工作对Dalal等[10]提出的HOG特征结合SVM分类器的方法,在正样本及检测窗口上做出适当的调整,在保证检测率不变的同时,大幅降低HOG特征维数,最终对运动目标区域进行行人识别,并在图像中将行人框出.
1 基于混合高斯的运动目标区域提取
混合高斯背景建模是在复杂现实场景下前景图像提取的有效方法,但该方法会引入一些额外的干扰噪声,并且由于在得到的前景图像中,单个目标被分割成多个连通域,导致检测率的下降.因此,为保证检测率的不变,本工作对取得的前景图像进行去噪处理,最终以中心点不变原则进行区域连通以提取运动目标区域. 1.1 混合高斯前景分割
Stauあer等[9]提出的GMM如下:
式中,Xt为t时刻像素点的像素值;K为高斯分布函数的个数,通常取3~5,其值越大,处理变化的复杂场景的能力越强,但计算量也越大;wi,t为t时刻第i个高斯分布模型的权重,满t时刻第i个高斯分布的均值;Σi,t为协方差矩阵;η为高斯密度函数,
式中,d为Xt的维数.
由于现实场景会随时变化,因此模型参数需要不断地进行学习和更新,并与适合的高斯分布进行匹配,各参数更新公式如下:
式中,α为权重学习参数,ρ=α/wi,t为参数学习率,为t时刻第i个高斯分布函数的方差.如果t时刻输入的像素值满足|Xt?μi,t?1|≤2.5δi,t?1,则认为该Xt是和第i个高斯分布是匹配的,记Mi,t=1;反之,则Mi,t=0.如果某像素点与所有的高斯分布均不匹配,则把该像素点视为前景点,并利用新的高斯分布取代权值最小的高斯分布,新分布均值为Xt,标准差为σ0,权重为w0.
在参数更新后,对所有高斯成分进行排序,取满足如下公式的前M个模型视为背景模型,其余的视为目标前景[9],当阈值T较小时,模型通常为单高斯模型;当T较大时,则采用多高斯分布.
本工作采用GMM进行前景分割的实验结果如图2和3所示(图2为原始视频