扩展了目标识别的手段,并且扩展后的旋转Haar特征也可以利用积分图像在常数时间内进行计算。
2.6 软件系统设计与实现
将各个分散的功能综合起来,再利用微软的最新DirectX视频处理技术,就形成了基于Haar特征的完整的面部特征判别系统。
2.6.1 实时系统的关键技术-DirectX
这个编程接口可以提供开发高质量、实时的应用程序所需要的各种资源。使用DirectX的主要有两个好处:
1、为软件开发者提供硬件无关性;
2、为硬件开发提供策略。前者使得我们的系统不再倚赖于任何特定的视频采集设备。DirectX SDK为基于Windows平台的应用程序提供了以下几个组件。
我们的面部特征判别系统基于DirectX技术,并主要应用DirectShow组件。DirectShow技术是构建“实时”机器视觉系统的关键,也是建立机器视觉平台的主要的技术难点。
DirectShow是基于COM(Component Object Model)接口的,所以,我们可以将DirectX程序中各个程序组件看作对象的实例。在DirectShow中叫做Filter,各个软硬件厂商可以开发自己的Filter,例如可以播放MPEG-4格式的Filter、可以访问DVD光驱的Filter等等,它们都遵循同一个软件接口。Windows系统存在非常多不同类型的Filter,这些Filter象盖房子的砖瓦一样搭建起一个系统。
2.6.2 实验环境
面部特征判别系统采用Visual C++ 6.0开发,软件开发采用MFC的单窗口框架结构,以及微软DirectX 8.0的SDK,硬件平台是p4赛扬1.7G,内存128M,采集卡(或摄像头)。试验数据包括通过摄像机得到的视频材料,和用电视卡采集的视频片断。视频图像大小为352×288象素,包含BGR共3个颜色通道。全部是未经修饰和处理的原始素材,包含复杂背景。
3 总 结
面部特征判别可以广泛应用到身份验证、信息安全、电子商务、人机等诸多领域。随着社会日益增长的巨大需求、计算机软硬件技术的成熟和面部特征判别研究的日趋进步,面部特征判别逐步受到重视。特别是复杂背景下的人脸检测研究,已经逐步成为面部特征判别系统是否能够真正实用的关键。
本设计了基于Haar特征的面部特征判别算法之后,发现虽然它具有具有很强的实时性,但在复杂背景下的面部特征检测率,错检率等指标不是很理想。所以,本文了图像中的肤色、外形、边缘能量、背景等特征,提出利用肤色概率模型、形态学算子、轮廓过滤、边缘启发式搜索、背景概率分布、阴影检测等手段改进原算法。另外,本文提出了基于背景模型和头肩几何特征的面部粗定位技术,缩小了面部定位的范围,提高了性能。同时,讨论的各种理论和实现方法,对视频监控、车牌识别等其它机器视觉应用系统,具有借鉴价值。
同时,也存在一些不少的问题,如面部特征判别对人类来说是件自然而然的事情,但对计算机而言,面部特征判别却远非一个已解决的课题。所有的面部都具有相似的结构,在纹理上也十分相近。另外图像受光照、成像角度及成像距离等外界条件影响,具有“一人千面”的特点,欲建立一种具有各种不变性的描述模型还是比较困难的。此外,面部特征判别技术研究与相关科学的发展及人脑的认识程度紧密相关。诸多因素都使面部特征判别研究成为一项极富挑战性的课题,一方面信息化进程的日益加快,电子商务、重要场所的安全认证、智能化环境等许多应用领域对与面部有关的信息处理提出了迫切要求;另一方面,硬件和软件技术的发展,为满足实际应用系统对面部检测、跟踪及识别技术的实时化要求提供了可能性。
面部特征判别技术是一个极富挑战性的问题,尽管目前存在许多的面部特征检测和面部特征算法,但是每种算法都是在特定的实验环境中得到验证的,评价标准不统一,而且目前还没有一种算法适用各种不同的实验环境。目前在特定的条件下面部特征的研究算法已取得了显著的进展,但是,一个稳定性和鲁棒性强的面部特征判别系统需要在不同的环境,如光照、面部旋转角度、姿势和部分遮挡、面部表情以及外部饰物等干扰下,也具有很好的有效性和稳定性。因此,在
未来几年中,特征获取问题、面部非线性建模问题、3D建模问题、面部模式的流形学习、多特征融合策略以及分类器的泛化能力研究将是具有代表性的几个发展方向。
4.参考文献
[1]周杰,卢春雨,张长水等.人脸自动识别方法综述.电子学报,2000,28(4):102-106
[2]陈锻生,刘政凯.肤色检测技术综述[J]计算机学报,2006,(02).
[3]Menser,B.,Wien,M.,Segmentation and tracking of facial regions in color image sequences.Proc.SPIE Visual Communications and Image Processing 2000,731–740. [4]Terrillon,J.-C.,Shirazi,M. N.,Fukamachi,H.,Akamatsu S.,Comparative performance of different skin chrominance models and chrominance spaces for the automatic detection of human faces in color images. Proc. of the International Conference on Face and Gesture Recognition, 54–61.
[5]Yang, M.,AHUJA,N.Gaussian mixture model for human skin color and its application in image and video databases. In Proc. of the SPIE: Conf. on Storage and Retrieval for Image and Video Databases (SPIE 99),vol.3656, 458–466,1999. [6]Terrillon J C, Sh irazi M N , Fukamach i H et al.Comparative performance of different skin chrominance models and chrominance spaces for the automatic detection of human faces in co lorimages. Conference on Automatic Face and Gesture Recognition,Grenoble,France,2000.
[7]Garcia C, Zikos G, Tziritas G, Face detection in color images using wavelet packet analysis, In: Proc. Multimedia Computing and Systems, Centro Affari,Florence, Italy,1999,Vol.1:703-708
[8]Abdel-Mottaleb M, Elgammal A. Face detection in complex environments from color
images.In:Proc.IEEE
Conf.
on
Image
Processing,Kobe,Japan,1999,
Vol.3(11-13):622-626
[9]Karlekar J, Desai U B. Finding faces in color images using wavelet transform. In:Proc. IEEE Conf. on Image Analysis and Processing, Venice, Italy, 1999, 1085-1088
[10]Ishii H, Fukumi M, Akamatsu N. Face detection based on skin color information in visual scenes by neural networks. In Proc. Systems,Man, and Cybernetics, Tokyo,Japan,1999 Vol.5:350-355
[12]张翠萍,苏光大.人脸识别技术综述[J].中国图像图形学报,2000,5(11):885-894. [13]李武军,王崇骏,张 炜,等. 人脸识别研究综述[J].模式识别与人工智能,2006,19(1):58-66.
[14]P. Sinha,“Object Recognition via Image Invariants: A Case Study,” Investigative Ophthalmology and Visual Science, vol. 35,no. 4, pp. 1735-1740, 1994.
[15]A.Mohan,C.Papageorgiou,T.Poggio. Example-based object detection in images by components. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 23, No. 4, pp. 349 -361, April 2001.
[16] Rainer Lienhart and Jochen Maydt ,An Extended Set of Haar-like Features for Rapid Object Detection,ICIP2002.