毕业设计(论文)开题报告
论文题目 一、选题背景和意义: 多模态生物特征身份认证系统设计 生物特征识别技术是为了进行身份验证而采用自动技术测量生物身体的特征或是个人的 行为特点,并将这些特征或特点与数据库的模板数据进行比较,完成认证的一种解决方案。 人的生物特征是唯一的,生物特征识别技术的基本工作就是对这些基本的、可测量的或可自 动识别和验证的身体特征进行统计分析。 有越来越多的消费者、公司和政府机关都承认,现有的基于智能卡、身份证或者密码的 身份识别系统是远远不够的。而生物特征识别技术是对用户本身的特征进行认证,而这些特 征又具有独一无二,不容易被冒充模拟或窃取的特性。另外,生物特征不像传统的钥匙等物 品容易被遗忘,使用起来既方便又不需要定期维护。因此生物特征识别系统成为了目前最为 方便与安全的识别系统。 但是,每种生物特征身份识别系统在准确率、成本、用户接收程度、防欺骗性等都不同, 很难满足不冋场合的实际要求,通过改善某一种认证技术来提高系统的性能是非常困难的。 因此本课题在人脸、指纹与声音这三种常用的特征识别的基础上,着重于研究如何将这三种 特征信息进行融合,利用特征间的互补信息来提高系统准确性,降低误识率。 二、课题关键问题及难点: 本课题的关键问题首先在于如何采用合适的人脸、指纹、声音识别算法。由于三个子系 统是完整的并且相互独立,只有各个子系统本身的准确性和可靠性满足条件,才能保证融合 后的结果达到最佳。 而这些算法的关键又在于如何抽取特征, 以最小的数据代表最多的信息, 以及如何判断两个特征是不是来自同一个数据源。在融合多种生物特征的过程中,有三种方 法可以选择:传感器数据集的融合,特征集融合,以及决策集融合。如何采用合适的融合方 法,也是本课题的关键之一。 在设计过程中还需要不断地根据结果对算法以及参数做出调整。这涉及到一个评价标准 和调整方法的设定。各子系统的识别算法和最终的决策方法是否“合适”以及如何通过调整 变得“合适”,是本课题的最大难点。此外,在身份认证系统的使用中,可能会出现所查询的 身份在数据源中并不存在,但决策器在排序中仍选择了“最相似”的样本,而导致结果错误。 如何避免这种问题以及相关问题的产生,也需要在设计中多加注意。 注:开题报告可单独装订,但在院(系)范围内,封面和装订格式必须统
三、文献综述(或调研报告)
指纹的全局特征分为弓型纹、箕型纹和斗型纹。而指纹的细节特征分为端点、叉点、环 点、桥点、岛、交叉点、孤点、断点。指纹识别过程就是要对这些特征点进行操作和处理, 因此必须了解它们,通过提取、处理及比对匹配它们,来完成整个的识别过程。
[1]
:(|)
大多数指纹识别系统采用细节点提取和匹配方法。细节点提取方法目前主要有两类 从细化图象上提取。这种方法首先对指纹图象进行细化处理,然后通过分析细化纹线上象素 点的8邻域来判定细节点的类型、 位置,通过分析所连接的纹线段来判定细节点的方向。 从原始灰度图象上提取。该方法的基本原理是在指纹方向图的引导下跟踪指纹纹线,每前进 一定距离,
[2]
(2)
根据图象在与跟踪方向垂直的线段上的投影的极值确定纹线的位置,当遇到端点 和分叉点时跟踪过程终止。指纹细节点具有唯一性和稳定性,且表达方式简单,因此绝大多 数指纹匹配基于指纹细节点匹配
[2]
。细节点匹配中常用的细节点类型为端点和分叉点。细节
点匹配的任务是计算两个细节点模式的相似性。
但是传统的指纹细节点方法有两个主要的缺点。对于很大一部分人完整明确的指纹脊结 构,传统方法难以自动提取,无法体现指纹中大量的不同的可用信息,因此细节点无法完全 代表当地指纹脊结构。此外,细节点匹配方法在快速匹配包括未注册细节点的指纹图像时存 在困难。相比之下,使用
Gabor滤波器来同时抓取本地和全球的指纹细节作为指纹码具有更
【3]
大优势。而基于两个对应指纹码的欧几里德距离的指纹匹配方法速度更快。
指纹分类的目的是提高 指纹分类的思想最早由
1:N识别的效率。经过指纹分类后,在
l:N识别时输入指纹只需
同指纹库中与其类型相同的指纹进行匹配, 从而大大减少了匹配次数,
提高1:N识别的速度。 主 、右箕形(Rightloop)
E.Henry提出。他提出了著名的 HelySystem
方法,将指纹分为五种三角点的数量和相对位置。
[4]
要的结构类型:拱形(Arch)、帐拱形(Tentedarch)、左箕形(Leftloop) 和螺形
(whorl)。分类的依据是中心点附近的纹线结构以及中心点、 HenrySystem
方法提出之后,在人工指纹识别中获得成功应用。
建立和应用说话人识别系统可分为两个阶段
,即训练阶段和识别阶段。在训练阶段,系统
;在识 ,并且根
的每个使用者说出若干训练语句,系统据此建立每个使用者的模板或模型参量参考集 别阶段,从待识别说话人语音中导出的参量要与训练中的参考参量或模板加以比较 据一定的相似性准则形成判断。
[5]
说话人识别系统中的特征提取即提取语音信号中表征人的基本特征,此特征应能有效地 区分不同的说话人,且对同一说话人的变化保持相对稳定。从语音信号中提取的说话人的特 征参数应满足以下准则:对局外变量不敏感;能够长期地保持稳定;可以经常表现出来;易 于对之进行测量,与其它特征不相关。对于说话人识别系统,特征被提取出来后,需要用识 别模型为说话人建模,并对特征进行分类,以确定属于哪一个说话人。所谓的识别模型,是 指用什么模型来描述说话人的语音特征在特征空间的分布。随着计算机、数字信号处理、人 工智能等的不断发展,说话人模型已从单一的模板模型向矢量量化模型
Quantization Model
(Vector
,简称 VQ、高斯混合模型(Gaussian Mixture Model, 简称 GMM
[6]
隐马尔可夫模型(Hidden Marko Model,简称HMM、人工神经网络模型(Artificial Neural Network,简称ANN以及它们的混合模型等多方向发展。
由于每一个说话人的语音特征在特征空间中都形成了特定的分布,所以可以用这一分布 来描述说话人的个性。高斯混合模型使用多个高斯分布的线性组合近似说话人的特征分布, 将最能够产生测试语音特征的说话人分布模型所对应的说话人作为识别结果。对于高斯混合 模型,训练时,为每一个人的语音建立一个模型,训练的目的本质上是估计这个模型参数的 过程,当所有人训练结束后,保留每个人对应的参数;识别时,将未知语音与每个人的参数 相结合,求出与每个人相对应的似然函数,其中对应最大似然函数的说话人被认为是识别结 【7]【8] 同其他生物特征识别技术相比,人脸识别技术具有操作简单、结果直观、隐蔽性好的优 越性。人脸自动识别系统包括三个主要技术环节:首先是图像预处理,由于实际成像系统多 少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使 图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量,保证提取特征的有效 性,进而提高识别系统的识别率。在提取特征之前,有必要对图像进行预处理操作;人脸的 检测和定位,即从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来。对 库中所有的人脸图像大小和各器官的位置归一化;最后是对归一化的人脸图像应用人脸识别 技术进行特征提取与识别。【9] 特征脸人脸识别方法【10]是麻省理工学院 M.Turk和A.Pentland于1991年提出的,该方法 具有简单有效的特点,目前已成为事实上的基准测试算法。但它对输入的人脸图像的归一化 要求较高,其性能容易受到光照和姿态变化的影响,因此,研究者对其进行了各种各样的实 验和理论分析,尝试了基于特征脸方法和各种后端分类器相结合的方法,并提出了各种改进 版本或扩展算法,如 Bayesian概率模型、二阶 Eigenface、线性判别分析、人工神经网络以 及双子空间分析方法等。90年代中期以来,研究人员逐渐认识到, 一种有效的人脸识别算法, 必须能够充分地挖掘人脸不同方面的特征信息,具体地说,就是要有效地利用人脸的形状拓 扑结构特征、局部灰度特征和全局灰度分布特征等多种特征。因此,出现了融合上述特征信 息的一些新算法。其中,基于 Gabor小波变换和弹性图匹配的人脸识别方法是一种人脸形状 拓扑结构特征和局部灰度特征的算法。该算法较好地利用了人脸的结构信息和局部灰度分布 信息,而且还具有自动精确定位面部特征点的功能,因而具有良好的识别效果,其缺点是时 间复杂度高,实现复杂。另一种融合多种面部特征的识别方法是基于可变形统计模型的人脸 识别算法。该方法综合利用了人脸形状信息、局部灰度分布特征和全局灰度分布特征,该方 法具有自动提取形状特征的能力,具有较高的识别精度,其缺点同样是系统时间复杂高,速 度较慢。基于局部特征分析( LFA)的方法也是一种重要的识别 Local Features Analysis , 方法。此外,隐马尔可夫模型、奇异值分解、独立元分析等法也在人脸识别中得到了应用。 典型生物特征识别系统一般由如下四个环节构成 器层或像素层融合、 [11] :获取生物特征信号、特征提取、特征匹 配和分类决策。按照融合在哪个环节之后进行,多模态生物特征识别系统的融合方法可以分 成四类:传感特征层融合、分数层融合和决策层融合。 分数层融合的含义 然后通过某种 是:不同模态的生物特征分别通过特征提取、 特征匹配后获得相应的匹配分数, 分数层融合的策略,获得融合分数,利用融合分数进行最终的判决。基于分数层融合的多模 态融合系统是目前研究最多的一种融合系统。目前,分数层融合算法的研究主要有如下两种 策略:(1)组合判定策略:即利用简单规则对不同模态生物特征进行融合。 将N种不同模态生物特征的匹配分数作为一个 (2)二级分类器策略: N维特征向量,分数层融合问题转换为对该 N 维特征向量进行分类。这样许多通用的模式分类方法都可以用来处理该问题,包括 线性判别分析[15]、贝叶斯决策[15]、支持向量机、神经网络[13]、模糊积分(Fussylntegral) 等, Fisher
在分类器融合中都得到了应用。 决策层融合的含义是:不同的生物特征分别给出接收或拒绝的 判断,然后通过不同的决策方法来给出一个统一的接收或拒绝的判断。决策层融合仅可以用 到不同模态分类器输入的决策结果来进行判断,可用的信息比较少。在一些商用系统中,不 能得到更多信息的情况下通常会采用决策层融合的方案。主要的决策规则有
[12][16][17][18]
投票、加权的投票等决策方法。 则、
:与规则和或规
[1]
罗宇.关于指纹算法的研究.[硕士论文].辽宁工程技术大学.2005.
On-line fingerprint verification [J].
IEEE Transactions
[2] A.K.Jain , L.Hong , R.Bolle.
on Pattern Analysis and Machine Intelligence
,1997
Filterba nk-Based
[3] Anil K. Jai n,Salil Prabhakar, Lin Ho ng, and Sharath Pankan ti, Fin gerpri nt Matchi ng,
IEEE TRANSACTIONS ON IMAGE PROCESSING,2000
[4] 付景广.指纹识别中若干关键算法的研究 [5] ⑹ [7]
.[博士论文].中国科学院软件研究所.2003.
.语音技术.2006.
王书诏.邱天爽.与文本无关的说话人识别系统的设计
崔桂香.丁晓明.基于GMM勺说话人识别系统研究 覃溪.基于文本无关的说话人识别研究 .[硕.北京电子科技学院学报.2004.12 士论文
Douglas
A.Re yno lds,a nd
Richard C.Rose,
].广西师范大学.2007.
Robust
Text- In depe ndent
Speaker
⑹
Iden tificati on Using Gaussia n Mixture Speaker Models, AUDIO PROCESSING,1995 [9] [10] [11] [12] [13] [14] [15]
Souheil
IEEE TRANSACTIONS ON SPEECH AN
张咏梅.基于融合的人脸识别方法研究
.[博士论文 ].中北大学.2005
Turk M , Pentland A. Face recognition using eigenfaces. Conf. On CVPR
,1991
周昌军.基于图像重构和特征融合的人脸识别方法研究 .[博士论文].大连理工大学.2008 张志坚.多模态生物特征识别融合算法的研究 .[博士论文].
中国科学技术大学.2008
Data for Pers on Ide ntity Verificati 龙林.基于多模态生物特征的身份识别.[硕士论文].电子科技大学.2005
on,
田捷,杨鑫.生物特征识别技术理论与应用.北京:电子工业岀版社, 2005
Ben-Yacoub, Yousri Abdeljaoued, and Eddy Mayoraz, Fusion of Face and Speech
IEEE TRANSACTIONS ON NEURAL NETWORKS,1999
[16] Nali ni K.Ratha, Venu Govin daraju. Adva nces in Biometrics Sen sors,Algorithms and Systems. Spri nger-Verlag London Limited 2008
[17] Arun A.Ross, Karthik Nandakumar, Anil K. Jain ,Handbook of Multibiometrics,2006. [18] Aru n Ross, Anil Jai n.
In formation fusi on in biometrics.USA
, 2003
四、方案(设计方案、或研究方案、研制方案)论证: 本课题方案论证分为五部分。 1. 基于多生物特征融合的身份识别系统设计 ,第二种为查询身份。两种操作 该系统存在两种操作模式。第一种是输入身份(即注册) 模式都需要先采集生物特征信号并进行初步处理,得到生物特征模板。输入模式下的生物特 征模板将作为新添加数据储存在数据源中。在查询模式下,系统将根据所得模板匹配相关数 据源。基于上述,身份识别系统的设计分为四个模块:特征采集模块,算法模块,评估模块, 以及应用模块。其中特征采集模块关心的问题是怎样获得一个生物特征的数字表示,算法模 块的主要任务是特征的提取和匹配,评估模块主要研究的问题是采用何种方法、使用哪些统 计量可以评价识别算法的准确性,应用模块包括用户界面、数据库管理等。 2. 指纹识别 (1) 预处理,将指纹图像中的有效图像部分分割出来,对原始图像上模糊但有可能恢复 的部分进行增强,然后对整幅图像滤波消除指纹脊线间的断裂和粘连,提取经增强处理的指 纹图像的脊线,把原始灰度图像转化为二值图像,再细化为简单的骨架线。 (2) 指纹图像的特征提取和匹配。特征提取方法有多种,依匹配需要而定。若采用基于 细节特征的位置、类型及方向进行指纹匹配的方法,可先把所有的端点和分叉点找出来,然 后寻找中心点,再根据中心点确定各细节点的坐标。在提取后还要进行伪特征点去除,以保 证下一步匹配结果的准确。相应的匹配方法则是通过比对各特征点之间的相互对应关系来决 定。对于大量指纹的集中鉴别,特征提取算法中需要对尽可能多的奇异点和细节特征点进行 处理。若所存储用户指纹有限,可以只提取细节特征点,并免去指纹分类的部分。 3. 说话人识别 说话人识别主要包括特征提取和模式匹配两部分。特征提取的任务是选取唯一表现说话 人语音有效且稳定可靠的特征。模式匹配的任务是对训练和识别时的特征模式做相似性匹配。 可提取的特征包括短时功率谱、基音轮廓、共振峰频率带宽及其轨迹、动态时间规整方法、 线性预测、反映听觉特性的参数等。模式匹配部分,目前针对各种特征而提出的模式匹配方 法可归为:概率统计方法,针对语音中说话人信息在短时内较为平稳的情况,其优点是不用 对特征参量在时域上进行规整,比较适合文本无关的说话人识别;隐马尔科夫模型方法,它 把语音看成由可观察到得符号序列组成的随机过程。 HMM不需要时间规整,可节约判决时的 计算时间和存储量。缺点是训练时计算量大;人工神经网络方法,在某种程度上模拟了生物 的感知特性,具有自组织和自学习能力、很强的复杂分类边界区分能力以及对不完全信息的 鲁棒性。缺点是训练时间长,动态时间规整能力弱。 4. 人脸识别 人脸识别的两个主要的技术环节为人脸的检测和定位,即从输入图像中找到人脸存在的 位置,并将人脸从背景中分割出来,然后对归一化的人脸图像进行特征提取与识别。 人脸检测方法分为四类。(1 )基于知识的方法,利用人的知识建立若干规则,从而将人脸检 测转化为假设检验问题。这类方法的主要问题在于如何将人的知识转化为规则,并且无法适 应人脸姿态变化。(2)基于特征不变性方法,重点在于人在不同姿态不同光线下人的不变的 特征,但在特征被破坏的情况下会失效。 (3)基于模板匹配方法,首先人工定义或者参数化 的建立一个函数来描述标准人脸模式,然后根据相关性检测。容易实现但是自适应性不好。 (4)基于外观的方法,依赖于统计分析和机器学习理论, 通过从样本图像学习获得模板进行 检