好文档 - 专业文书写作范文服务资料分享网站

人工神经网络技术在语音识别中的应用

天下 分享 时间: 加入收藏 我要投稿 点赞

人工神经网络技术在语音识别中的应用

张震南

【摘 要】本文对基于人工神经网络的语音识别技术进行了详细分析、讨论,阐述了人工神经网络对语音识别技术的推动作用. 【期刊名称】《甘肃科技纵横》 【年(卷),期】2008(037)004 【总页数】2页(P21,76)

【关键词】语音识别;人工神经网络;混合网络 【作 者】张震南

【作者单位】甘肃政法学院,公安分院,甘肃,兰州,730070 【正文语种】中 文 【中图分类】基础科学

2008~(第 37 卷)第 4 期市息盐水4回谙世盗然~当,,, 人工神经用络扶术在语音识别中的应用张震南(甘肃政法学院公安分院,甘肃兰州 730070) 摘要:本文对基于人工神经网络的语音识别技术进行了详细 分析、讨论,阐述了人工神经网络对语音识别技术的旅动作用。 美幢词:语音识别 人工棉经网络 混合网络0引言 语音识别是计算机通过识别过程把人类语音转变为相应文本的技术,属于多维模式坝、别和智能计算机接口的范畴。目前,具 有代表性的语音iJl.JjlJ方法主要有特征参数匹配法、隐马尔柯夫模 型法以及极具潜力的人工神经网络方法。1 人工神经网络技术在语音识别中的应用1.1人工神经网络简介和基本模型人工神经网络

ANN(Ar曲cial Neural Networks)以类比于生物 神经系统处理信息的方式,采用大量简单的处理单元并行连接而 构成一种复杂的信息处理系统。这种系统具有训练性、高度并行 性、快速判决性、容错性等特点,造用于语音信号的处理。 20世纪 80 年代以来,人工神经网络因其非线性、自适应性、 鲁棒性及学习特性并易于硬件实现等特点受到关注,尤其在语音 识别方面的应用令人瞩目。隐马尔柯夫模型法是语音识别技术的 主流方法,但该方法的缺点是分辨力不够强,人工神经网络方法 具有很强的自组织自学习能力,用于语音识别时具有较强的复杂 边界分辨能力以及对不完全信息的鲁棒性。人工神经网络技术在 语音识别中应用主要以下几个方面:“)缩小建模单元,一般在 音素上建摸,通过提高音素的识别率来提高整个系统的识别率。 (2)对声学模型、听觉模型、大脑运行机制进行深入研究,对话音 信号引进上下文信息,以减少语音多变化的影响。( 3 )从语音信号 中提取多种特征,采用混合网络模型(如 HMM+NN ),并应用多种 知识源(音素、词汇、句法、词意),进行语音识别理解研究,以提高 系统的性能。通常语音W.Jltl神经网络分为两类,一类是神经网络或神经网 络与传统的 HMM、DP 相结合的混合网络,另一类是根据人耳听 觉生理学、心理学研究成果建立听觉神经网络模型。听觉模型是以人类昕觉系统的解剖与生理学为基础,在语音 的前处理,信号提取和分析技术以及基于这些技术之上所提出的 听觉信息处理模型,常用的听觉模型有外围听觉模型、同步带模 型、闭环 Elli 模型、包络分析模型和听中枢频谱处理模型。 目前,人工神经网络在复杂性和规模上都不能与人的听觉系 统相比。因此,探讨人工神经网络在语音信号处理中的应用,主要 是从听觉神经模型中得到启发,以便构成具有类似能力的人工系 统,在解决语音识别问题时能得到较好的性能。语音识别中较常 用且有潜力的神经网络模型主要有单层感知器模型 SLP(Single La阳 Perceptron)、多层感知器模型 MLP( Multi-Layer Perceptron )、 Kohonen 自组织特征映射模型 SOFM (倒f

OrganizationFeatureMapping)、径向基函数神经网络 RBF(R且dial Basis Function)、预测 神经网络 PNN阶ediction Neural Networks)等,其模型概述如下: (1)多层感知器网。多层感知器误差反传网络是采用反向传播算 法的多层感知器神经网络,克服了 HMM 对声学上相似的词易混 淆的缺点,已成功地用于音素识别。一般趋向于用 BP(Back Propagation)网完成静态模式分类,再用 HMM 或 DP 完成时间对 准。(2) Kohonen 自组织特征映射神经网。自组织神经网是基于脑 科学研究中得到的认识提出的。大脑皮层被认为是一种薄层结 构,信息存储在表面,不同区域对应于不同的感知内容,它能在接 收外界信息剌激下,不断传感反射信号,自组织大脑皮层空间的功能。Kohonen 自组织特征映射神经网就是模仿人脑的这种功能 构造的神经网络,它能将多维空间的输入矢量集映射到一个称为 特征图的二维矩阵,而能保持与原训练矢量集近似相同的拓扑结 构。 Kohonen 将特征降维应用于 SOFMf1l,对芬兰语的 21 个音素实 现了声控打字机。(3 )预测神经网络。预测神经网络把感知器作为 模式预测器而不是模式分类器来用,是佣年代新兴的一种神经 网络语音识别方法,具有很强的建模能力,可用于大词汇量、连续 语音、非特定人的语音识 Ujlj研究上。它的特点可概括为充分利用 语音模式中的时间相关性作为识别的线索;用 DP 法对语音信号 进行时间规正;基于动态规划和反向传播能够找到一种优化算 法:容易增加新的识别类等。此外,为了使神经网络反映出语音信号的动态时变特性,还 有时延神经网络 TDNNσime Delay Neural Networks)、循环神经网 络RNN(R回山白,ntNe飞』昕觉神经网络、BP 网络、时延神经网络、自组织特征映射、学习矢 量量化和神经预测网络进行了详细分析、讨论,指出了它们各自 的优缺点,为在以后的研究中找到对语音信号更强有力的神经网 络模型,更适宜的激活函数,更高速有效的学习算法和更合理的 结构做了理论铺垫。1.2人工神经网络和传统方法的结合在语音识别中的应用 采用人工神经网络技术进行语音识别的过程包网络学习过 程和

3z9mf7f2bd0vngk58yua7wp9920czo00zvj
领取福利

微信扫码领取福利

微信扫码分享