课堂作业1:
1、 语音信号的特点是什么?画出数字模型
语音信号的最基本组成单位是音素。音素可以分为“浊音”和“清音”两大类,语音信号的频谱分量主要集中在300~3400HZ的范围内,其采样率为8kHZ,某些语音系统将此频率扩展到7~9KHZ,其采样率也提高 到15~20kHZ。语音信号具有短时性。
2、简述语音信号的特点,基频、共振峰是什么含义?
语音一般由清音和浊音组成,浊音的声带振动基本频率,又称基音频率。声道可以看成是一根具有非均匀截面的声管,在发音时起共鸣的作用,。当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰为频谱中明显的几个凸起点,它的出现频率与声道的谐振频率相对应。
3、简述短时分析方法,怎样用AMDF判基音?
由于语音信号的准平稳特性,任何语信号数字处理算法和技术都建立在“短时”基础上。语音信号中一组基本短时参数有:短时能量E,短时平均幅度M和短时过零率Z。短时自相关函数和短时频谱(或短时功率谱)是语音信号非常重要的一对短时参数,分别在时域和频域中表征了语音信号的一些主要特征。短时基音周期是语音信号重要的参数之一。用短时自关函数进行基音周期估计是寻找它的最大峰值点的位置,而用短时AMDF进行基音周期估计是寻找它的最深谷值点的位置。 4、短时傅立叶分析的含义?采样时如何考虑?
语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅立叶变换不能用来直接表示语音信号,而应该用短时傅立叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。
编辑版word
课堂作业二:
1、画出同态滤波中特征系统框图,写出倒谱定义式 X(n) * D[ ] *+ X’(n) + L[ ] + + Y’(n) D-1*[ ] * y(n) 卷积同态系统的框图
复倒谱x(n)是x(n)的Z变换取对数后的逆Z变换,其表达式如下:
^x?Z^?1[lnZ[x(n)]] (7)
编辑版word
倒谱c(n)定义为x(n)取Z变换后的幅度对数的逆Z变换,即
c(n)?z?1[ln|X(z)|] (8)
2、 相位卷绕是什么?怎样避免?
相位伸展或相位解卷绕的前提条件是相邻采样点相位差的绝对值小于pi,即要求 lARG[H(k)]一ARG[H(k—1)]I 3、写出声道冲激响应序列的复倒谱特点。说明如何在语音信号的复倒谱中分离出声道冲激响应,得到声道冲激响应有何用途? 在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积。对于浊音,激励信号可以由周期脉冲序列表示;对于清音,激励信号可以由随机噪声序列表示。声道系统相当于参数缓慢变化的零极点线性滤波器。这样经过同态处理后,语音信号的复倒谱,激励信号的复倒谱,声道系统的复倒谱之间满足下面的关系: s(n)?e(n)?v(n) (9) ^^^由于倒谱对应于复倒谱的偶部,因此倒谱与复倒谱具有同样的特点,很容易知道语音信号的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系: c(n)?c(n)?c(n) (10) sev浊音信号的倒谱中存在着峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用这个特点我们可以进行清浊音的判断,并且可以估计浊音的基音周期。 课堂练习3: 1、简述LPC方程的建立过程, LPC系数与语音模型有什么关系? LP分析为线性时不变因果稳定系统V(z)建立一个全极点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。 如果利用P个取样值来进行预测,则称为P阶线性预测。 假设用过去P个取样值 ?S?n?1?,S?n?2?,KS?n?p??S?n???ak?n?k?k?1?p的加权之和来预测信号当前取样值 S?n?,则预测信号 S?n??为: (1) 其中加权系数用 ?ak表示,称为预测系数,则预测误差为: pe?n??s?n??S?n??s?n???ak?n?k?k?1 (2) 要使预测最佳,则要使短时平均预测误差最小有: 2??E??e?n????min (3) 2???e?n????ak令 ?0,(1?k?p) (4) 编辑版word