隐马尔科夫模型:
1.介绍
HMMs认为任意时刻的系统的状态只与前一刻的状态相关,模型的输出也就是所谓的观察值由当前状态决定的某概率分布随机产生,而人们只能看到观察值,而看不到模型内在的状态变化,也不能给出任意时刻所处的状态,而是通过一个随机过程去感知状态的存在及其特性。因此称为“隐”Markov 链模型,即HMM。在逻辑上分为两层结构:隐含状态层和观察层,其中马氏链存在于隐含层中,而观察层是隐含层的输出。
经典HMMs模型有一个明确的图结构,它描述了一个当前的观察值仅仅依赖于当前的状态值,而当前的状态值仅依赖于前一时刻的状态值。一旦模型结构确定,我们就可以通过规定一系列的参数来说明长序列状态的可能性,用来说明这些可能性的参数的数量取决于可能的状态值和观察值的数量。
HMMs通常使用与选择提取帧相关的观察值序列来确定事件模型,先提取出模型的状态,状态数量选择由经验获得,模型的参数可以从训练数据中获得,或者使用该事件领域的一些知识手动进行详细说明;为了能区分出事件,可以使用HMMs事件模型对每个事件进行训练,估计测试的结果来确定由该结果是最有可能是由哪个模型训练产生,标注出能产生很大概率的事件模型为最佳模型。2. HMMs的改进
早期使用HMMs模型大都应用到网球击球识别、手语和标志识别以及担任行动(如行走和跪下)问题。而在这些工作中能识别的事件长度都在几秒钟。并且这些方法通常都依赖于将视频序列进行适当的分割成小片段,这样我们才能对给定的视频片段进行事件的分类。
当前该模型在一些领域对该模型进行了扩展延伸,如我们可以对包含一个变量的状态空间和观察空间分别进行表示,当状态值和观察值数目增多时,这种表示却需
要大量的要估计的参数和大量训练数据,针对这个问题提出了两种解决办法:将观察值空间进行分解成多变量的空间和改变其网络拓扑结构。
多观察值HMMs(MOHMM)使用多重变量来表示观察值,该模型使得要学习的参数数目大大减少,使得从训练数据的有限集合中得到的参数估计最大可能的产生较好的结果。
简化训练参数的另一种方法是改变拓扑结构。对于一些由有序状态组成的事件,一个全连接的转换模型却又一些不必要的参数,假设对于这样一个HMM模型的拓扑结构,它只允许从一个状态到序列中的下一个状态进行转换,对于不适合这些约束的所有参数都设置成零,可以很大程度的简化参数数量,一般这类拓扑结构要称为非正式的或者自左到右HMM模型。
针对HMMs模型假设当前状态只取决于前一时刻的状态值,这个不完全有根据,因为事件之间的长时间的依赖性以及状态估计引起的误差等因素,提出了N-orderHMMs,该模型是通过考虑先前N个状态来修改马尔科夫假设条件。变量长度隐马尔科夫模型(HSMMs)使用收敛规则来计算时间依赖的最理想结果;半隐马尔科夫模型(Semi-HMMs)允许每个状态都可以在一个时间产生观察值,多个带有状态变量,即在每一时刻伴随着一个状态变量,也将会有一个持续的变量(观察长)
3、隐马尔科夫模型算法
隐马尔科夫模型包括三个方面:识别
(1)识别问题
若记Y(Y1,Y2,…,Yt),如果给定观测值序列值为y(y1,y2,…,yt),它可能来自于几个不同的模型λi,现在要识别出它来自于哪个模型。此时我们就需要分别计算出在模型λi下产生观察值序列y(y1,y2,…,yt)的条件概率,而识别模型就是按照概率最大原则,取λ*=argmaxP(Y=y|λi)为识别结果,即认为
y(y1,y2,…,yt)来自于模型λ*,解决这一问题的一个经典的方法是前向—后向算法。
(2)译码问题
已知观察值序列y(y1,y2,…,yt)和模型λ=(π,A,B),如何选择相应的最佳的(能最好的解释观察序列的)状态序列x(x1,x2,…,xt)?并不是所有的模型都能找出正确的状态序列,实际中常用不同的优化规则来解决问题,常见的用Viterbi算法来实现。
(3)学习问题
学习(训练)问题即给定观测序序列y(y1,y2,…,yt),调整模型参数
λ=(π,A,B)使条件概率P(Y=y|λi)最大。调整模型参数使之最优化的过程就称为参数估计过程。对于这个问题,经典的算法是Baum~Welch算法,它借助于模型参数和模型状态之间的交叉验证,轮番优化参数λ=(π,A,B)和隐状态,即先给定某个初始参数入0,估计出对应于这组参数的最可能状态;再在这种最可能状态下重新估计参数入,又在新的参数下重新估计模型的最可能状态,如此循环直至概率值P(Y=y|λi)趋于稳定为止。Baum~Welch算法实际上是一种简单易行的逐次逼近算法
在足球视频中使用HMMs模型和贝叶斯理论对精彩事件识别和学习摘要:本文提出一种对精彩事件识别的方法:联合贝叶斯理论推导和隐马尔科夫模型,通过HMMs模型计算出待测试视频片段属于精彩片段还是非精彩片段的概率,然后应用贝叶斯理论推导这两个先验概率。
原理:使用隐马尔科夫模型对精彩事件(射门、角球、点球或者运动员更换)进行识别,本文提出使用HMMs和经验贝叶斯方法对精彩事件进行分类。贝叶斯理论方法通过实验数据来计算出条件概率分布,并且使用镜头分割作为HMM模型训练和精彩场景分类的输入;