早教吧作业答案频道 -->数学-->
HMM中的虚状态是怎么起作用的?连续语音识别中,对音素用HMM建模之后,通常会在起始和结束部分添加两个状态,他们被称作虚状态,好像是用作连接用的,可是,它们究竟是怎么起作用的呢,举个例
题目详情
HMM中的虚状态是怎么起作用的?
连续语音识别中,对音素用HMM建模之后,通常会在起始和结束部分添加两个状态,他们被称作虚状态,好像是用作连接用的,可是,它们究竟是怎么起作用的呢,举个例子:如果对音素建模时采用3个状态,前向,带自环,无跨越的HMM拓扑结构,那么加上前面的起始状态和最后的结束状态,就应该有5个状态,自左向右,分别是1,2,3,4,5,问题是最后一个状态时怎么转移的,也就是说第4个状态到第5个状态(结束状态)之间的转移概率是多少,4到5的转移概率会不会影响到4本身的转移概率(如果没有虚状态,4的自转移应该是1)?是不是不用去理会它俩之间的转移,直接给个1或者别的什么值?如果不是,怎么得到4到5的转移概率呢?那应该怎么训练呢?
可能你没弄懂我的问题,问题不是HMM的三个基本问题,而是,面对像连续语音识别这样的问题的时候,训练的是很小的单位,比如音素,每个音素都是一个HMM,但识别的时候,简化一点,假设识别的是一个词,一个词是由多个音素组成的,那么,该怎么连接这些单独训练的小HMM,材料上说是用虚状态连的,问题的关键就是,对每一个小HMM最后一个带观察值的状态,是以多大的概率转向虚状态的?因为在训练小HMM时,并没有训练这个概率,如果按照问题最初的HMM(见原问),最后一个带观察值的状态的自转应该是1,但现在貌似不应该这样?而且,即便知道了这个转移概率,又怎么去连接其他的模型呢?
连续语音识别中,对音素用HMM建模之后,通常会在起始和结束部分添加两个状态,他们被称作虚状态,好像是用作连接用的,可是,它们究竟是怎么起作用的呢,举个例子:如果对音素建模时采用3个状态,前向,带自环,无跨越的HMM拓扑结构,那么加上前面的起始状态和最后的结束状态,就应该有5个状态,自左向右,分别是1,2,3,4,5,问题是最后一个状态时怎么转移的,也就是说第4个状态到第5个状态(结束状态)之间的转移概率是多少,4到5的转移概率会不会影响到4本身的转移概率(如果没有虚状态,4的自转移应该是1)?是不是不用去理会它俩之间的转移,直接给个1或者别的什么值?如果不是,怎么得到4到5的转移概率呢?那应该怎么训练呢?
可能你没弄懂我的问题,问题不是HMM的三个基本问题,而是,面对像连续语音识别这样的问题的时候,训练的是很小的单位,比如音素,每个音素都是一个HMM,但识别的时候,简化一点,假设识别的是一个词,一个词是由多个音素组成的,那么,该怎么连接这些单独训练的小HMM,材料上说是用虚状态连的,问题的关键就是,对每一个小HMM最后一个带观察值的状态,是以多大的概率转向虚状态的?因为在训练小HMM时,并没有训练这个概率,如果按照问题最初的HMM(见原问),最后一个带观察值的状态的自转应该是1,但现在貌似不应该这样?而且,即便知道了这个转移概率,又怎么去连接其他的模型呢?
▼优质解答
答案和解析
假设我们已经获得了构成一个序列的观测数据 {x[t]},t = 1,...,T.x[i]是观测值,而对应的y[t]是无法直接观测的隐含变量.
1.Baum Welch算法用于训练HMM模型
训练HMM模型就是求解HMM模型三组参数的过程:1)初始时刻的概率分布π 2)相邻时刻状态的转移概率 p(y[t]| y[t-1]) 3) 观测值的生成概率 p(x[t] | y[t])
Baum Welch算法是采用了EM算法的推导框架,不断的迭代更新先验和后验概率,其具体的高效计算依赖于Forward Backward(前向后向)算法.
2.Forward Backward算法用于计算在时刻t处于某一状态y[t]的条件概率
P(y[t] | x[1],...,x[N]) = f(y[t]| x[1],...,x[t]) b(x[t+1],...,x[N] | y[t])
f和b分别是前向和后向向量.
3.Viterbi算法用于求解最大似然的状态序列
在HMM模型训练完成之后,就可以使用Viterbi算法对新的观察序列对应的最大似然的状态序列进行预测
1.Baum Welch算法用于训练HMM模型
训练HMM模型就是求解HMM模型三组参数的过程:1)初始时刻的概率分布π 2)相邻时刻状态的转移概率 p(y[t]| y[t-1]) 3) 观测值的生成概率 p(x[t] | y[t])
Baum Welch算法是采用了EM算法的推导框架,不断的迭代更新先验和后验概率,其具体的高效计算依赖于Forward Backward(前向后向)算法.
2.Forward Backward算法用于计算在时刻t处于某一状态y[t]的条件概率
P(y[t] | x[1],...,x[N]) = f(y[t]| x[1],...,x[t]) b(x[t+1],...,x[N] | y[t])
f和b分别是前向和后向向量.
3.Viterbi算法用于求解最大似然的状态序列
在HMM模型训练完成之后,就可以使用Viterbi算法对新的观察序列对应的最大似然的状态序列进行预测
看了HMM中的虚状态是怎么起作用的...的网友还看了以下:
下列同钠离子重吸收无关的是A醛固酮分泌增加B肾小管H离子分泌增加C血浆中K离子浓度增高D肾小管K离 2020-04-27 …
变限积分求道问题对函数f(t+h)-f(t-h)在[-h,h]上的积分对h求导.F(h)=∫[-h 2020-05-23 …
.直流电机磁路中的磁通分为()磁通和()磁通,其中()磁通参加机电能量的转换;其中()磁通参加机电 2020-06-03 …
OK了,选择A,先把分子上面的通分,然后罗比得法则,分子分母对h求导,直接得出来的式子就是h趋近无 2020-06-05 …
2,4-二硝基苯酚(DNP)能增加线粒体内膜对H+的通透性,从而消除线粒体内膜两侧的H+浓度差.若 2020-07-07 …
一辆汽车做匀加速直线运动,速度从10km/h加速到20km/h,再从20km/h加速到30km/h 2020-07-14 …
用一些词语造句匿笑祷告并蒂花瑞菡萏(hàndàn荷花的意思)倾斜慈怜荫蔽全部的词语造一个句子呀造的 2020-07-16 …
(9分)如图所示,一定质量的理想气体被水银柱封闭在竖直玻璃管内,气柱长度为h.现继续向管内缓慢地添加 2020-10-30 …
从A地向B地打长途电话,通话3分以内收费2.4元,3分后每增加通话时间1分加收1元,若通话时间为x( 2021-01-28 …
已知硫酸铜加热分解生成CuO、O2、SO2和SO3气体.通过测定产生的三种气体的量可确定该反应的方程 2021-02-01 …