隐马尔可夫模型在生物信息学中的应用
杜世平
隐马尔可夫模型(HMM)是一个能够通过可观测的数据很好地捕捉真实空间统计性质的随机模型,该模型已成功地运用于语音识别,目前HMM已开始应用于生物信息学(bioinformatics),已在生物序列分析中得到了广泛的应用.本文首先介绍了HMM的基本结构,然后着重讨论了HMM在DNA序列的多重比对,基因发现等生物序列分析中的应用。
基于隐马尔可夫模型的情感建模
王玉洁 王志良 陈锋军 王国江 王玉锋
根据隐马尔可夫模型HMM的基本理论和算法设计了一个情感模型。该模型用E-HMM构成:子层(即低层)HMM由3个HMM组成,分别对应3种心理情绪状态。外部刺激经过子层初步识别,其输出组成高级层HMM的观察向量,经过高层HMM,确定情感输出,从而提高了模型的准确性。
基于离散隐马尔可夫模型和奇异值特征的人脸检测
李士进 杨静宇 等
该文提基于离散隐马尔可夫模型(HMM)和奇异值特征的人脸检测方法。这一算法包含2部分工作,首先提出了基于离散隐马尔可夫模型和奇异值特征的正向端正人脸检测方法,然后将该算法扩展到检测任意旋转角度的人脸。扩展算法首先计算当前位置子图像窗口的奇异值特征,将该特征向量经过识别各个旋转角度人脸的HMM模型,得到该子图像窗口的旋转角度,再经过旋正,重新送到识别正面端正人脸的HMM模型,由此确定该子图像窗口是否为人脸,对一个由43幅集体照片组成的正面人脸图像集进行测试,共检测到484人中的425人,检测率为87。8%;而多角度旋转人脸图像检测率为75.1%,实验结果表明,该方法具有良好的检测性能。
基于多尺度隐马尔可夫模型的CR影像降噪方法研究
王波波 来忠信 等
在CR成像过程中不可避免的要引入各种干扰和噪声,只有弄清干扰图像信息的各种噪声来源、特征及其与信号的相互关系,才能有效地将之消除。在分析CR成像系统的基础上,文章指出影响CR图像质量的噪声主要是固有噪声和X线量子噪声,在统计规律上它们分别服从高斯分布和泊松分布。本文针对CR的固有噪声从小波系数的统计规律出发,根据固有噪声的特点,结合混合高斯模型描述小波系数的统计特征,采用两个状态的隐马尔可夫模型描述小波系数在尺度之间的相关性和依赖性,用最大期望值(EM)算法估计隐马尔可夫模型在各个尺度上的参数,然后按照尺度大小逐级对小波系数进行维纳滤波,最后是小波逆变换恢复图像。文章最后还给出了实验结果,并与其它降噪算法进行了比较。
混合隐马尔可夫模型Baum-Welch算法的改进
An Improved Baum-Welch Algorithm for Mixture of HMM
杜世平
介绍了任一时刻出现的观测矢量的概率不仅依赖于系统当前时刻所处的状态,而且依赖于系统前一时刻出现的观测矢量的前提下混合隐马尔可夫模型的结构.并研究了新模型的Baum-Welch算法,导出了该模型各个参数估计公式.
隐马尔可夫模型在语音识别中的应用
段红梅 汪军 等
隐马尔可夫模型(HMM)的基本技术是语音识别中较为成功的算法,主要是它具有较强的对时间序列结构的建模能力。本文首先深入浅出地介绍了HMM的基本技术和一个基于HMM的孤立词语音识别系统的构成方法,其次,基于HMM尚存有一些缺陷,造成语音识别能力较弱,为此本文又进一步阐述了语音识别应用中的几种改进的HMM系统及目前的热点方法-HMM与ANN构成的混合网络。
混合二阶隐马尔可夫模型的Baum-Welch算法
The Baum-Welch algorithm of mixture of HMM2
杜世平
介绍了在观测噪声和马尔可夫链不相互独立的条件下混合二阶隐马尔可夫模型(HMM2)的结构.然后,研究了新模型的Baum-Welch算法,并导出了新模型的参数估计公式.
基于序列拓扑和二阶隐马尔可夫模型的跨膜蛋白亚细胞定位预测
Subcellular Localization Prediction of Transmembrane Proteins Based on Sequence Topology and Second-order Hidden Markov Model
邹凌云 王正志 黄教民
现有蛋白质亚细胞定位方法针对水溶性蛋白质而设计,对跨膜蛋白并不适用。而专门的跨膜拓扑预测器,又不是为亚细胞定位而设计的。文章改进了跨膜拓扑预测器TMPHMMLoc的模型结构,设计了一个新的二阶隐马尔可夫模型;采用推广到二阶模型的Baum-Welch算法估计模型参数,并把将各个亚细胞位置建立的模型整合为一个预测器。数据集上测试结果表明,此方法性能显著优于针对可溶性蛋白设计的支持向量机方法和模糊k最邻近方法,也优于TMPHMMLoc中提出的隐马尔可夫模型方法,是一个有效的跨膜蛋白亚细胞定位预测方法。
语音识别中隐马尔可夫模型初值的估计
马明 张杰
隐马尔可夫模型初值选择是语音识别中一个至关重要的问题,通常的解决办法有两种,一是将参数的初值设置为均匀分布之值,另一种方法是采用“分段K平均法”,这两种方法可能在数收敛于局部最优解或使算法的计算量增大。为了解决以上问题,本文首先在一些特定条件下分析观察序列与HMM参数的关系,然后给出一般情况下HMM初值的估计方法。
隐马尔可夫模型在多序列比对中的应用
杜世平 李海
目前已获得了大量的生物序列和结构数据,传统研究生物序列的方法已面临挑战,生物学家已经转向能够处理大量数据的统计方法来研究。隐马尔可夫模型(HMM)是一个能够通过可观察的数据很好地捕捉真实空间统计性质的随机模型,该模型用于生物序列分析是生物信息学(Bioinformatics)研究的新领域。序列的多重比对是生物序列分析研究中的一个重要方法。文章首先介绍了HMM的基本结构,然后着重讨论了HMM在DNA序列之间的多重比对中的应用。