论文摘要
随着语音识别技术的进展,计算机辅助语言学习系统的日趋智能化。为了提升计算机辅助语言学习系统的性能,其中一项核心技术就是高性能的发音错误检测技术。基于发音错误检测技术,系统可以生成针对性的改进意见以及设计相应的训练语料来有效改进学习者的发音弱点,提高学习效率。本文在统计模式识别技术特别是统计语音识别技术的基础上,对发音错误的分布、形成及表现都进行了深入而细致的分析,并在分析的基础上开展了声学特征、声学模型、检错算法、以及声学模型空间等方面的深入研究,最终在实现了对发音错误检测问题本质的深入认识的同时,研发成功了高性能的普通话发音错误检测技术。本论文的具体研究工作和研究成果概述如下:首先,本论文在统计语音识别技术的基础上,对自动发音错误检测技术进行了改进。主要包括在声学特征方面引入CMN、VTLN等各种技术,解决声学模型和学习者声学特征之间的不匹配问题:同时,针对声学模型建模,引入语音识别中的基于BIC的模型压缩策略,首次提出并实现基于发音错误检测的BIC策略,此策略通过为发音错误严重或声学模型混淆严重的音素分配更多的参数来获得更好的建模精度从而提升检错系统性能;然后,针对声学模型与学习者的不匹配问题,引入语音识别领域中的较为成熟的自适应技术——MLLR——对模型均值进行了调整,大大降低了发音错误检错声学模型与学习者之间的不匹配,从而提升了检错系统的性能;接着,本文借鉴并改进了初始的后验概率策略,提出基于发音错误混淆列表的修正的后验概率策略来进行发音错误检测;最后,本文提出按照音素设置音素独立检错门限,取得了较好的检错性能。其次,本文提出以错误发音先验概率(Text-dependent Mispronunciation PriorProbability,TMPP)作为依托,重新形式化后验概率的表达形式,从而无缝地把发音错误先验概率这一信息融合到了后验概率的计算当中,这就是文本相关正确发音的后验概率策略(Text-dependent Correct Pronunciation Posterior Probability,TCPP)。同时,为了解决错误发音先验概率的0概率问题,借鉴语言模型训练方法,对0概率事件采取平滑操作。实验结果表明,TCPP策略能够达到甚至超过启发式的运用错误发音特性的检错策略,并且给出了一种利用发音错误先验概率的普适、有效的方法,同时这种策略能够弥补启发式方法的一些天然缺陷。因此基于TCPP的检错策略是在后验概率框架下的一种较好的发音错误解决方案。再次,本文通过调研语音识别中的置信度判别发现在置信度判别中通常有三种策略,后验概率只是其中的一种方法。还有一大类的方法是利用语音识别器得到的一些属性作为置信度判别的输入属性,建立分类器进行置信度判别。近年来的说话人识别研究表明,采用区分性的分类方法来解决检验问题是较好的策略。说话人识别中得到广泛运用的SVM区分性分类方法取得了很好的效果。本文从理论上分析了发音错误检测的特性,并指出后验概率对于发音错误检测的局限性,提出运用识别器输出的针对文本与模型空间内其它模型的似然比作为检错特征,从分类的角度来看到发音错误检测问题,引入SVM进行区分性分类器训练,从而有效地运用了人工标注数据信息以及识别器内的细节信息,最终有效的提升了发音错误检测性能。然后,本文从发音错误检测的角度出发,分析了以音素为单元的声学模型对发音错误检测的不足之处:这种声学模型仅能较好的处理某音素明确的发音错误成了另一音素,而对于发音偏误但没有明确的错误成另一个音素或者是发音缺陷这些问题并不能很好的处理。本文指出必须要对发音错误和正确的各种情况进行针对性的建模,然后利用这些模型进行错误检测才能够处理变化多端的发音错误。本文利用大量发音者实际数据(包括发音标准正确,发音有方言口音,发音口音严重等各种情况)通过无监督的方法进行数据聚类获得各种发音的数据,然后进行模型训练建立三套发音模型,分别针对发音标准正确,发音正常稍有口音,和发音口音严重这几种情况,然后利用上面提及的SVM分类方法进行发音错误检测,与传统的仅使用音素模型相比,实现了发音错误检测性能的显著提升。最后,本文针对调型进行了较深入的分析,针对不同人调域变化,提出最大似然基频均值规整方法:针对基频求取中出现的半频和倍频现象,利用最大似然特征选择策略进行规整。实验结果表明,采用了特征规整算法以后,调型发音错误检测取得了明显的性能提升。
论文目录
相关论文文献
- [1].普通话发音错误自动检测技术[J]. 中文信息学报 2010(02)
- [2].民族院校英语专业学生语流中元音发音错误分析[J]. 辽宁师专学报(社会科学版) 2009(04)
- [3].基于JSM和MLP改进发音错误检测的方法[J]. 自动化学报 2014(12)
- [4].浅析英语语音教学中的/n//l/发音错误[J]. 河南机电高等专科学校学报 2010(04)
- [5].基于GMM-UBM和GLDS-SVM的英文发音错误检测方法[J]. 自动化学报 2010(02)
- [6].英语口语自动评分系统中发音错误的研究[J]. 计算机应用与软件 2013(06)
- [7].汉语普通话声调发音错误检测[J]. 清华大学学报(自然科学版) 2008(S1)
- [8].基于深层神经网络的英语口语发音错误捕捉方法研究[J]. 黑龙江工业学院学报(综合版) 2020(08)
- [9].中国学生英语元音发音错误分析[J]. 楚雄师范学院学报 2012(10)
- [10].结合高斯混合模型和VOT特征的音素发音错误检测[J]. 科学技术与工程 2013(07)
- [11].发音错误检测中基于多数据流的Tandem特征方法[J]. 计算机应用 2014(06)
- [12].一种基于检错音网络的发音错误检测新算法[J]. 电子与信息学报 2012(09)
- [13].人工耳蜗植入儿童汉语声母发音错误规律探究[J]. 听力学及言语疾病杂志 2017(01)
- [14].英语发音自动评测中单词删除错误的检测方法[J]. 电声技术 2009(11)
- [15].英语口语测试系统发音错误智能检测技术研究[J]. 自动化与仪器仪表 2018(12)
- [16].基于优化检测网络和MLP特征改进发音错误检测的方法[J]. 清华大学学报(自然科学版) 2012(04)
- [17].基于声学元音图的大学生英语语音错误的分析[J]. 广西师范学院学报(哲学社会科学版) 2011(04)
- [18].骨性Ⅲ类患者发音错误与颅面组织结构的相关性[J]. 北京口腔医学 2011(06)
- [19].发音错误检错中声学模型训练准则的比较研究[J]. 新疆大学学报(自然科学版) 2013(02)
- [20].那些年,我们总是发错的音——纠正发音错误,练就地道美语[J]. 新东方英语(大学版) 2016(08)
- [21].中国学生常犯俄语发音错误分析[J]. 俄语学习 2009(04)
- [22].锤炼语言 点亮思维火花[J]. 数学大世界(中旬) 2019(09)
- [23].自动发音错误检测中基于F_1值最大化的声学模型训练方法[J]. 声学学报 2013(06)
- [24].非英语专业大学生元音发音存在四种规律性的错误——基于某高校非英语专业学生英语元音产出质量的调查研究[J]. 西华大学学报(哲学社会科学版) 2012(05)
- [25].错误识别系统的设计[J]. 大众商务 2009(18)