一种发音纠正辅助系统技术方案

技术编号:38258186 阅读:14 留言:0更新日期:2023-07-27 10:20
本发明专利技术公开了一种发音纠正辅助系统,包括语音识别系统部分与评判系统部分,语音识别系统部分包括知识库部分、特征提取部分、解码器部分与发音输入部分,其中知识库部分包括语音模型部分、字典部分、声学模型部分与网络搜索部分,发音输入部包括学习者语音部分、TIMIT标准语音部分与TIMIT语料库部分,评判系统部分包括音素评分部分、错误判断部分、标准评分部分、平均发音水平部分、纠正意见数据库部分与反馈意见部分。本发明专利技术通过听取录入学习者的读音,经从语音识别系统部分进行单词错误识别后再通过评判系统进行发音评判,当学习者发音的稳定性区间超过判断值则判定学习者在该音素上发音有错误,而后可对学习者进行提醒以纠正。正。

【技术实现步骤摘要】
一种发音纠正辅助系统


[0001]本专利技术涉及发音纠正辅助
,尤其涉及一种发音纠正辅助系统。

技术介绍

[0002]在英语口语中,发音是评判口语好坏的重要标准,如果一个人英语口语很流利,但是确伴随着本地口音来发音,这样的话听到的人也不会觉得这个人的口语好,为此口语好的人也需要对发音进行训练纠正,目前,在发音质量评价上,提出了各种评分算法,但是这些算法产生的评分性能在发音错误检测及反馈信息的实现上,现有的系统只是简单地将音素识别结果和标准语音的音素关联结果相比较,简单地获得发音评分及相应的错误反馈信息。为此,我们提出一种发音纠正辅助系统来解决上述问题。

技术实现思路

[0003]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种发音纠正辅助系统。
[0004]为了实现上述目的,本专利技术采用了如下技术方案:
[0005]一种发音纠正辅助系统,包括语音识别系统部分与评判系统部分,所述语音识别系统部分包括知识库部分、特征提取部分、解码器部分与发音输入部分,其中所述知识库部分包括语音模型部分、字典部分、声学模型部分与网络搜索部分,所述发音输入部包括学习者语音部分、TIMIT标准语音部分与TIMIT语料库部分,所述评判系统部分包括音素评分部分、错误判断部分、标准评分部分、平均发音水平部分、纠正意见数据库部分与反馈意见部分。
[0006]优选的,所述语音模型部分、字典部分、声学模型部分的输出方向连于网络搜索部分的输入方向,所述网络搜索部分的输出方向连于解码器部分的输入方向
[0007]优选的,所述学习者语音部分、TIMIT标准语音部分与TIMIT语料库部分的输出方向连于特征提取部分的输入方向,特征提取部分的输出方向连于解码器部分的输入方向。
[0008]优选的,所述解码器部分的输出方向分别连于音素评分部分、标准评分部分与平均发音水平部分的输入方向。
[0009]优选的,所述音素评分部分的的输出方向连于错误判断部分的输入方向,所述错误判断部分与纠正意见数据库部分的输出方向连于反馈意见部分的输入方向。
[0010]优选的,其中评判系统为自动评分系统:已知待评分语音的一组观察序列O=(O1,O2,

,O
N
),模型中多组状态序列S=(S1,S2,

,S
N
),以及sphinx

4提供的众多标准参考模型φ,那么模型φ产生观察序列0的概率为P(O|
φ
),并在Decoder的解码过程中,运用Viterbi算法,将音素对齐后,选择最可能与观察序列O对应的状态序列S,输出最优概率P(O|
φ
),这时便可通过这个最优概率算出后验概P(O|
φ
),由此计算得到基于HMM模型的对数后验概率评分;
[0011]在与音素q
n
相关的第n段语音中,每一帧的观察序列为q
n
,则基于帧的后验概率见
式一:系统最终输出的对数后验概率发音评分结果见如下式二:
[0012][0013]优选的,平均发音水平部分作为评判系统的评判参考标准,参照下式三:
[0014]根据该式子统计出所选TIMIT语料库2342句语音所包含的音素平均发音水平
[0015]优选的,错误判断部分:假设所选TIMIT语料库语音文本的40个音素中第i个音素在第j句TIMIT语音中所得评分P
ij
与该音素的平均发音水平的差值为d
ij
,则音素i在第j句话中的评分与该音素的平均发音水平的差值平均值见式四:
[0016]上式四中,c为音素i在第j句话中的评分个数,从而可知音素i与标准平均水平的平均差值D
i
,该平均差值D
i
可错误判断值,该判断值可以作为学习者发音的稳定性区间,当超过这个判断值则判定学习者在该音素上发音有错误,可得如下公式:
[0017]式五
[0018]式六th
i
=D
i
[0019]式七
[0020]优选的,音素评分部分,即对音素中的错误进行检测与判定,包括以下步骤,第一步、比较学习者音素平分P
i
和相应的TIMIT标准语音的音素评分的差别;
[0021]第二步、当两者差直较大时,不能轻易认定是错读音素,还需将音素评分与平均发音水平进行比较;
[0022]第三步、当两者差距也超过该因素的判断值D
i
范围时,才可认定为错误发音,这样可以在一定程度上降低因某种原因所引起的误判,之后再根据差值的大小给予相应的反贵错误判定和信息反馈,具体提示方法如下:
[0023]式八d
i
=|SP
i

ST
i
|
[0024]式九式九
[0025]根据式八与式九,当d
i
≤50000时,判定发音较为准确,给予正确提示;当50000<d
i
≤D
i
时,系统不做任何判定提示;
[0026]当d
i
>D
i
时,系统判定发音不够准确,给予正确的纠正意见,而漏读和添加音素的错误,只需比较学习者发音和标准语音的语音强制对齐结果便可获知。
[0027]优选的,正确率和误判率来作为衡量错误检测的指标,定义如下:音素P
i
在语音文本中的总个数为g,其中真正发音错误的有M个,通过与标准语言比较后系统检测出m个,而因超过默认判定值后,又通过平均水平的比较,发现者m个错误中又有n个是正确发音,则正
确率=(g

m+n)/g
×
100%,误判率=n/m
×
100%,当误判率发生变化,正确率也随之发生较大变化。
[0028]与现有技术相比,本专利技术的有益效果为:
[0029]本专利技术通过使用平均水平作为参考后,判断值发生相应改变,系统的错误判定准确率提升,使得判断的正确率与反馈信息的可靠性皆有所提高,并且由于学习者语音首先与标准语音进行比较,在产生较大差距时才会使用平均水平作比较,从而保证了在不出现发音错误的情况下,让学习者语音在发音水平上无限接近标准语音,完成对学习者进行发音纠正。
具体实施方式
[0030]下面将结合对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0031]实施例一
[0032]一种发音纠正辅助系统,包括语音识别系统部分与评判系统部分,语音识别系统部分包括知识库部分、特征提取部分、解码器部分与发音输入部分,其中知识库部分包括语音模型部分、字典部分、声学模型部分与网络搜索部分,发音输入部包括学习者语音部分、TIMIT标准语音部分与TIMIT语料库部分,评判系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种发音纠正辅助系统,其特征在于,包括语音识别系统部分与评判系统部分,所述语音识别系统部分包括知识库部分、特征提取部分、解码器部分与发音输入部分,其中所述知识库部分包括语音模型部分、字典部分、声学模型部分与网络搜索部分,所述发音输入部包括学习者语音部分、TIMIT标准语音部分与TIMIT语料库部分,所述评判系统部分包括音素评分部分、错误判断部分、标准评分部分、平均发音水平部分、纠正意见数据库部分与反馈意见部分。2.根据权利要求1所述的一种发音纠正辅助系统,其特征在于,所述语音模型部分、字典部分、声学模型部分的输出方向连于网络搜索部分的输入方向,所述网络搜索部分的输出方向连于解码器部分的输入方向。3.根据权利要求1所述的一种发音纠正辅助系统,其特征在于,所述学习者语音部分、TIMIT标准语音部分与TIMIT语料库部分的输出方向连于特征提取部分的输入方向,特征提取部分的输出方向连于解码器部分的输入方向。4.根据权利要求1所述的一种发音纠正辅助系统,其特征在于,所述解码器部分的输出方向分别连于音素评分部分、标准评分部分与平均发音水平部分的输入方向。5.根据权利要求1所述的一种发音纠正辅助系统,其特征在于,所述音素评分部分的的输出方向连于错误判断部分的输入方向,所述错误判断部分与纠正意见数据库部分的输出方向连于反馈意见部分的输入方向。6.根据权利要求1所述的一种发音纠正辅助系统,其特征在于,其中评判系统为自动评分系统:已知待评分语音的一组观察序列O=(O1,O2,

,O
N
),模型中多组状态序列S=(S1,S2,

,S
N
),以及sphinx

4提供的众多标准参考模型Φ,那么模型Φ产生观察序列0的概率为P(O

Φ),并在Decoder的解码过程中,运用Viterbi算法,将音素对齐后,选择最可能与观察序列O对应的状态序列S,输出最优概率P(O

Φ),这时便可通过这个最优概率算出后验概P(O

...

【专利技术属性】
技术研发人员:何文娟
申请(专利权)人:衡阳师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1