发音指导方法技术

技术编号:3044961 阅读:197 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种发音指导方法,包括建立标准和非标准语音库;对非标准语音库中的各音素以及语音片段提供发音评价标注和语音评分标注;通过标准和非标准语音库获得非标准语音库中各音素的第一声学后验概率和音素检错阀值以及各语音片段的第一语音特征与语音评分标注之间的映射模型;获取用户发音,并根据该发音获得其各音素的第二声学后验概率以及语音片段的第二语音特征;根据该第二声学后验概率与该音素检错阀值的比较以及该第二语音特征与第一语音特征与语音评分间映射模型进行匹配,向该用户提供对其发音各音素的发音评价标注的评价内容以及语音片段的语音评分标注,让用户得知其发音中各个音素的发音是否标准以及发音中各语音片段的标准程度。

【技术实现步骤摘要】

本专利技术涉及一种,特别是一种用于语言学习的。
技术介绍
目前,在现有技术中已经存在多种语言教学软件,以及多项涉及语言学 习系统、方法的专利等。例如,2006年3月16日公开的美国专利申请(公开号为US 2006/0057545 Al )揭示了一种发音训练方法及系统。该方法及系统通过将用户输入的语音 与预先设定在系统中的标准语音进行比较,得出该用户的发音是否标准的结 论,当回放该用户语音时同时将每个片段的发音质量显示给用户,从而指导 该用户发音。2007年3月8日公开的美国专利申请(公开号为US 2007/0055523 Al ) 揭示了一种发音训练系统,这种系统是通过帮助用户注意到其发音器官及其 肌肉运动,并了解到正确发音与肌肉运动之间的相应关系,使用户了解到其 发音应如何进行纠正,从而指导用户进行正确发音。
技术实现思路
本专利技术的一个专利技术目的在于提供一种新的,该方法能够让 用户得知其发音中各个音素的发音是否标准。本专利技术的另一个专利技术目的在于提供一种新的,该方法能够 让用户得知其发音中各语音片段的标准程度。为了实现上述专利技术目的,本专利技术提供一种,所述方法包 括如下步骤建立标准语音库和非标准语音库;对所述非标准语音库中的各音素进行发音评价标注;根据所述标准语音库和所述非标准语音库分别建立标准发音模型和非标准发音模型;基于所述标准发音模型和所述非标准发音模型,以及所述非标准语 音库的音素发音评价标注,针对每个非标准发音人分别建立其对应的第 一正确发音模型和第 一错误发音模型;根据所述第一正确发音模型、所述第一错误发音模型以及所述非标 准语音库中音素的语音片段来获得该语音片段中的该音素的第一声学后 验概率;根据所述发音评价标注以及所述非标准语音库中各音素的第 一声学 后验概率,训练得到所述非标准语音库中各音素的音素检错阀值; 获取用户基于第一发音材料的发音;根据所述第 一正确发音模型和所述第 一错误发音模型中的至少 一个 正确发音模型和错误发音模型以及该发音的音素所在的语音片段,来获 得在所述语音片段中该音素的第二声学后验概率;将所述发音中的各音素的第二声学后验概率与该音素对应的音素检 错阀值相比较;根据所述比较结果,确定所述发音中的各音素对应在所述发音评价 标注中的评价内容;将所述发音中的各音素的评价内容提供给该用户。与现有技术相比,本专利技术通过引入非标准语音库,并对所述非标准 语音库中的各音素提供发音评价标注,通过该非标准语音库与标准语音库分别建立第一正确发音模型和第一错误发音模型;然后,根据所述第 一正确发音模型、所述第一错误发音模型以及所述非标准语音库中音素 的语音片段来获得该语音片段中的该音素的第 一声学后验概率;根据所 述发音评价标注以及所述非标准语音库中各音素的第一声学后验概率, 训练得到所述非标准语音库中各音素的音素检错阅值;在判断时,先获 取用户基于第一发音材料的发音;根据所述第一正确发音模型和所述第 一错误发音模型中的至少 一个正确发音模型和错误发音模型以及该发音 的音素所在的语音片段,来获得在所述语音片段中该音素的第二声学后 验概率;最后将所述发音中的各音素的第二声学后验概率与该音素对应 的音素检错阀值相比较;根据所述比较结果,确定所述发音中的各音素 对应在所述发音评价标注中的评价内容;将所述发音中的各音素的评价 内容提供给该用户,因此该用户可获知其发音中各音素的评价内容,从 而实现让该用户得知其发音中各个音素的发音是否标准。同时本专利技术提 出了基于用户的语音数据进行第二声学后验概率的计算方法,有效实现 了发音指导系统针对该用户的优化,提高了发音指导的准确性。本专利技术提供另一种,所述方法包括如下步骤建立标准语音库和非标准语音库;对所述非标准语音库中的语音片段进行语音评分标注,并对所述非 标准语音库的音素进行发音评价标注;根据所述标准语音库和所述非标准语音库分别建立标准发音模型和 非标准发音模型;根据所述标准发音模型和所述非标准发音模型分别建立第一正确发 音模型和第 一错误发音模型;根据所述第一正确发音模型、所述第一错误发音模型以及所述非标 准语音库中音素所在的语音片段来获得在所述语音片段中该音素的第一 声学后验概率;根据该语音片段中各音素的第一声学后验概率,获取该语音片段的 第一语音特征;将各语音片段的第一语音特征与所述语音评分标注之间建立映射; 获取用户基于第 一发音材料的发音;根据所述第一正确发音模型和所述第一错误发音模型中的至少一个 正确发音模型和错误发音模型以及该发音的音素所在的语音片段,来获 得在所述发音的语音片段中该音素的第二声学后验概率;根据所述发音的语音片段中各音素的第二声学后验概率,获取所述 发音的语音片段的第二语音特征;将与所述第二语音特征匹配的第 一语音特征映射对应的语音评分标 注提供给该用户。与现有技术相比,本专利技术通过引入非标准语音库,并对所述非标准 语音库中的语音片段提供语音评分标注,通过该非标准语音库与标准语音库分别建立第一正确发音模型和第一错误发音模型;然后根据所述第 一正确发音模型、所述第一错误发音模型以及所述非标准语音库中音素 所在的语音片段来获得在所述语音片段中该音素的第一声学后验概率; 根据该语音片段中各音素的第 一声学后验概率,获取该语音片段的第一 语音特征;将各语音片段的第一语音特征与所述语音评分标注之间建立 映射;在评价时,获取用户基于第一发音材料的发音;根据所述第一正 确发音模型和所述第一错误发音模型中的至少一个正确发音模型和错误 发音模型以及该发音的音素所在的语音片段,来获得在所述发音的语音 片段中该音素的第二声学后验概率;根据所述发音的语音片段中各音素 的第二声学后验概率,获取所述发音的语音片段的第二语音特征;最后 将与所述第二语音特征匹配的第 一语音特征映射对应的语音评分标注提 供给该用户,从而让该用户得知其发音中各语音片段的标准程度。作为对以上方法的进一步改进,所述第一发音材料为该用户任意选 取的发音材料。借此,该用户可任意选择发音材料,避免系统提供发音 材料有限的缺陷,而且用户可根据自己偏好来选择发音材料,也可让该 用户练习适合自己的发音材料,可有效提高学习的兴趣。作为对以上方法的进一步改进,根据所述用户的发音中的各音素的 发音正确和错误信息,建立第二正确发音模型和第二错误发音模型;然 后将所述第二正确发音模型和第二错误发音模型分别替换所述至少一个 正确发音模型和错误发音模型。这样该正确发音模型和错误发音模型可 随该用户的发音水平的提高而不断更新,实现了发音指导系统针对该用 户的优化,这样也扩大正确发音模型和错误发音模型的来源,而且可让 该用户可根据发音练习的历史记录来自我提高指导。附图说明图1是构建本专利技术实施例的发音标准程度评测模型的流程 示意图。图2是^f吏用本专利技术实施例的流程示意图。 具体实施例方式本专利技术主要用于对语言学习者的发音进行指导,特别是普 通话或第二外语,如英语等,该方法能够让用户得知其发音中各个音素的发音是否标准,并可评价其发音中各个语音片段的标准程度,从而来有效指导 该用户发音。为了实现该,需要构建发音标准程度评测模型,为评价 用户发音的建立平台。具体来讲,如图l所示,在开始构建该发音标准程度评测模型时,可 先本文档来自技高网...

【技术保护点】
一种发音指导方法,其特征在于:所述方法包括如下步骤:    建立标准语音库和非标准语音库;    对所述非标准语音库中的各音素进行发音评价标注;    根据所述标准语音库和所述非标准语音库分别建立标准发音模型和非标准发音模型;    基于所述标准发音模型和所述非标准发音模型,以及所述非标准语音库的音素发音评价标注,针对每个非标准发音人分别建立其对应的第一正确发音模型和第一错误发音模型;    根据所述第一正确发音模型、所述第一错误发音模型以及所述非标准语音库中音素的语音片段来获得该语音片段中的该音素的第一声学后验概率;    根据所述发音评价标注以及所述非标准语音库中各音素的第一声学后验概率,训练得到所述非标准语音库中各音素的音素检错阀值;    获取用户基于第一发音材料的发音;    根据所述第一正确发音模型和所述第一错误发音模型中的至少一个正确发音模型和错误发音模型以及该用户发音的音素所在的语音片段,来获得在所述语音片段中该音素的第二声学后验概率;    将所述发音中的各音素的第二声学后验概率与该音素对应的音素检错阀值相比较;    根据所述比较结果,确定所述发音中的各音素对应在所述发音评价标注中的评价内容;    将所述发音中的各音素的评价内容提供给该用户。...

【技术特征摘要】
1、一种发音指导方法,其特征在于所述方法包括如下步骤建立标准语音库和非标准语音库;对所述非标准语音库中的各音素进行发音评价标注;根据所述标准语音库和所述非标准语音库分别建立标准发音模型和非标准发音模型;基于所述标准发音模型和所述非标准发音模型,以及所述非标准语音库的音素发音评价标注,针对每个非标准发音人分别建立其对应的第一正确发音模型和第一错误发音模型;根据所述第一正确发音模型、所述第一错误发音模型以及所述非标准语音库中音素的语音片段来获得该语音片段中的该音素的第一声学后验概率;根据所述发音评价标注以及所述非标准语音库中各音素的第一声学后验概率,训练得到所述非标准语音库中各音素的音素检错阀值;获取用户基于第一发音材料的发音;根据所述第一正确发音模型和所述第一错误发音模型中的至少一个正确发音模型和错误发音模型以及该用户发音的音素所在的语音片段,来获得在所述语音片段中该音素的第二声学后验概率;将所述发音中的各音素的第二声学后验概率与该音素对应的音素检错阀值相比较;根据所述比较结果,确定所述发音中的各音素对应在所述发音评价标注中的评价内容;将所述发音中的各音素的评价内容提供给该用户。2、 根据权利要求1所述的发音指导方法,其特征在于,所述发音评 价标注的评价内容包括发音正确和发音错误,当所述发音中的音素的第 二声学后验概率不小于该音素对应的音素检错阀值时,所述发音中的音 素的评价内容为发音正确,当所述发音中的音素的第二声学后验概率小 于该音素对应的音素检错阀值时,所述发音中的音素的评价内容为发音 错误。3、 根据权利要求2所述的发音指导方法,其特征在于,所述评价内 容在所述发音中的音素的第二声学后验概率小于该音素对应的音素检错 阀值时还包括对所述发音中的音素的纠正、指导信息。4、 一种发音指导方法,其特征在于所述方法包括如下步骤 建立标准语音库和非标准语音库;对所述非标准语音库中的语音片段进行语音评分标注,并对所述非 标准语音库中的各音素进行发音评价标注;根据所述标准语音库和所述非标准语音库分别建立标准发音模型和 非标准发音模型;基于所述标准发音模型和所述非标准发音模型,以及所述非标准语 音库的音素发音评价标注,针对每个非标准发音人分别建立其对应的第 一正确发音模型和第一错误发音模型;根据所述第一正确发音模型、所述第一错误发音模型以及所述非标 准语音库中音素所在的语音片段来获得在所述语音片段中该音素的第一 声学后验概率;根据该语音片段中各音素的第 一声学后验概率,获取该语音片段的 第一语音特征;将各语音片段的第一语音特征与所述语音评分标注之间建立映射; 获取用户基于第 一发音材料的发音;根据所述第一正确发音模型和所述第一错误发音模型中的至少一个 正确发音模型和错误发音模型以及该发音的音素所在的语音片段,来获 得在所述发音的语音片段中该音素的第二声学后验概率;根据所述发音的语音片段中各音素的第二声学后验概率,获取所述 发音的语音片段的第二语音特征;将与所述第二语音特征匹配的第 一语音特征映射对应的语音评分标 注提供给该用户。5、 根据权利要求4所述的发音指导方法,其特征在于,所述映射为 线性映射,所述第一语音特征包括与其对应的语音片段中音素的最高、 平均和最低的第 一声学后验概率;所述第二语音特征包括与其对应的语 音片段中音素的最高、平均和最低的第二声学后验概率。6、 根据权利要求4所述的发音指导方法,其特征在于,该方法还包括对所述非标准语音库中的各音素提供发音评价标注; 根据所述发音评价标注以及所...

【专利技术属性】
技术研发人员:魏思胡国平易中华刘庆升胡郁吴晓如刘庆峰王仁华
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:34[中国|安徽]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利