一种数据处理方法、装置和用于数据处理的装置制造方法及图纸

技术编号：25552233 阅读：21 留言：0更新日期：2020-09-08 18:52

本发明专利技术实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括：获取用户针对预置文本发音的语音数据、以及所述预置文本对应的音素序列；根据预置声学模型，确定所述语音数据中的语音帧与所述音素序列中的音素之间的匹配度；其中，所述预置声学模型为根据至少两种语言类型的音素数据、以及所述至少两种语言类型的训练数据训练得到；若确定存在小于预设值的匹配度，则输出纠错信息。本发明专利技术实施例可以提高用户学习外语口语的发音准确率和效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置和用于数据处理的装置
本专利技术涉及计算机
，尤其涉及一种数据处理方法、装置和用于数据处理的装置。
技术介绍
随着经济全球化的不断发展，外语学习得到更多的重视。目前市面上出现了很多口语评测类的电子产品(如点读机、学习电脑)以及移动终端上的口语评测类应用等，可以帮助用户纠正口语发音。然而，对于地方口音较重的用户，在外语学习过程中容易受到母语发音的影响，带有各种地方口音。例如，对于湖南人、福建人、广东人，受地方口音的影响，母语发音会出现平翘舌不分，前后鼻音不分的问题，此类用户在学习外语的过程中，会将母语中的不标准发音带入外语发音中，导致外语发音也不标准。目前的口语评测方法，无法识别用户发音中由于地方口音导致的错误发音，而此类用户的听辨能力对母语中地方口音导致的错误发音则不敏感，难以识别以及纠正自己的错误发音，导致用户学习外语口语的发音准确率和效率较低。
技术实现思路
本专利技术实施例提供一种数据处理方法、装置和用于数据处理的装置，可以提高用户学习外语口语的发音准确率和效率。为了解决上述问题，本专利技术实施例公开了一种数据处理方法，所述方法包括：获取用户针对预置文本发音的语音数据、以及所述预置文本对应的音素序列；根据预置声学模型，确定所述语音数据中的语音帧与所述音素序列中的音素之间的匹配度；其中，所述预置声学模型为根据至少两种语言类型的音素数据、以及所述至少两种语言类型的训练数据训练得到；若确定存在小于预设值的匹配度，则输出纠错...

【技术保护点】
1.一种数据处理方法，其特征在于，所述方法包括：/n获取用户针对预置文本发音的语音数据、以及所述预置文本对应的音素序列；/n根据预置声学模型，确定所述语音数据中的语音帧与所述音素序列中的音素之间的匹配度；其中，所述预置声学模型为根据至少两种语言类型的音素数据、以及所述至少两种语言类型的训练数据训练得到；/n若确定存在小于预设值的匹配度，则输出纠错信息。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：
获取用户针对预置文本发音的语音数据、以及所述预置文本对应的音素序列；
根据预置声学模型，确定所述语音数据中的语音帧与所述音素序列中的音素之间的匹配度；其中，所述预置声学模型为根据至少两种语言类型的音素数据、以及所述至少两种语言类型的训练数据训练得到；
若确定存在小于预设值的匹配度，则输出纠错信息。

2.根据权利要求1所述的方法，其特征在于，所述根据预置声学模型，确定所述语音数据中的语音帧与所述音素序列中的音素之间的匹配度，包括：
确定所述预置文本对应的音素序列；
根据所述预置声学模型以及所述预置文本构成的解码网络，对所述语音数据中语音帧对应的特征向量与所述音素序列中的音素进行对齐；
根据对齐后的特征向量与对应音素之间的似然度，确定所述语音数据中的语音帧与所述音素序列中的音素之间的匹配度。

3.根据权利要求2所述的方法，其特征在于，在确定存在小于预设值的匹配度之后，所述方法还包括：
将所述匹配度小于预设值的音素作为目标音素；
在所述至少两种语言类型的音素数据中，确定所述目标音素对应的易混淆音素；
输出所述易混淆音素。

4.根据权利要求3所述的方法，其特征在于，在确定所述目标音素对应的易混淆音素之后，所述方法还包括：
将所述音素序列中的目标音素替换为所述易混淆音素；
对替换后的音素序列中，所述易混淆音素对应的上下文三音子进行解码，以得到所述易混淆音素对应的似然度；
确定似然度最大的易混淆音素为所述语音数据中的错误音素。

5.根据权利要求1所述的方法，其特征在于，通过如下步骤训练所述预置声学模型：
对至少两种语言类型的音素数据进行标注；其中，不同语言类型中发音相同或满足近似条件的音素数据使用相同的标注符号，以及不同语言类型中发音不同的音素数据使用不同的标...

【专利技术属性】
技术研发人员：林国雯，赵超，
申请(专利权)人：北京搜狗科技发展有限公司，搜狗杭州智能科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人