一种多音字消歧方法、装置、电子设备和存储介质制造方法及图纸

技术编号：29527308 阅读：43 留言：0更新日期：2021-08-03 15:13

本发明专利技术涉及一种多音字消歧方法、装置、电子设备和存储介质，该方法包括：通过获取多个文本和多个文本对应的音频；训练多个文本和文本对应的音频得到声学模型；将待确定拼音的文本的字序列输入到声学模型中得到第一拼音序列；对第一拼音序列进行降噪得到第二拼音序列，第二拼音序列中包括待确定拼音的文本的拼音。本申请通过训练多个文本和文本对应的音频得到声学模型，将待确定拼音的文本的字序列输入到声学模型中得到第一拼音序列，上述得到第一拼音序列的步骤，只能机械依赖声学模型，存在一定的噪声，得到的第一拼音序列鲁棒性低，本申请对第一拼音序列进行降噪处理得到第二拼音序列，从而确定拼音，提高了待确定文本对应的拼音序列的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种多音字消歧方法、装置、电子设备和存储介质
本专利技术涉及多音字
，具体涉及一种多音字消歧方法、装置、电子设备和存储介质。
技术介绍
目前，多音字消歧一般有两种方法：一是基于语法规则方法，由语言专家总结出多音字发音规则，再将这些规则制作成一个计算机可以理解的知识库。计算机会根据规则逐条进行条件匹配，来判决多音字的拼音。二是基于数据驱动方法，人工制作充足的带拼音的文本数据，然后利用该数据训练多音字消歧模型。模型训练一般分为两种方法：一是传统机器学习方法，例如决策树，条件随机场等；二是深度学习方法。上述方法一依赖语言专家先验知识，另外当多音字发音规则增加时，极易产生规则冲突。上述方法二依赖人工精标多音字数据，其中传统机器学习方法还依赖所选取的语法特征，例如分词和词性等；深度学习方法虽然对特征选取要求不高，但是对数据量规模要求较高。上述两种方法对不平衡分布多音字消歧性能一般，不平衡分布多音字是指某个多音字，某种常见的发音占95％以上，导致该多音字另一种发音的数据缺乏。
技术实现思路
本专利技术提...

【技术保护点】
1.一种多音字消歧方法，其特征在于，包括：/n获取多个文本和所述多个文本对应的音频；/n训练所述多个文本和文本对应的音频得到声学模型；/n将所述待确定拼音的文本的字序列输入到所述声学模型中得到第一拼音序列；/n对所述第一拼音序列进行降噪得到第二拼音序列，所述第二拼音序列中包括待确定拼音的文本的拼音。/n

【技术特征摘要】
1.一种多音字消歧方法，其特征在于，包括：
获取多个文本和所述多个文本对应的音频；
训练所述多个文本和文本对应的音频得到声学模型；
将所述待确定拼音的文本的字序列输入到所述声学模型中得到第一拼音序列；
对所述第一拼音序列进行降噪得到第二拼音序列，所述第二拼音序列中包括待确定拼音的文本的拼音。

2.根据权利要求1所述的多音字消歧方法，其特征在于，所述对所述第一拼音序列进行降噪得到第二拼音序列，包括：
训练拼音语言模型；
根据所述拼音语言模型对所述第一拼音序列进行重排列得到第二拼音序列；
所述第二拼音序列中概率最高的序列是待确定拼音的文本的拼音。

3.根据权利要求2所述的多音字消歧方法，其特征在于，所述训练拼音语言模型，包括：
获取多个拼音序列；
训练所述多个序列得到所述拼音语言模型。

4.根据权利要求3所述的多音字消歧方法，其特征在于，训练所述拼音语言模型采用Transformer网络结构。
采用训练所述多个拼音序列得到拼音语言模型。

5.一种多音字消歧装置，其特征在于，包括：
获取模块：用于获取多个文本和所述多个文本对应的音频；
训练模块：用于训练所述多个文本和文本对应的...

【专利技术属性】
技术研发人员：吴朗，孙见青，梁家恩，
申请(专利权)人：云知声智能科技股份有限公司，厦门云知芯智能科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人