字音转换方法、装置及系统制造方法及图纸

技术编号：37501745 阅读：23 留言：0更新日期：2023-05-07 09:37

本公开实施例涉及一种字音转换方法、装置及系统，该方法包括：获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数，以及与每一个字母对应的映射音素集；对每一个字母分别进行复制，构成字母组合，并生成与字母组合中每一个字母对应的位置数据；根据每一个字母组合，以及每一个位置数据，生成融合特征；利用至少两种神经网络系统对融合特征进行特征学习，获取音素集，以及音素集中每一个音素对应的概率；根据每一个词汇、每一个字母分别对应的音素集、音素集中每一个音素对应的概率，以及每一个字母对应的映射音素集，预测待测试词汇集中每一个词汇分别对应的目标音素集。通过该方法，字音转换的准确率大大提高。大提高。大提高。

全部详细技术资料下载

【技术实现步骤摘要】
字音转换方法、装置及系统

[0001]本公开实施例涉及计算机
，尤其涉及一种字音转换方法、装置及系统。

技术介绍

[0002]字音转换的目标是预测目标单词的发音。该技术在语音合成，以及语音识别等领域都有广泛的引用。目前，实现字音转换的方法例如传统基于规则的转写方案。该方案因为需要借助大量的专家知识来辅助设计，导致预测的精度差，效率低。而且，所需的人工成本和经济成本也比较高。

技术实现思路

[0003]本公开提供了一种字音转换方法、装置及系统，以解决现有技术中部分或全部技术问题。
[0004]第一方面，本公开提供了一种字音转换方法，包括：
[0005]获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数，以及与每一个字母对应的映射音素集；
[0006]依次对每一个词汇包括的每一个字母分别进行复制，构成字母组合，并生成与字母组合中每一个字母分别对应的位置数据；
[0007]根据待测试词汇集中每一个词汇对应的字母组合，以及每一个字母分别对应的位置数据，生成融合特征，融合特征用以表征每一个字母组合中字母之间的第一关联关系，以及字母组合中不同字母分别对应的位置数据之间的第二关联关系；
[0008]利用至少两种神经网络系统对融合特征进行特征学习，获取用以表征每一个字母组合中的字母分别对应的音素集，以及音素集中每一个音素对应的概率；
[0009]根据待测试词汇集中每一个词汇、每一个字母分别对应的音素集、音素集中每一个音素对应的概率，以及每一个字...

【技术保护点】

【技术特征摘要】
1.一种字音转换方法，其特征在于，所述方法包括：获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数，以及与每一个字母对应的映射音素集；依次对每一个词汇包括的每一个字母分别进行复制，构成字母组合，并生成与字母组合中每一个字母分别对应的位置数据；根据所述待测试词汇集中每一个词汇对应的字母组合，以及每一个字母分别对应的位置数据，生成融合特征，所述融合特征用以表征每一个字母组合中字母之间的第一关联关系，以及所述字母组合中不同字母分别对应的位置数据之间的第二关联关系；利用至少两种神经网络系统对所述融合特征进行特征学习，获取用以表征每一个字母组合中的字母分别对应的音素集，以及所述音素集中每一个音素对应的概率；根据所述待测试词汇集中每一个词汇、每一个字母分别对应的音素集、所述音素集中每一个音素对应的概率，以及每一个字母对应的映射音素集，预测所述待测试词汇集中每一个词汇分别对应的目标音素集。2.根据权利要求1所述的方法，其特征在于，所述根据所述待测试词汇集中每一个词汇对应的字母组合，以及每一个字母分别对应的位置数据，生成融合特征，具体包括：根据所述待测试词汇集中的词汇对应的字母组合，构成第一特征；根据每一个字母分别对应的位置数据，构成第二特征；对所述第一特征执行嵌入特征学习，获取第一关联特征；对所述第二特征执行嵌入特征学习，获取第二关联特征；将所述第一关联特征和所述第二关联特征进行融合，获取所述融合特征。3.根据权利要求1或2所述的方法，其特征在于，所述至少两种神经网络系统包括至少一种用以学习局部特征的第一神经网络，以及至少一种用以学习全局特征的第二神经网络系统。4.根据权利要求3所述的方法，其特征在于，所述第一神经网络系统中包括至少一个第一神经网络模型，所述第二神经网络系统包括至少一个第二神经网络模型，至少一个所述第一神经网络模型顺次连接后，顺次连接至少一个所述第二神经网络模型；所述利用至少两种神经网络系统对所述融合特征进行特征学习，获取用以表征每一个字母组合中的字母分别对应的音素集，以及所述音素集中每一个音素对应的概率，具体包括：利用至少一个所述第一神经网络模型对所述融合特征进行特征学习，获取每一个字母组合中每一个字母对应的候选音素集，以及与所述候选音素集中每一个候选音素对应的预测概率表征数据；将每一个字母组合中的字母、与每一个字母对应的候选音素集，以及与所述候选音素集中每一个候选音素对应的预测概率表征数据输入到至少一个所述第二神经网络模型，获取用以表征每一个字母组合中的字母分别对应的音素集，以及所述音素集中每一个音素对应的概率，其中，所述音素集为所述候选音素集中的部分或全部音素。5.根据权...

【专利技术属性】
技术研发人员：王春峰，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人