字音转换方法、装置及系统制造方法及图纸

技术编号:37501745 阅读:23 留言:0更新日期:2023-05-07 09:37
本公开实施例涉及一种字音转换方法、装置及系统,该方法包括:获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数,以及与每一个字母对应的映射音素集;对每一个字母分别进行复制,构成字母组合,并生成与字母组合中每一个字母对应的位置数据;根据每一个字母组合,以及每一个位置数据,生成融合特征;利用至少两种神经网络系统对融合特征进行特征学习,获取音素集,以及音素集中每一个音素对应的概率;根据每一个词汇、每一个字母分别对应的音素集、音素集中每一个音素对应的概率,以及每一个字母对应的映射音素集,预测待测试词汇集中每一个词汇分别对应的目标音素集。通过该方法,字音转换的准确率大大提高。大提高。大提高。

【技术实现步骤摘要】
字音转换方法、装置及系统


[0001]本公开实施例涉及计算机
,尤其涉及一种字音转换方法、装置及系统。

技术介绍

[0002]字音转换的目标是预测目标单词的发音。该技术在语音合成,以及语音识别等领域都有广泛的引用。目前,实现字音转换的方法例如传统基于规则的转写方案。该方案因为需要借助大量的专家知识来辅助设计,导致预测的精度差,效率低。而且,所需的人工成本和经济成本也比较高。

技术实现思路

[0003]本公开提供了一种字音转换方法、装置及系统,以解决现有技术中部分或全部技术问题。
[0004]第一方面,本公开提供了一种字音转换方法,包括:
[0005]获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数,以及与每一个字母对应的映射音素集;
[0006]依次对每一个词汇包括的每一个字母分别进行复制,构成字母组合,并生成与字母组合中每一个字母分别对应的位置数据;
[0007]根据待测试词汇集中每一个词汇对应的字母组合,以及每一个字母分别对应的位置数据,生成融合特征,融合特征用以表征每一个字母组合中字母之间的第一关联关系,以及字母组合中不同字母分别对应的位置数据之间的第二关联关系;
[0008]利用至少两种神经网络系统对融合特征进行特征学习,获取用以表征每一个字母组合中的字母分别对应的音素集,以及音素集中每一个音素对应的概率;
[0009]根据待测试词汇集中每一个词汇、每一个字母分别对应的音素集、音素集中每一个音素对应的概率,以及每一个字母对应的映射音素集,预测待测试词汇集中每一个词汇分别对应的目标音素集。
[0010]第二方面,本公开提供了一种字音转换装置,该装置包括:
[0011]获取模块,用于获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数,以及与每一个字母对应的映射音素集;
[0012]处理模块,用于依次对每一个词汇包括的每一个字母分别进行复制,构成字母组合,并生成与字母组合中每一个字母分别对应的位置数据;
[0013]特征融合模块,用于根据待测试词汇集中每一个词汇对应的字母组合,以及每一个字母分别对应的位置数据,生成融合特征,融合特征用以表征每一个字母组合中字母之间的第一关联关系,以及字母组合中不同字母分别对应的位置数据之间的第二关联关系;
[0014]特征学习模块,用于利用至少两种神经网络系统对融合特征进行特征学习,获取用以表征每一个字母组合中的字母分别对应的音素集,以及音素集中每一个音素对应的概率;
[0015]预测模块,用于根据待测试词汇集中每一个词汇、每一个字母分别对应的音素集、音素集中每一个音素对应的概率,以及每一个字母对应的映射音素集,预测待测试词汇集中每一个词汇分别对应的目标音素集。
[0016]第三方面,本公开实施例提供了一种字音转换系统,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0017]存储器,用于存放计算机程序;
[0018]处理器,用于执行存储器上所存放的程序时,实现如第一方面任一实施方式所介绍的字音转换方法的步骤。
[0019]第四方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一实施方式所介绍的字音转换方法的步骤。
[0020]本公开实施例提供的该方法,获取每一个字母分别对应的最大映射音素个数,以及每一个字母对应的映射音素集。依次对每一个词汇包括的每一个字母分别进行复制,构成字母组合,并生成与字母组合中每一个字母分别对应的位置数据。根据每一个词汇对应的字母组合,以及每一个字母对应的位置数据,生成融合特征。利用至少两种神经网络系统对融合特征进行特征学习,获取用以表征每一个字母组合中的字母分别对应的音素集,以及音素集中每一个音素对应的概率。最终,根据待测试词汇集中每一个词汇、每一个字母分别对应的音素集、音素集中每一个音素对应的概率,以及每一个字母对应的映射音素集,预测待测试词汇集中每一个词汇分别对应的目标音素集,自此完成字音转换过程。整个过程中,针对待测试词汇中每一个词汇的每一个字母分别预测对应的目标音素,并行执行字母的音素预测过程,以至于可以并行完成多个词汇的字音转换过程。相较于现有技术而言,大大提高了工作效率。字音转换的准确率也将大大提高。
附图说明
[0021]图1为本公开实施例提供的一种字音转换方法流程图;
[0022]图2为本公开实施例提供的另一种字音转换方法流程图;
[0023]图3为本公开实施例提供的另一种字音转换方法流程图;
[0024]图4为本公开实施例提供的一种字音转换系统架构示意图;
[0025]图5为本公开实施例提供的另一种字音转换方法流程图;
[0026]图6为本公开实施例提供的一种字音转换装置的结构示意图;
[0027]图7为本公开实施例提供的一种字音转换系统对应的实体结构示意图。
具体实施方式
[0028]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0029]为便于对本公开实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本公开实施例的限定。
[0030]针对
技术介绍
中所提及的技术问题,本公开实施例提供了一种字音转换方法。
[0031]下面将详细介绍具体的字音转换的方法步骤,可以参见本公开实施例提供的附图,图1为本公开实施例提供的一种字音转换方法流程示意图。该方法可以应用于终端设备,也可以应用于云端环境等,具体应用场景这里不做任何限定。该方法步骤包括:
[0032]步骤110,获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数,以及与每一个字母对应的映射音素集。
[0033]具体的,待测试词汇中每一个词汇包括的每一个字母分别对应的最大映射音素个数,以及每一个字母对应的音素集,都可以通过查找预构建的音素词典的方式获取。
[0034]音素词典的表现形式具体可以参见如下表1所示。表1中示例性的显示了部分字母对应的可能最大映射音素个数,以及映射音素集。
[0035][0036][0037]表1
[0038]其中,音素集中的字母代表音素,音素集中的数字,则代表重音,例如AA0中AA代表音素,0代表重音。
[0039]例如获取词汇cat(猫)中的字母c对应的最大映射音素个数为2,字母对应的映射音素集包括K,CH,S,SH,T等音素构成的集合。
[0040]步骤120,依次对每一个词汇包括的每一个字母分别进行复制,构成字母组合,并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字音转换方法,其特征在于,所述方法包括:获取待测试词汇集中每一个词汇包括的每一个字母分别对应的最大映射音素个数,以及与每一个字母对应的映射音素集;依次对每一个词汇包括的每一个字母分别进行复制,构成字母组合,并生成与字母组合中每一个字母分别对应的位置数据;根据所述待测试词汇集中每一个词汇对应的字母组合,以及每一个字母分别对应的位置数据,生成融合特征,所述融合特征用以表征每一个字母组合中字母之间的第一关联关系,以及所述字母组合中不同字母分别对应的位置数据之间的第二关联关系;利用至少两种神经网络系统对所述融合特征进行特征学习,获取用以表征每一个字母组合中的字母分别对应的音素集,以及所述音素集中每一个音素对应的概率;根据所述待测试词汇集中每一个词汇、每一个字母分别对应的音素集、所述音素集中每一个音素对应的概率,以及每一个字母对应的映射音素集,预测所述待测试词汇集中每一个词汇分别对应的目标音素集。2.根据权利要求1所述的方法,其特征在于,所述根据所述待测试词汇集中每一个词汇对应的字母组合,以及每一个字母分别对应的位置数据,生成融合特征,具体包括:根据所述待测试词汇集中的词汇对应的字母组合,构成第一特征;根据每一个字母分别对应的位置数据,构成第二特征;对所述第一特征执行嵌入特征学习,获取第一关联特征;对所述第二特征执行嵌入特征学习,获取第二关联特征;将所述第一关联特征和所述第二关联特征进行融合,获取所述融合特征。3.根据权利要求1或2所述的方法,其特征在于,所述至少两种神经网络系统包括至少一种用以学习局部特征的第一神经网络,以及至少一种用以学习全局特征的第二神经网络系统。4.根据权利要求3所述的方法,其特征在于,所述第一神经网络系统中包括至少一个第一神经网络模型,所述第二神经网络系统包括至少一个第二神经网络模型,至少一个所述第一神经网络模型顺次连接后,顺次连接至少一个所述第二神经网络模型;所述利用至少两种神经网络系统对所述融合特征进行特征学习,获取用以表征每一个字母组合中的字母分别对应的音素集,以及所述音素集中每一个音素对应的概率,具体包括:利用至少一个所述第一神经网络模型对所述融合特征进行特征学习,获取每一个字母组合中每一个字母对应的候选音素集,以及与所述候选音素集中每一个候选音素对应的预测概率表征数据;将每一个字母组合中的字母、与每一个字母对应的候选音素集,以及与所述候选音素集中每一个候选音素对应的预测概率表征数据输入到至少一个所述第二神经网络模型,获取用以表征每一个字母组合中的字母分别对应的音素集,以及所述音素集中每一个音素对应的概率,其中,所述音素集为所述候选音素集中的部分或全部音素。5.根据权...

【专利技术属性】
技术研发人员:王春峰马泽君
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1