一种多语种混语文本处理方法及系统技术方案

技术编号:14415423 阅读:87 留言:0更新日期:2017-01-12 03:28
本发明专利技术公开了一种多语种混语文本处理方法及系统,包括:根据发音原理确定用于描述混语文本发音情况的超音素集合,所述超音素集合包括:元音音素集合和辅音音素集合;收集包含主语种和次语种的混语文本;从所述混语文本中提取语法单元;根据所述语法单元及所述超音素集合构建混语文本的通用词典,所述通用词典中包含主语种和次语种中的语法单元及所述语法单元的发音信息;根据所述通用词典对所述混语文本进行字音转换,得到对应所述混语文本的语音符号序列。利用本发明专利技术提供的方法,可以解决当多语种混语文本对应主语种与次语种语音结构差别较大时,容易造成主语种缺失的次语种音素发音缺失的问题,从而提升多语种混语语音系统文本处理的应用效果。

【技术实现步骤摘要】

本专利技术涉及多语种文本信息处理领域,具体涉及一种多语种混语文本处理方法及系统
技术介绍
随着计算机和互联网的普及,及国际化的需要,越来越多的文本采用多种语言的形式表达,经常会出现一个文本中同时包含多个语种的字符,即混语文本。由于不同语种字符的发音及韵律各不相同,从而给使用统一方法处理所述混语文本带来困难,比如语音合成、语音识别等都需要对不同语种的字符统一处理。现有的多语种混语文本处理方法一般是主语种使用主语种对应的音素集合表示主语种文本的发音情况,次语种通过使用次语种对应的音素集合表示次语种文本的发音情况,然后分别对主语种和次语种进行字音转换,得到主语种语音符号序列和次语种语音符号序列;并且对于主语种包含的次语种音素,直接使用主语种音素表示,对于主语种不包含的次语种音素,映射成相近的主语种音素,得到统一的语音符号序列。上述方法是将主语种和次语种的语音结构作为不同语音体系进行独立处理的,当不同语种的语音结构差别较大时,容易造成主语种缺失的次语种音素发音上的缺失。
技术实现思路
本专利技术实施例提供一种多语种混语文本处理方法及系统,以解决现有技术中当多语种混语文本对应语音结构差别较大时,容易造成主语种缺失的次语种音素发音上的缺失的问题。为此,本专利技术实施例提供如下技术方案:一种多语种混语文本处理方法,包括:根据发音原理确定用于描述混语文本发音情况的超音素集合,所述超音素集合包括:元音音素集合和辅音音素集合;收集包含主语种和次语种的混语文本;从所述混语文本中提取语法单元;根据所述语法单元及所述超音素集合构建混语文本的通用词典,所述通用词典中包含主语种和次语种中的语法单元及所述语法单元的发音信息;根据所述通用词典对待处理混语文本进行字音转换,得到对应所述混语文本的语音符号序列。优选的,所述超音素集合根据以下任意一个或多个原则确定:将具有明显发音差异的音素加入超音素集合中;不同语种间发音特征相似的音素使用相同的符号表示;超音素集合中的音素能够覆盖设定数量语种的发音情况。优选的,所述确定元音音素集合包括:根据各语种元音音素发音时的舌位高度及舌尖位置确定元音音素集合。优选的,所述确定辅音音素集合包括:根据各语种辅音音素发音时的发音部位及发音方法确定辅音音素集合。优选的,所述根据所述语法单元及所述超音素集合构建混语文本的通用词典包括:根据所述语法单元的字符组合划分与语法单元发音具有相关性的语法单元片段;根据所述语法单元片段的发音覆盖情况选择需要加入混语文本的通用词典的语法单元;采用所述超音素集合描述所述语法单元的发音,得到混语文本的通用词典。优选的,所述根据所述语法单元片段的发音覆盖情况选择需要加入混语文本的通用词典的语法单元包括:根据所述语法单元片段的发音覆盖情况,采用机器学习的方法选择需要加入混语文本的通用词典的语法单元。一种多语种混语文本处理系统,包括:超音素集合确定模块,用于根据发音原理确定用于描述混语文本发音情况的超音素集合,所述超音素集合包括:元音音素集合和辅音音素集合;混语文本收集模块,用于收集包含主语种和次语种的混语文本;语法单元提取模块,用于从所述混语文本中提取语法单元;通用词典构建模块,用于根据所述语法单元及所述超音素集合构建混语文本的通用词典,所述通用词典中包含主语种和次语种中的语法单元及所述语法单元的发音信息;字音转换模块,用于根据所述通用词典对待处理混语文本进行字音转换,得到对应所述混语文本的语音符号序列。优选的,所述超音素集合确定模块根据以下任意一个或多个原则确定超音素集合:将具有明显发音差异的音素加入超音素集合中;不同语种间发音特征相似的音素使用相同的符号表示;超音素集合中的音素能够覆盖设定数量语种的发音情况。优选的,所述超音素集合确定模块包括:元音音素集合确定单元及辅音因素集合确定单元;所述元音音素集合确定单元用于根据各语种元音音素发音时的舌位高度及舌尖位置确定元音音素集合;所述辅音音素集合确定单元用于根据各语种辅音音素发音时的发音部位及发音方法确定辅音音素集合。优选的,所述通用词典构建模块包括:划分单元,用于根据所述语法单元的字符组合划分与语法单元发音具有相关性的语法单元片段;选择单元,用于根据所述语法单元片段的发音覆盖情况选择需要加入混语文本的通用词典的语法单元;构建单元,用于采用所述超音素集合描述所述语法单元的发音,得到混语文本的通用词典。优选的,所述选择单元,具体用于根据所述语法单元片段的发音覆盖情况,采用机器学习的方法选择需要加入混语文本的通用词典的语法单元。本专利技术实施例提供的多语种混语文本处理方法及系统,首先根据发音原理确定用于描述混语文本发音情况的超音素集合,该超音素集合包括元音音素集合和辅音音素集合,然后根据收集的大量混语文本提取其中的语法单元,并根据所述超音素集合及所述语法单元构建包含主语种和次语种信息的混语文本通用词典,这样,在对待处理混语文本进行字音转换时,即可直接根据该通用词典对其进行字音转换,得到对应所述混语文本的语音符号序列。本专利技术实施例提供的方法及系统可以有效减少混语文本中主语种与次语种语音结构差别较大时,主语种缺失的次语种音素发音缺失的问题,从而提升多语种混语语音系统文本处理的应用效果。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例多语种混语文本处理方法的一种流程图;图2是本专利技术实施例的主要元音音素集合的一种二维坐标系示意图;图3是本专利技术实施例的主要辅音音素集合的一种二维坐标系示意图;图4是本专利技术实施例多语种混语文本处理系统的一种结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。字音转换是指将文字序列转换成相应的发音内容后,使用语音符号序列表示所述发音内容的过程。对于单一语种文本,可以根据该语种的发音特点,实现相应的字音转换。而对于多语种混语文本,传统方法分别采用主语种及次语种的发音符号描述混语文本中对应的主语种及次语种的发音情况,然后将混语文本中次语种的语音符号映射到相应主语种语音符号序列的相应位置,得到混语文本语音序号序列,当混语文本中不同语种的语音结构差别较大时,容易造成主语种缺失的次语种音素发音上的缺失。本专利技术实施例的多语种混语文本处理方法及系统,根据包含主语种及次语种音素的超音素集合,以及从大量混语文本中提取的语法单元,构建混语文本的通用词典,即将混语文本中主语种文本和次语种文本的发音情况直接使用超音素集合中音素描述,然后根据所述通用词典对待处理混语文本进行字音转换,得到混语文本语音符号序列。由于根据超音素集合构建的通用词典包含能描述主语种及次语种的常用语法单元的发音情况,即使混语文本中不同语种的语音结构差别较大时,只要能通过查通用词典找到混语文本中的语法单元,也能对主语种及次语种进行字音转换,获得混语文本语音符号序列。如图1所示,是本专利技术实施例多语种混语文本处理方法的一种流程图,包括以下步骤:步骤101,根据发音原理确定用于描述本文档来自技高网
...
一种多语种混语文本处理方法及系统

【技术保护点】
一种多语种混语文本处理方法,其特征在于,包括:根据发音原理确定用于描述混语文本发音情况的超音素集合,所述超音素集合包括:元音音素集合和辅音音素集合;收集包含主语种和次语种的混语文本;从所述混语文本中提取语法单元;根据所述语法单元及所述超音素集合构建混语文本的通用词典,所述通用词典中包含主语种和次语种中的语法单元及所述语法单元的发音信息;根据所述通用词典对待处理混语文本进行字音转换,得到对应所述混语文本的语音符号序列。

【技术特征摘要】
1.一种多语种混语文本处理方法,其特征在于,包括:根据发音原理确定用于描述混语文本发音情况的超音素集合,所述超音素集合包括:元音音素集合和辅音音素集合;收集包含主语种和次语种的混语文本;从所述混语文本中提取语法单元;根据所述语法单元及所述超音素集合构建混语文本的通用词典,所述通用词典中包含主语种和次语种中的语法单元及所述语法单元的发音信息;根据所述通用词典对待处理混语文本进行字音转换,得到对应所述混语文本的语音符号序列。2.根据权利要求1所述的方法,其特征在于,所述超音素集合根据以下任意一个或多个原则确定:将具有明显发音差异的音素加入超音素集合中;不同语种间发音特征相似的音素使用相同的符号表示;超音素集合中的音素能够覆盖设定数量语种的发音情况。3.根据权利要求1所述的方法,其特征在于,所述确定元音音素集合包括:根据各语种元音音素发音时的舌位高度及舌尖位置确定元音音素集合。4.根据权利要求1所述的方法,其特征在于,所述确定辅音音素集合包括:根据各语种辅音音素发音时的发音部位及发音方法确定辅音音素集合。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述语法单元及所述超音素集合构建混语文本的通用词典包括:根据所述语法单元的字符组合划分与语法单元发音具有相关性的语法单元片段;根据所述语法单元片段的发音覆盖情况选择需要加入混语文本的通用词典的语法单元;采用所述超音素集合描述所述语法单元的发音,得到混语文本的通用词典。6.根据权利要求5所述的方法,其特征在于,所述根据所述语法单元片
\t段的发音覆盖情况选择需要加入混语文本的通用词典的语法单元包括:根据所述语法单元片段的发音覆盖情况,采用机器学习的方法选择需要加入混语文本的通用词典的语法单元。7.一种多语种混语文本处理系统,其特征在于,包括:超音...

【专利技术属性】
技术研发人员:祖漪清闫润强王影胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1