基于语义语调的方言语音生成方法、系统及介质技术方案

技术编号:38819593 阅读:12 留言:0更新日期:2023-09-15 19:58
本发明专利技术公开了基于语义语调的方言语音生成方法、系统及介质,涉及语音合成技术领域;识别次方言语音输入信息并进行语义语调相似度分析,根据语义语调相似度分析结果在大方言语料库中搜索出匹配的次方言规则;按照匹配的次方言规则,先对所述基本方言输出文本进行修正,再将修正后的基本方言输出文本转化成次方言语音输出;本方案在现有的方言语音生成技术基础上进行方法上的改进,分析次方言输入信息的语义语调,根据语义语调分析结果确定该次方言输入信息的所属次方言规则,并根据次方言规则对基本方言输出文本进行修正,按照次方言规则输出次方言语音,有效解决大方言区内部的语言差异导致的沟通难的问题。言差异导致的沟通难的问题。言差异导致的沟通难的问题。

【技术实现步骤摘要】
基于语义语调的方言语音生成方法、系统及介质


[0001]本专利技术涉及语音合成
,具体涉及基于语义语调的方言语音生成方法、系统及介质。

技术介绍

[0002]汉语方言是汉语的地域变体,一般认为,汉语方言通常分为十大方言:官话方言、晋方言、吴方言、徽方言、闽方言、粤方言、客家方言、赣方言、湘方言和平话土话;一个大方言内部仍存在语言差异,因此大方言之下又分次方言,次方言内部还可以再分为若干土语。如,官话方言分为:东北官话、北京官话、冀鲁官话、胶辽官话、兰银官话、西南官话和江淮官话;西南官话下分6片、22小片,主要分布于四川、重庆、贵州、云南、湖北、广西、湖南七省和直辖市。
[0003]对于汉语方言的语音识别和语音合成技术越来越成熟,语音合成是一种将文字信息转变为可以听得懂的、流利的汉语口语输出的技术。语音合成不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文档的可读性。
[0004]现有的方言语音生成方法主要是大方言区方言,但是一个大方言区内部仍存在语言差异,现有的方言语音合成技术,仍然存在大方言区内部交流障碍的问题。

技术实现思路

[0005]本专利技术所要解决的技术问题是:现有的方言语音生成方法主要是大方言区方言,但是一个大方言区内部仍存在语言差异,目前的方言语音合成技术,仍然存在大方言区内部交流障碍的问题;本专利技术目的在于提供基于语义语调的方言语音生成方法、系统及介质,通过与阅读者进行一轮对话,根据阅读者的次方言语音输入信息调取相应的次方言规则,依据次方言规则将输出文本转化成次方言语音输出,有效帮助有视觉障碍的人阅读输出文本,增加文本文档的可读性,同时解决大方言区内部的语言差异导致的沟通难的问题。
[0006]本专利技术通过下述技术方案实现:本方案提供基于语义语调的方言语音生成方法,包括:识别次方言语音输入信息;对次方言语音输入信息进行语义语调相似度分析,并基于语义语调相似度分析结果在大方言语料库中搜索出匹配的次方言规则;所述大方言语料库中存储有大方言区内所有方言规则,包括基本方言规则和次方言规则;所述基本方言规则为大方言区内使用人数最多方言所对应的规则;所述方言规则包括语义规则和语调规则;所述语义语调相似度分析包括:在将次方言语音输入信息转化为基本方言语音和基本方言语音的过程中,计算出的语义相似度和语调相似度,基于语义相似度和语调相似度得到语义语调相似度分析结果;获取输出文本并依据基本方言规则将输出文本转化成基本方言输出文本;按照匹配的次方言规则,先对所述基本方言输出文本进行修正,再将修正后的基
本方言输出文本转化成次方言语音;输出所述次方言语音。
[0007]本方案工作原理:现有的方言语音生成方法主要是针对大方言区,但是一个大方言区内部仍存在语言差异,比如巴蜀方言区中,不同区域还有各自的方言,一些典型的乡音比较特别的如乐山方言、内江方言、自贡方言、宜宾方言、泸州方言和雅安话等,相互之间语义和语调存在较大的差异;在进行方言语音生成时,现有方法通常直接按照的大方言区内使用人数最多的基本方言规则生成基本方言语音,对于乡音特别的区域依旧存在方言难以理解的现象;鉴于此,本方案提供基于语义语调的方言语音生成方法,在现有的方言语音生成技术基础上进行方法上的改进,分析次方言输入信息的语义语调,根据语义语调分析结果确定该次方言输入信息的所属次方言规则,并按照次方言规则(语义规则)对基本方言输出文本进行修正,按照次方言规则(语调规则)输出次方言语音,有效解决大方言区内部的语言差异导致的沟通难的问题,有效帮助有视觉障碍的人阅读输出文本,更能增加文本文档的可读性;考虑到大方言区内各个次方言语义特征和语调特征差异明显的特点,本方案选定以次方言转换成基本方言过程中的语义差异特征和语调差异特征,根据语音语义分析结果来匹配查找对应的次方言规则,保障对应次方言规则匹配精准度,提高方言语音生成的有效性。
[0008]所述次方言输入信息包括次方言语音信息或精准的次方言名称信息,当次方言输入信息为精准的次方言名称信息,则可以省略语义语调分析和搜索过程,可以直接调取相关的次方言规则对基本方言输出文本进行给修正。
[0009]本方案提供了一种新的技术构思,通过与阅读者进行一轮交互,根据阅读者的(交互信息)次方言语音输入信息匹配调取相应的次方言规则,依据次方言规则将输出文本转化成次方言语音输出,有效帮助有视觉障碍的人阅读输出文本,更能增加文本文档的可读性,同时解决大方言区内部的语言差异导致的沟通难的问题。
[0010]进一步优化方案为,若在大方言语料库中未搜索出与语义语调相似度分析结果匹配的次方言规则时,直接将基本方言输出文本转化成基本方言语音后输出;当大方言语料库中未搜索匹配的次方言规则,就直接以使用人数最多的基本方言输出。
[0011]进一步优化方案为,所述识别次方言语音输入信息,包括方法:将所述次方言语音输入信息输入到预先训练的方言语音识别模型中,得到次方言语音输入信息的识别信息,所述识别信息包括语义文本和语音信息。
[0012]进一步优化方案为,所述对次方言语音输入信息进行语义语调相似度分析,包括方法:S1,获取次方言语音输入信息的语义文本和语音信息,基于基本方言规则先将语义文本转化成基本方言文本,再将基本方言文本转化成基本方言语音;S2,基于次方言语音输入信息的语义文本与基本方言文本计算语义相似度Q
y
,基于次方言语音输入信息的语音信息与基本方言语音计算语调相似度Q
d
;S3,根据语调相似度Q
d
和语义相似度Q
y
计算出语义语调相似度Q:
[0013]其中K为相似度系数。
[0014]进一步优化方案为,所述基于次方言语音输入信息的语义文本与基本方言文本计算语义相似度Q
y
,包括方法:分别对语音输入文本和基本方言输入文本进行词汇分割;以句子为单位将语音输入文本和基本方言输入文本分别划分成m个句子,并对各句子进行词汇分割;比较语音输入文本和基本方言输入文本对应同一句子的语义特征;所述语义特征包括:语音输入文本中句子I1对比基本方言输入文本中句子I2的相同词汇占比S
I
:S
I
=S
12
/S
2总
其中,句子I
1 和句子I2相对应;S
12
为句子I
1 和句子I2中相同词汇的数量,S
2总
为句子J2的词汇总数;语音输入文本对应句子I1对比基本方言输入文本对应句子I2的句长差异L
I
;即字数差异。
[0015]语音输入文本对应句子I1对比基本方言输入文本对应句子I2中表示同一语义词汇的位置差异R
I
;基于语义特征计算语义相似度:。
[0016]进一步优化方案为,所述基于次方言语音输入信息的语音信息与基本方言语音计算语调相似度Q
d
,包括方法:以句子为单位将次方言语音输入信息的语音信息和基本方言语音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于语义语调的方言语音生成方法,其特征在于,包括:识别次方言语音输入信息;对次方言语音输入信息进行语义语调相似度分析,并基于语义语调相似度分析结果在大方言语料库中搜索出匹配的次方言规则;所述大方言语料库中存储有大方言区内所有方言规则,包括基本方言规则和次方言规则;所述基本方言规则为大方言区内使用人数最多方言所对应的规则;所述方言规则包括语义规则和语调规则;所述语义语调相似度分析包括:在将次方言语音输入信息转化为基本方言语音和基本方言语音的过程中,计算出的语义相似度和语调相似度,基于语义相似度和语调相似度得到语义语调相似度分析结果;获取输出文本并依据基本方言规则将输出文本转化成基本方言输出文本;按照匹配的次方言规则,先对所述基本方言输出文本进行修正,再将修正后的基本方言输出文本转化成次方言语音;输出所述次方言语音。2.根据权利要求1所述的基于语义语调的方言语音生成方法,其特征在于,若在大方言语料库中未搜索出与语义语调相似度分析结果匹配的次方言规则时,直接将基本方言输出文本转化成基本方言语音后输出。3.根据权利要求1所述的基于语义语调的方言语音生成方法,其特征在于,所述识别次方言语音输入信息,包括方法:将所述次方言语音输入信息输入到预先训练的方言语音识别模型中,得到次方言语音输入信息的识别信息,所述识别信息包括语义文本和语音信息。4.根据权利要求1所述的基于语义语调的方言语音生成方法,其特征在于,所述对次方言语音输入信息进行语义语调相似度分析,包括方法:S1,获取次方言语音输入信息的语义文本和语音信息,基于基本方言规则先将语义文本转化成基本方言文本,再将基本方言文本转化成基本方言语音;S2,基于次方言语音输入信息的语义文本与基本方言文本计算语义相似度Q
y
,基于次方言语音输入信息的语音信息与基本方言语音计算语调相似度Q
d
;S3,根据语调相似度Q
d
和语义相似度Q
y
计算出语义语调相似度Q:其中K为相似度系数。5.根据权利要求4所述的基于语义语调的方言语音生成方法,其特征在于,所述基于次方言语音输入信息的语义文本与基本方言文本计算语义相似度Q
y
,包括方法:分别对语音输入文本和基本方言输入文本进行词汇分割;以句子为单位将语音输入文本和基本方言输入文本分别划分成m个句子,并对各句子进行词汇分割;比较语音输入文本和基本方言输入文本对应同一句子的语义特征;所述语义特征包括:语音输入文本中句子I1对比基本方言输入文本中句子I2的相同词汇占比S
I
:S
I
=S
12
/S
2总
其中,句子I
1 和句子I2相对应;S
12
为句子I
1 和句子I2中相同词汇的数量,S
2总
为句子J2的词汇总数;
语音输入文本对应句子I1对比基本方言输入文本对应句子I2的句长差异L
I
;语音输入文本对应句子I1对比基本方言输入文本对应句子I2中表示同一语义词汇的位置差异R
I
;基于语义特征计算语义相似度:。6.根据权利要求4所述的基于语义语调的方言...

【专利技术属性】
技术研发人员:高健豪崔晓乾
申请(专利权)人:成都信通信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1