基于语义语调的方言语音生成方法、系统及介质技术方案

技术编号：38819593 阅读：12 留言：0更新日期：2023-09-15 19:58

本发明专利技术公开了基于语义语调的方言语音生成方法、系统及介质，涉及语音合成技术领域；识别次方言语音输入信息并进行语义语调相似度分析，根据语义语调相似度分析结果在大方言语料库中搜索出匹配的次方言规则；按照匹配的次方言规则，先对所述基本方言输出文本进行修正，再将修正后的基本方言输出文本转化成次方言语音输出；本方案在现有的方言语音生成技术基础上进行方法上的改进，分析次方言输入信息的语义语调，根据语义语调分析结果确定该次方言输入信息的所属次方言规则，并根据次方言规则对基本方言输出文本进行修正，按照次方言规则输出次方言语音，有效解决大方言区内部的语言差异导致的沟通难的问题。言差异导致的沟通难的问题。言差异导致的沟通难的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于语义语调的方言语音生成方法、系统及介质

[0001]本专利技术涉及语音合成
，具体涉及基于语义语调的方言语音生成方法、系统及介质。

技术介绍

[0002]汉语方言是汉语的地域变体，一般认为，汉语方言通常分为十大方言：官话方言、晋方言、吴方言、徽方言、闽方言、粤方言、客家方言、赣方言、湘方言和平话土话；一个大方言内部仍存在语言差异，因此大方言之下又分次方言，次方言内部还可以再分为若干土语。如，官话方言分为：东北官话、北京官话、冀鲁官话、胶辽官话、兰银官话、西南官话和江淮官话；西南官话下分6片、22小片，主要分布于四川、重庆、贵州、云南、湖北、广西、湖南七省和直辖市。
[0003]对于汉语方言的语音识别和语音合成技术越来越成熟，语音合成是一种将文字信息转变为可以听得懂的、流利的汉语口语输出的技术。语音合成不仅能帮助有视觉障碍的人阅读计算机上的信息，更能增加文本文档的可读性。
[0004]现有的方言语音生成方法主要是大方言区方言，但是一个大方言区内部仍存在语言差异，现有的方言语音合成技术，仍然存在大方言区内部交流障碍的问题。

技术实现思路

[0005]本专利技术所要解决的技术问题是：现有的方言语音生成方法主要是大方言区方言，但是一个大方言区内部仍存在语言差异，目前的方言语音合成技术，仍然存在大方言区内部交流障碍的问题；本专利技术目的在于提供基于语义语调的方言语音生成方法、系统及介质，通过与阅读者进行一轮对话，根据阅读者的次方言语音输入信息调取相应的次方言规则，依据次方言规则将输出文...

【技术保护点】

【技术特征摘要】
1.基于语义语调的方言语音生成方法，其特征在于，包括：识别次方言语音输入信息；对次方言语音输入信息进行语义语调相似度分析，并基于语义语调相似度分析结果在大方言语料库中搜索出匹配的次方言规则；所述大方言语料库中存储有大方言区内所有方言规则，包括基本方言规则和次方言规则；所述基本方言规则为大方言区内使用人数最多方言所对应的规则；所述方言规则包括语义规则和语调规则；所述语义语调相似度分析包括：在将次方言语音输入信息转化为基本方言语音和基本方言语音的过程中，计算出的语义相似度和语调相似度，基于语义相似度和语调相似度得到语义语调相似度分析结果；获取输出文本并依据基本方言规则将输出文本转化成基本方言输出文本；按照匹配的次方言规则，先对所述基本方言输出文本进行修正，再将修正后的基本方言输出文本转化成次方言语音；输出所述次方言语音。2.根据权利要求1所述的基于语义语调的方言语音生成方法，其特征在于，若在大方言语料库中未搜索出与语义语调相似度分析结果匹配的次方言规则时，直接将基本方言输出文本转化成基本方言语音后输出。3.根据权利要求1所述的基于语义语调的方言语音生成方法，其特征在于，所述识别次方言语音输入信息，包括方法：将所述次方言语音输入信息输入到预先训练的方言语音识别模型中，得到次方言语音输入信息的识别信息，所述识别信息包括语义文本和语音信息。4.根据权利要求1所述的基于语义语调的方言语音生成方法，其特征在于，所述对次方言语音输入信息进行语义语调相似度分析，包括方法：S1，获取次方言语音输入信息的语义文本和语音信息，基于基本方言规则先将语义文本转化成基本方言文本，再将基本方言文本转化成基本方言语音；S2，基于次方言语音输入信息的语义文本与基本方言文本计算语义相似度Q
y
，基于次方言语音输入信息的语音信息与基本方言语音计算语调相似度Q
d
；S3，根据语调相似度Q
d
和语义相似度Q
y
计算出语义语调相似度Q：其中K为相似度系数。5.根据权利要求4所述的基于语义语调的方言语音生成方法，其特征在于，所述基于次方言语音输入信息的语义文本与基本方言文本计算语义相似度Q
y
，包括方法：分别对语音输入文本和基本方言输入文本进行词汇分割；以句子为单位将语音输入文本和基本方言输入文本分别划分成m个句子，并对各句子进行词汇分割；比较语音输入文本和基本方言输入文本对应同一句子的语义特征；所述语义特征包括：语音输入文本中句子I1对比基本方言输入文本中句子I2的相同词汇占比S
I
：S
I
=S
12
/S
2总
其中，句子I
1 和句子I2相对应；S
12
为句子I
1 和句子I2中相同词汇的数量，S
2总
为句子J2的词汇总数；
语音输入文本对应句子I1对比基本方言输入文本对应句子I2的句长差异L
I
；语音输入文本对应句子I1对比基本方言输入文本对应句子I2中表示同一语义词汇的位置差异R
I
；基于语义特征计算语义相似度：。6.根据权利要求4所述的基于语义语调的方言...

【专利技术属性】
技术研发人员：高健豪，崔晓乾，
申请(专利权)人：成都信通信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人