一种基于语音模型的方言转述方法及相关装置制造方法及图纸

技术编号:31746961 阅读:14 留言:0更新日期:2022-01-05 16:26
本申请公开了一种基于语音模型的方言转述方法及相关装置,所述方法包括:获取语音文本,并通过预训练的意图识别模型确定语音文本对应的转述意图;当转述意图为转述方言时,通过预训练的实体识别模型确定语音文本对应的方言区域及转述文本;基于方言区域及转述文本在预设数据库内查找转述文本对应的方言文本,并基于方言文本将语音文本转换为方言语音。本申请通过预设数据库对各方言区域的常用方言进行整合和,然后使用意图识别模型和实体识别模型来确定需要转换为方言转述的转述语句以及转述语句所对应的方言区域,最后在预设数据库中选取转述语句对应的方言语音,这样可以提高方言转述的准确性,给用户的使用带来方便。给用户的使用带来方便。给用户的使用带来方便。

【技术实现步骤摘要】
一种基于语音模型的方言转述方法及相关装置


[0001]本申请涉及计算机
,特别涉及一种基于语音模型的方言转述方法及相关装置。

技术介绍

[0002]目前现有的语音助手对于一般常见问题的回应都较为人性化,但表达能力很大程度上受限于训练语料的内容和模型泛化能力的限制,针对不常见或不具有标准答案的问题通常有不太智能的表现。例如,当问到一句话如何用方言转述时,经常会出现答非所问或转述错误的现象。这样一方面限制了语音助手的使用,另一方面也会给用户的使用带来不便。
[0003]因而现有技术还有待改进和提高。

技术实现思路

[0004]本申请要解决的技术问题在于,针对现有技术的不足,提供一种基于语音模型的方言转述方法及相关装置。
[0005]为了解决上述技术问题,本申请实施例第一方面提供了一种基于语音模型的方言转述方法,所述方法包括:
[0006]获取语音文本,并通过预训练的意图识别模型确定所述语音文本对应的转述意图;
[0007]当所述转述意图为转述方言时,通过预训练的实体识别模型确定所述语音文本对应的方言区域以及转述文本;
[0008]基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言语音,以将所述语音文本转换为方言语音。
[0009]所述的基于语音模型的方言转述方法,其中,所述获取语音文本,并通过预训练的意图识别模型确定所述语音文本对应的转述意图之前,所述方法还包括:
[0010]构建预设数据库,其中,所述预设数据库包括若干数据组,若干数据组中的每个数据组均包括方言区域、属于所述方言区域的方言文本、所述方言文本对应的方言语音以及方言文本对应的普通话文本。
[0011]所述的基于语音模型的方言转述方法,其中,所述意图识别模型和所述实体识别模型均预先训练的bert模型。
[0012]所述的基于语音模型的方言转述方法,其中,所述基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言文本具体包括:
[0013]在所述预设数据库中查找所述方言区域对应的所有参考数据组;
[0014]在查找到的所有参考数据组中查找与所述转述文本相匹配的普通话文本,并将所述普通话文本对应的方言文本作为所述转述文本对应的方言文本。
[0015]所述的基于语音模型的方言转述方法,其中,所述在查找到的所有参考数据组中查找与所述转述文本相匹配的普通话文本具体包括:
[0016]在所有参考数据组中查找与所述转述文本的文本内容相同的目标普通话文本;
[0017]若查找到目标普通话文本,则将所述目标普通话文本作为与所述转述文本相匹配的普通话文本;
[0018]若未查找到目标普通话文本,则通过预训练的bert模型确定各参考数据组中的普通话文本与所述转述文本的相似度,并基于所述相似度确定所述转述文本相匹配的普通话文本。
[0019]所述的基于语音模型的方言转述方法,其中,所述基于所述相似度确定所述转述文本相匹配的普通话文本具体包括:
[0020]在所有参考数据组中选取相似度大于预设相似度阈值的候选数据组;
[0021]当选取到候选数据组时,将候选数据组中相似度最大的候选数据组中的普通话文本作为所述转述文本相匹配的普通话文本;
[0022]若未选取到候选数据组,则将默认文本作为所述转述文本相匹配的普通话文本。
[0023]所述的基于语音模型的方言转述方法,其中,所述基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言语音,以将所述语音文本转换为方言语音之后,所述方法还包括:
[0024]通过语音播放装置播放所述方言语音。
[0025]本申请实施例第二方面提供了一种基于语音模型的方言转述装置,所述的装置包括:
[0026]获取模块,用于获取语音文本,并通过预训练的意图识别模型确定所述语音文本对应的转述意图;
[0027]确定模块,用于当所述转述意图为转述方言时,通过预训练的实体识别模型确定所述语音文本对应的方言区域以及转述文本;
[0028]转换模块,用于基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言语音,以将所述语音文本转换为方言语音。
[0029]本申请实施例第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的基于语音模型的方言转述方法中的步骤。
[0030]本申请实施例第四方面提供了一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
[0031]所述通信总线实现处理器和存储器之间的连接通信;
[0032]所述处理器执行所述计算机可读程序时实现如上任一所述的基于语音模型的方言转述方法中的步骤。
[0033]有益效果:与现有技术相比,本申请提供了一种基于语音模型的方言转述方法及相关装置,所述方法包括:获取语音文本,并通过预训练的意图识别模型确定所述语音文本对应的转述意图;当所述转述意图为转述方言时,通过预训练的实体识别模型确定所述语音文本对应的方言区域以及转述文本;基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言语音,以将所述语音文本转换为方言语音。本申请通过预设数据库对各方言区域的常用方言进行整合和,然后使用意图识别模型和实体识别模型来确定需要转换为方言转述的转述语句以及转述语句所对应的方言区域,最后在预设数据库
中选取转述语句对应的方言语音,这样可以提高方言转述的准确性,给用户的使用带来方便。
附图说明
[0034]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在不符创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1为本申请提供的基于语音模型的方言转述方法的流程图。
[0036]图2为本申请提供的基于语音模型的方言转述方法的流程示例图。
[0037]图3为本申请提供的基于语音模型的方言转述方法中的实体识别模型的模型结构示意图。
[0038]图4为本申请提供的基于语音模型的方言转述装置的结构原理图。
[0039]图5为本申请提供的终端设备的结构原理图。
具体实施方式
[0040]本申请提供一种基于语音模型的方言转述方法及相关装置,为使本申请的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本申请进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0041]本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音模型的方言转述方法,其特征在于,所述方法包括:获取语音文本,并通过预训练的意图识别模型确定所述语音文本对应的转述意图;当所述转述意图为转述方言时,通过预训练的实体识别模型确定所述语音文本对应的方言区域以及转述文本;基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言语音,以将所述语音文本转换为方言语音。2.根据权利要求1所述的基于语音模型的方言转述方法,其特征在于,所述获取语音文本,并通过预训练的意图识别模型确定所述语音文本对应的转述意图之前,所述方法还包括:构建预设数据库,其中,所述预设数据库包括若干数据组,若干数据组中的每个数据组均包括方言区域、属于所述方言区域的方言文本、所述方言文本对应的方言语音以及方言文本对应的普通话文本。3.根据权利要求2所述的基于语音模型的方言转述方法,其特征在于,所述意图识别模型和所述实体识别模型均预先训练的bert模型。4.根据权利要求1所述的基于语音模型的方言转述方法,其特征在于,所述基于所述方言区域以及所述转述文本在预设数据库内查找所述转述文本对应的方言文本具体包括:在所述预设数据库中查找所述方言区域对应的所有参考数据组;在查找到的所有参考数据组中查找与所述转述文本相匹配的普通话文本,并将所述普通话文本对应的方言文本作为所述转述文本对应的方言文本。5.根据权利要求4所述的基于语音模型的方言转述方法,其特征在于,所述在查找到的所有参考数据组中查找与所述转述文本相匹配的普通话文本具体包括:在所有参考数据组中查找与所述转述文本的文本内容相同的目标普通话文本;若查找到目标普通话文本,则将所述目标普通话文本作为与所述转述文本相匹配的普通话文本;若未查找到目标普通话文本,则通过预训练的bert模型确定各参考数据组中的普通话文本与所述转述文本的相似度,并基于所述相似度确定所述转...

【专利技术属性】
技术研发人员:乔文杰
申请(专利权)人:深圳市易平方网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1