语音处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:36979875 阅读:11 留言:0更新日期:2023-03-25 17:59
本说明书公开了一种语音处理方法、装置、存储介质及电子设备,其中,方法包括:通过对目标语音数据进行语义识别处理以确定目标语音数据对应的至少一个目标语义标签,然后可以基于目标语音数据对应的各目标语义标签对参考语音集合进行语音匹配处理,可以得到目标语音数据对应的相似语音数据。数据对应的相似语音数据。数据对应的相似语音数据。

【技术实现步骤摘要】
语音处理方法、装置、存储介质及电子设备


[0001]本申请涉及计算机
,尤其涉及一种语音处理方法、装置、存储介质及电子设备。

技术介绍

[0002]语音处理技术是信息处理领域的一个重要分支,也是现今语音识别和语音评价系统的主要核心技术。随着科技的发展,语音处理技术应用越来越广泛。在用户处于诸如购物场景、出行场景、视听场景等事务场景下,用户的语音数据可以反馈高价值的共性问题,对事务场景的场景体验改善具有参考意义。

技术实现思路

[0003]本说明书提供了一种语音处理方法、装置、存储介质及电子设备,所述技术方案如下:
[0004]第一方面,本说明书提供了一种语音处理方法,所述方法包括:
[0005]对目标语音数据进行语义识别处理,得到所述目标语音数据对应的至少一个目标语义标签;
[0006]基于所述至少一个目标语义标签对参考语音集合进行语音匹配处理,得到所述目标语音数据对应的相似语音数据。
[0007]第二方面,本说明书提供了一种语音处理装置,所述装置包括:
[0008]标签确定模块,用于对目标语音数据进行语义识别处理,得到所述目标语音数据对应的至少一个目标语义标签;
[0009]语音匹配模块,用于基于所述至少一个目标语义标签对参考语音集合进行语音匹配处理,得到所述目标语音数据对应的相似语音数据。
[0010]第三方面,本说明书提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
[0011]第四方面,本说明书提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0012]第五方面,本说明书提供一种计算机程序产品,所述计算机程序产品存储有至少一条指令,所述至少一条指令由处理器加载并执行上述的方法步骤。
[0013]本说明一些实施例提供的技术方案带来的有益效果至少包括:
[0014]在本说明书一个或多个实施例中,通过对目标语音数据进行语义识别处理确定目标语音数据对应的至少一个目标语义标签,然后基于至少一个目标语义标签对参考语音集合中的若干参考语音数据进行语音匹配处理,就可以得到目标语音数据对应的若干相似语音数据。整个语音处理阶段,避免采用对大量语音文本进行聚类的方式,基于目标语音数据的目标语义标签可以实现对参考语音集合的快速匹配,优化了语音处理流程、减小了语音处理计算量;可以实现实时语音处理以实时反馈相似语音,提升了语音处理的时效性。
附图说明
[0015]为了更清楚地说明本说明书或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是本说明书提供的一种语音处理系统的场景示意图;
[0017]图2是本说明书提供的一种语音处理方法的流程示意图;
[0018]图3是本说明书提供的一种语音处理方法的流程示意图;
[0019]图4是本说明书提供的一种语音处理装置的结构示意图;
[0020]图5是本说明书提供的一种系数确定模块的结构示意图;
[0021]图6是本说明书提供的一种向量构建单元的结构示意图;
[0022]图7是本说明书提供的一种语音处理单元的结构示意图;
[0023]图8是本说明书提供的一种系数确定模块的结构示意图;
[0024]图9是本说明书提供的一种结果确定模块的结构示意图;
[0025]图10是本说明书提供的一种电子设备的结构示意图。
具体实施方式
[0026]下面将结合本说明书中的附图,对本说明书中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0028]在相关技术中,在用户处于诸如购物场景、出行场景、视听场景等事务场景下,会存在需要从大量用户语音数据中搜寻若干相似语音的情形,如,针对某个目标语音搜索目标语音的同类相似语音,以基于若干相似语音以及目标语音进一步分析和改善事务场景体验。通常会对目标语音数据和大量用户语音数据均转换为语音文本,采用对所有语音文本进行纯文本聚类的方式实现,如常用的使用文本聚类算法会对所有语音文本进行文本聚类,会得到至少一个类别下的多组相似语音文本,而某个类别下的多组相似语音文本对应的原语音数据可作为一组相似语音。采用类似文本聚类的方式,语音处理流程繁琐、语义处理计算量大,时效性也较差,通常只能离线计算,无法反映实时动态的相似语音情形。
[0029]请参见图1,为本说明书提供的一种语音处理系统的场景示意图。如图1所示,所述语音处理系统至少可以包括客户端集群和服务平台100。
[0030]所述客户端集群可以包括至少一个客户端,如图1所示,具体包括用户1对应的客户端1、用户2对应的客户端2、

、用户n对应的客户端n,n为大于0的整数。
[0031]客户端集群中的各客户端可以是具备通信功能的电子设备,该电子设备包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中电子设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的电子设备等。
[0032]所述服务平台100可以是单独的服务器设备,例如:机架式、刀片、塔式、或者机柜式的服务器设备,或采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是采用多个服本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法,所述方法包括:对目标语音数据进行语义识别处理,得到所述目标语音数据对应的至少一个目标语义标签;基于所述至少一个目标语义标签对参考语音集合进行语音匹配处理,得到所述目标语音数据对应的相似语音数据。2.根据权利要求1所述的方法,所述基于所述至少一个目标语义标签对参考语音集合进行语音匹配处理,得到所述目标语音数据对应的相似语音数据,包括:基于所述至少一个目标语义标签采用至少一个话题模板规则对所述目标语音数据进行话题匹配处理,得到所述目标语音数据对应的目标话题;基于所述目标话题对参考语音集合进行语音匹配处理,得到所述目标语音数据对应的相似语音数据。3.根据权利要求2所述的方法,所述基于所述至少一个目标语义标签采用至少一个话题模板规则对所述目标语音数据进行话题匹配处理,得到所述目标语音数据对应的目标话题,包括:获取至少一个话题模板规则对应的语义标签规则;从各所述语义标签规则中确定所述至少一个目标语义标签匹配的目标标签规则,获取所述目标标签规则对应的第一话题;基于所述第一话题确定所述目标语音数据对应的目标话题。4.根据权利要求3所述的方法,所述语义标签规则为标签逻辑规则,所述获取至少一个话题模板规则对应的语义标签规则,从各所述语义标签规则中确定所述至少一个目标语义标签匹配的目标标签规则,包括:获取至少一个话题模板规则对应的标签逻辑规则;检测所述至少一个目标语义标签是否与各所述标签逻辑规则匹配,得到标签匹配结果;基于所述标签匹配结果,确定所述至少一个目标语义标签匹配的目标标签规则。5.根据权利要求3所述的方法,所述获取至少一个话题模板规则对应的语义标签规则之后,还包括:获取至少一个话题模板规则对应的关键信息规则和/或混合信息规则,所述混合信息规则为由语义标签与关键信息构成的模板规则;所述基于所述第一话题确定所述目标语音数据对应的目标话题,包括:从各所述关键信息规则中确定所述目标语音数据匹配的目标关键信息规则,获取所述目标关键信息规则对应的第二话题;基于所述第一话题和所述第二话题中的至少一种确定所述目标语音数据对应的目标话题;或,从各所述混合信息规则中确定所述目标语音数据匹配的目标混合信息规则,获取所述目标混合信息规则对应的第三话题;基于所述第一话题和所述第三话题中的至少一种确定所述目标语音数据对应的目标话题;或,从各所述关键信息规则中确定所述目标语音数据匹配的目标关键信息规则,获取所述目标关键信息规则对应的第二话题;从各所述混合信息规则中确定所述目标语音数据匹配的目标混合信息规则,获取所述目标混合信息规则对应的第三话题;基于所述第一话题、所
述第二话题以及所述第三话题中的至少一种确定所述目标语音数据对应的目标话题。6.根据权利要求5所述的方法,所述从各所述关键信息规则中确定所述目标语音数据匹配的目标关键信息规则,包括:基于各所述关键信息规则分别对所述目标语音数据进行信息检测处理,得到信息检测结果;基于所述信息检测结果确定所述目标语音数据匹配的目标关键信息规则。7.根据权利要求6所述的方法,所述基于各所述关键信息规则分别对所述目标语音数据进行关键信息检测处理,得到信息检测结果,包括:基于各所述关键信息规则对应的信息逻辑规则分别对所述目标语音数据进行关键信息逻辑检测处理,得到逻辑检测结果;和/或,基于各所述关键信息规则对应的信息顺序规则分别对所述目标语音数据进行关键信息顺序检测处理,得到顺序检测结果;和/或,基于各所述关键信息规则对应的信息间距规则分别对所述目标语音数据进行关键信息间距检测处理,得到间距检测结果。8.根据权利要求5所述的方法,所述从各所述混合信息规则中确定所述目标语音数据匹配的目标混合信息规则,包括:所述混合信息规则为语义标签与关键信息共同对应的信息元素逻辑规则;基于各所述信息元素逻辑规则分别对所述目标语音数据进行元素逻辑检测处理,得到元素逻辑检测结果;基于所述元素逻辑检测结果确定所述目标语音数据匹配的目标混合信息规则。9.根据权利要求2所述的方法,所述确定目标语音数据对应的至少一个目标语义标签之前,还包括:基于参...

【专利技术属性】
技术研发人员:袁翔张伟张飞
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1