语音数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:23988030 阅读:31 留言:0更新日期:2020-04-29 14:32
本申请涉及一种语音数据处理方法、装置、计算机设备和存储介质。方法包括:获取语音数据以及语音数据对应的标注文本数据;获取标注文本数据对应的第一交互响应结果;将语音数据转化为目标文本数据;获取目标文本数据对应的第二交互响应结果;当第一交互响应结果和第二交互响应结果相匹配时,确定目标文本数据为正确文本数据。采用本申请的方案能够提高对语音转文字进行评估的准确性。

Speech data processing methods, devices, computer equipment and storage media

【技术实现步骤摘要】
语音数据处理方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种语音数据处理方法、装置、计算机设备和计算机可读存储介质。
技术介绍
随着自然语言技术的发展,出现了语音识别技术。在语音识别中,会存在识别错误的情况。传统的技术中通常采用将语音数据转化为待评估文本数据,再将待评估文本数据与该语音数据对应的标注文本数据进行比较,从而评估语音识别结果的准确率。然而,目前的语音数据处理方法,存在对准确率评估不准确的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种语音数据处理方法、装置、计算机设备和计算机存储介质,能够提高对语音转文字进行评估的准确性。一种语音数据处理方法,所述方法包括:获取语音数据以及所述语音数据对应的标注文本数据;获取所述标注文本数据对应的第一交互响应结果;将所述语音数据转化为目标文本数据;获取所述目标文本数据对应的第二交互响应结果;当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据。一种语音数据处理装置,所述装置包括:第一获取模块,用于获取语音数据以及所述语音数据对应的标注文本数据;所述第一获取模块,还用于获取所述标注文本数据对应的第一交互响应结果;转化模块,用于将所述语音数据转化为目标文本数据;第二获取模块,用于获取所述目标文本数据对应的第二交互响应结果;确定模块,用于当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取语音数据以及所述语音数据对应的标注文本数据;获取所述标注文本数据对应的第一交互响应结果;将所述语音数据转化为目标文本数据;获取所述目标文本数据对应的第二交互响应结果;当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取语音数据以及所述语音数据对应的标注文本数据;获取所述标注文本数据对应的第一交互响应结果;将所述语音数据转化为目标文本数据;获取所述目标文本数据对应的第二交互响应结果;当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据。上述语音数据处理方法、装置、计算机设备和存储介质,获取语音数据以及语音数据对应的标注文本数据,获取标注文本数据对应的第一交互响应结果,即获取了正确的文本数据以及正确的交互响应结果;将语音数据转化为目标文本数据,获取目标文本数据对应的第二交互响应结果,当第一交互响应结果和第二交互响应结果相匹配时,确定目标文本数据为正确文本数据,即将交互响应结果作为影响语音转化正确率的因素,与传统技术仅仅通过字准确率评估语音转化正确率相比,充分考虑语音数据的交互应用场景,提高对语音转文字进行评估的准确性。附图说明图1为一个实施例中语音数据处理方法的应用环境图;图2为一个实施例中语音数据处理方法的流程示意图;图3为另一个实施例中语音数据处理方法的流程示意图;图4为又一个实施例中语音数据处理方法的流程示意图;图5为一个实施例中将语音数据转化为目标文本数据的流程示意图;图6为一个实施例中语音数据处理装置的结构框图;图7为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例中提供的语音数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。语音数据处理方法也可仅应用于终端102或者仅应用于服务器104中。本申请中实施例中提供的语音数据处理方法可应用于在会话场景中对语音转化正确率的评估。在一个实施例中,如图2所示,为一个实施例中语音数据处理方法的流程示意图,以语音数据处理方法应用于图1中的终端为例进行说明,包括以下步骤:步骤202,获取语音数据以及语音数据对应的标注文本数据。具体地,终端可获取待测试的语音数据以及该语音数据对应的标注文本数据。其中,该语音数据可以转化为文本数据。该语音数据可以是用户表达出来的语音数据。语音数据可以是指一句话,也可以包含至少两句话。例如针对电话外呼催收场景,会收集线上的催收录音,整理成语音测试集,并进行标注。标注文本数据是指对该语音数据进行标注得到的文本数据。标注文本数据可以是管理员标注的文本数据。标注文本数据即可视为该语音数据的正确标注。本实施例中,终端可从服务器中获取语音数据以及语音数据对应的标注文本数据。步骤204,获取标注文本数据对应的第一交互响应结果。其中,在终端上可包含电话机器人模块。其中,电话机器人模块用于对语音数据转化而成的文本数据产生交互响应结果。即电话机器人用于对用户发出的语音数据进行回应。第一交互响应结果即为电话机器人对标注文本数据所产生的响应结果。具体地,终端将标注文本数据输入至电话机器人模块,得到标注文本数据对应的第一交互响应结果。例如,语音数据为“我手头紧没有钱,可以明天还款吗?”标注文本数据可为“我手头紧没有钱可以明天还款吗”。第一交互响应结果可以是“可以明天还款”、“可以”、“不可以”等不限于此。本实施例中,终端可从服务器中获取标注文本数据对应的第一交互响应结果。步骤206,将语音数据转化为目标文本数据。具体地,终端可将语音数据输入至语音识别模型中进行转化,得到目标文本数据。步骤208,获取目标文本数据对应的第二交互响应结果。其中,第二交互响应结果可以与第一交互响应结果相同,也可以不相同。具体地,终端将目标文本数据输入至电话机器人模块,得到目标文本数据对应的第二交互响应结果。同样地,例如,语音数据为“我手头紧没有钱,可以明天还款吗?”目标文本数据可以为“我手头紧没钱可以明天还款吗”等不限于此。第二交互响应结果可以是“可以的”、“不可以”、“可以明天还款”等不限于此。步骤210,当第一交互响应结果和第二交互响应结果相匹配时,确定目标文本数据为正确文本数据。具体地,当第一交互响应结果和第二交互响应结果相一致时,确定目标文本数据为正确文本数据。或者,终端可计算第一交互响应结果和第二交互响应结果的匹配度阈值。当第一交互响应结果和第二交互响应结果达到匹配度阈值时,本文档来自技高网...

【技术保护点】
1.一种语音数据处理方法,所述方法包括:/n获取语音数据以及所述语音数据对应的标注文本数据;/n获取所述标注文本数据对应的第一交互响应结果;/n将所述语音数据转化为目标文本数据;/n获取所述目标文本数据对应的第二交互响应结果;/n当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据。/n

【技术特征摘要】
1.一种语音数据处理方法,所述方法包括:
获取语音数据以及所述语音数据对应的标注文本数据;
获取所述标注文本数据对应的第一交互响应结果;
将所述语音数据转化为目标文本数据;
获取所述目标文本数据对应的第二交互响应结果;
当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据。


2.根据权利要求1所述的方法,其特征在于,所述获取所述目标文本数据对应的第二交互响应结果,包括:
对所述目标文本数据进行意图识别,得到目标特征数据;
根据所述目标特征数据获取对应的第二交互响应结果。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标特征数据获取对应的第二交互响应结果,包括:
根据所述目标特征数据确定所述语音数据对应的问答节点;
根据所述问答节点获取对应的第二交互响应结果。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述语音数据包括句子语音数据,所述标注文本数据包括标注句子文本数据,所述目标文本数据包括目标句子文本数据;
所述当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标文本数据为正确文本数据,包括:
当所述第一交互响应结果和所述第二交互响应结果相匹配时,确定所述目标句子文本数据为正确句子文本数据。


5.根据权利要求1所述的方法,其特征在于,所述标注文本数据包括至少两个标注句子文本数据;所述第一交互响应结果包括每个标注句子文本数据对应的参考交互响应结果;
所述将所述语音数据转化为目标文本数据,包括:
将所述语音数据按照句子进行划分,得到至少两个句子语音数据;
对所述至少两个句子语音数据中每个句子语音数据进行转化,得到每个句子语音数据对应的目标句子文本数据;
获取所述目标文本数据对应的第二交互响应结果,包括:
将所述目标句子文本数据与问答节点集中的问答节点进行匹配,得到所述目标句子文本数据对应的问答节点;
根据所述...

【专利技术属性】
技术研发人员:王晓明
申请(专利权)人:深圳追一科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1