电话录音标注方法、装置、设备及存储介质制造方法及图纸

技术编号:31799256 阅读:21 留言:0更新日期:2022-01-08 10:59
本申请涉及语音标注技术领域,公开了一种电话录音标注方法、装置、设备及存储介质,所述方法包括:获取电话录音的音频文件,所述电话录音为机器人角色与客户角色之间对话的录音;对所述音频文件进行语音识别,得到参考标注文本;根据对话的交互顺序对所述参考标注文本进行切分,得到至少一个机器人对白片段和至少一个客户对白片段;生成与所述机器人对白片段和所述客户对白片段一一对应的页面节点;按照所述对话的交互顺序,将所述页面节点在目标页面中纵向排列,并在目标可视区域中显示所述目标页面,并获取标注人员在所述目标页面中对机器人对白片段和所述客户对白片段的标注。本申请结合语音识别模型和人工标注对电话录音进行标注,提高标注的效率和准确度。提高标注的效率和准确度。提高标注的效率和准确度。

【技术实现步骤摘要】
电话录音标注方法、装置、设备及存储介质


[0001]本申请涉及语音标注
,特别地,涉及一种电话录音标注方法、装置、设备及存储介质。

技术介绍

[0002]在智能客服系统的完善过程中,将机器人与客户的通话进行录音,并对电话录音进行标注,以将标注后的电话录音用于后续智能客服系统的训练,有助于提高智能客服系统对语音识别和自然语言处理能力,使智能客服系统更加智能。
[0003]在一些电话录音标注方法中只通过神经网络模型对电话录音进行标注,但是标注的准确性有待提高;或者只通过人工标注的方式对电话录音进行标注,虽然标注的准确性提高,但是纯人工听音、标注耗时较长,操作繁琐。
[0004]因此需要一种标注准确性高的、高效的电话录音标注方法。

技术实现思路

[0005]本申请的目的在于提供一种电话录音标注方法、装置、设备及存储介质,从而可以提高人工对电话录音进行标注的效率。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0007]根据本申请实施例的一个方面,提供了一种电话录音标注方法,所述方法包括:
[0008]获取电话录音的音频文件,所述电话录音为机器人角色与客户角色之间对话的录音;
[0009]对所述音频文件进行语音识别,得到参考标注文本;
[0010]根据对话的交互顺序对所述参考标注文本进行切分,得到至少一个机器人对白片段和至少一个客户对白片段;
[0011]生成与所述机器人对白片段和所述客户对白片段一一对应的页面节点;
[0012]按照所述对话的交互顺序,将所述页面节点在目标页面中纵向排列,并在目标可视区域中显示所述目标页面,以使标注人员在所述目标页面中对机器人对白片段和所述客户对白片段进行标注。
[0013]在本申请的一些实施例中,基于前述方案,所述方法还包括:
[0014]响应于检测到所述目标页面中的按键的预设事件,根据所述目标可视区域对应的当前页面中已标注的页面节点的高度,获取所述目标页面的滚动距离,所述预设事件包括按压事件和/或弹起事件;
[0015]控制所述目标页面根据所述滚动距离依次进行滚动,并在所述目标可视区域中对所述目标页面进行显示。
[0016]在本申请的一些实施例中,基于前述方案,所述根据所述目标可视区域对应的当前页面中已标注的页面节点的高度,获取所述目标页面的滚动距离,包括:
[0017]确定所述目标可视区域对应的当前页面中自顶而下第一段连续已标注的页面节点;
[0018]将所述第一段连续已标注的页面节点的高度之和作为所述滚动距离。
[0019]在本申请的一些实施例中,基于前述方案,所述方法还包括:
[0020]将所述客户对白片段对应的页面节点的第一预设区域关联音频播放组件;
[0021]若在所述预设区域检测到第一目标事件,则播放所述客户对白片段对应的音频片段。
[0022]在本申请的一些实施例中,基于前述方案,所述客户对白片段对应的页面节点包括在所述显示界面中横向排列第一子节点、第二子节点、第三子节点和第四子节点;
[0023]所述第一子节点,用于显示所述客户对白片段;
[0024]所述第二子节点,用于显示所述客户对白片段对应的可选语音识别属性,以使标注人员确定所述客户对白片段的语音识别属性;
[0025]所述第三子节点,用于显示所述客户对白片段对应的可选自然语言处理属性,以使标注人员确定所述客户对白片段的自然语言处理属性;
[0026]所述第四子节点,用于显示所述客户对白片段对应的其他属性,以使标注人员确定所述客户对白片段的属性。
[0027]在本申请的一些实施例中,基于前述方案,所述方法还包括:
[0028]在所述第二子节点的第二预设区域监测第二目标事件;
[0029]若监测到所述第二目标事件,则将所述第二子节点折叠,以使所述第二子节点中的部分内容隐藏;
[0030]在所述第三子节点的第三预设区域监测第三目标事件;
[0031]若监测到所述第三目标事件,则将所述第三子节点折叠,以使所述第三子节点中的部分内容隐藏。
[0032]根据本申请实施例的一个方面,提供了一种电话录音的标注装置,所述装置包括:
[0033]音频文件获取单元,用于获取电话录音的音频文件,所述电话录音为机器人角色与客户角色之间对话的录音;
[0034]语音识别单元,用于对所述音频文件进行语音识别,得到参考标注文本;
[0035]切分单元,用于根据对话的交互顺序对所述参考标注文本进行切分,得到至少一个机器人对白片段和至少一个客户对白片段;
[0036]页面节点生成单元,生成与所述机器人对白片段和所述客户对白片段一一对应的页面节点;
[0037]显示单元,用于按照所述对话的交互顺序,将所述页面节点在目标页面中纵向排列,并在目标可视区域中显示所述目标页面,以使标注人员在所述目标页面中对机器人对白片段和所述客户对白片段进行标注。
[0038]在本申请的一些实施例中,基于前述方案,所述装置还包括:
[0039]滚动距离获取单元,用于响应的当前页面中已标注的页面节点的高度,获取所述目标页面的滚动距离,所述预设事件包括按压事件和/或弹起事件;
[0040]目标页面控制单元,用于控制所述目标页面根据所述滚动距离依次进行滚动,并在所述目标可视区域中对所述目标页面进行显示。
[0041]根据本申请实施例的一个方面,提供了计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行上述电话录音标注方法。
[0042]根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述计算机设备执行时,实现上述电话录音标注方法。
[0043]在本申请一些实施例的技术方案中,通过将电话录音按照对话的交互顺序进行切分并显示在目标可视区域,使得标注人员可在目标可视区域中区分机器人对白片段和客户对白片段,并对机器人对白片段和客户对白片段的参考标注进行人工标注,提高人工标注的效率。
[0044]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0045]通过参照附图详细描述其示例性实施例,本申请的上述和其它特征及优点将变得更加明显。
[0046]图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
[0047]图2示出了根据本申请一个实施例的电话录音标注方法的流程图。
[0048]图3示出了根据本申请一个实施例的一种目标页面的效果图。
[0049]图4示出了根据本申请一个实施例的又一种电话录音标注方法的流程图。
[0050]图5示出了根据本申请一个实施例的一种获取目标页面的滚动距本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电话录音标注方法,其特征在于,所述方法包括:获取电话录音的音频文件,所述电话录音为机器人角色与客户角色之间对话的录音;对所述音频文件进行语音识别,得到参考标注文本;根据对话的交互顺序对所述参考标注文本进行切分,得到至少一个机器人对白片段和至少一个客户对白片段;生成与所述机器人对白片段和所述客户对白片段一一对应的页面节点;按照所述对话的交互顺序,将所述页面节点在目标页面中纵向排列,并在目标可视区域中显示所述目标页面,并获取标注人员在所述目标页面中对机器人对白片段和所述客户对白片段的标注。2.如权利要求1所述的方法,其特征在于,所述方法还包括:响应于检测到所述目标页面中的按键的预设事件,根据所述目标可视区域对应的当前页面中已标注的页面节点的高度,获取所述目标页面的滚动距离,所述预设事件包括按压事件和/或弹起事件;控制所述目标页面根据所述滚动距离依次进行滚动,并在所述目标可视区域中对所述目标页面进行显示。3.如权利要求2所述的方法,其特征在于,所述根据所述目标可视区域对应的当前页面中已标注的页面节点的高度,获取所述目标页面的滚动距离,包括:确定所述目标可视区域对应的当前页面中自顶而下第一段连续已标注的页面节点;将所述第一段连续已标注的页面节点的高度之和作为所述滚动距离。4.如权利要求1所述的方法,其特征在于,所述方法还包括:将所述客户对白片段对应的页面节点的第一预设区域关联音频播放组件;若在所述预设区域检测到第一目标事件,则播放所述客户对白片段对应的音频片段。5.如权利要求4所述的方法,其特征在于,所述客户对白片段对应的页面节点包括在所述显示界面中横向排列第一子节点、第二子节点、第三子节点和第四子节点;所述第一子节点,用于显示所述客户对白片段;所述第二子节点,用于显示所述客户对白片段对应的可选语音识别属性,以使标注人员确定所述客户对白片段的语音识别属性;所述第三子节点,用于显示所述客户对白片段对应的可选自然语言处理属性,以使标注人员确定所述客户对白片段的自然语言处理属性;所述第...

【专利技术属性】
技术研发人员:杨声钟
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1