语音语料标注的处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号：36084513 阅读：34 留言：0更新日期：2022-12-24 10:59

本申请属于人工智能技术领域，提供了一种语音语料标注的处理方法、装置、计算机设备及计算机可读存储介质，为了解决传统技术中语音语料标注的处理效率较低的问题，通过获取语音语料标注属性，并确定对应的语音语料标注模式标识，再显示对应的标注模式配置项模板，并由用户确定配置项，且根据配置项构建语音语料标注模式，再获取语音语料，并根据语音语料标注模式，将语音语料进行处理，得到标注结果，实现了对语音语料进行处理所采用的语音语料标注模式的定制化配置，针对不同的标注任务采用对应的定制化的语音语料标注模式，提高语音语料标注的处理效率，降低标注成本，进而提高人机交互模型的训练效率，并提高人工智能的智能化水平。水平。水平。

全部详细技术资料下载

【技术实现步骤摘要】
语音语料标注的处理方法、装置、设备及可读存储介质

[0001]本申请涉及人工智能
，尤其涉及一种语音语料标注的处理方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]人机交互在越来越多的人工智能场景中得到应用，例如，在电商业务中，基于人机交互，采用智能客服机器人提供售前或者售后的自动服务，人机对话为人机交互的重要内容。为了提高人机对话的质量，通常会收集大量的对话语料，并采用对话语料对人机对话中的模型进行训练，以便训练出的模型能够响应用户的会话，从而产生对话。其中，模型训练效率在很大程度上依赖于对话语料的收集及对对话语料的标注效率，对话语料一般包括语音识别语料与自然语言语义识别语料，尤其随着系统既支持语音输入，又支持文字输入，智能客服机器人应对的语料环境也越来越丰富。因此，如何对语音识别语料与自然语言语义识别语料进行高效的标注，对提高模型的训练效率十分重要。
[0003]传统的语音识别语料标注和自然语言语义识别语料标注，两种标注方式虽然同步标注，但标注模式过于单一，导致不能满足标注团队的标注需要，...

【技术保护点】

【技术特征摘要】
1.一种语音语料标注的处理方法，其特征在于，包括：获取语音语料标注属性，并根据所述语音语料标注属性，确定语音语料标注模式标识，其中，所述语音语料标注属性描述对语音语料进行标注的处理方式需求；显示所述语音语料标注模式标识所对应的标注模式配置项模板；获取用户确定的所述标注模式配置项模板所包含的配置项，并根据所述配置项，构建语音语料标注模式；获取语音语料，并根据所述语音语料标注模式，将所述语音语料进行处理，得到所述语音语料的标注结果。2.根据权利要求1所述语音语料标注的处理方法，其特征在于，所述配置项包括语音语料筛选项与标注任务分配项中的至少一种。3.根据权利要求1或者2所述语音语料标注的处理方法，其特征在于，所述获取用户确定的所述标注模式配置项模板所包含的配置项，包括：响应用户选取所述标注模式配置项模板所包含的配置项的选取指令，获取配置项。4.根据权利要求1所述语音语料标注的处理方法，其特征在于，所述根据所述语音语料标注模式，将所述语音语料进行处理，包括：获取标注结果筛选条件，并根据所述标注结果筛选条件，获取目标标注结果及所述目标标注结果所对应的上下文信息；根据所述目标标注结果与所述上下文信息，判断所述目标标注结果是否正确；若所述目标标注结果不正确，将所述目标标注结果进行校正。5.根据权利要求4所述语音语料标注的处理方法，其特征在于，所述获取标注结果筛选条件，包括识别所述语音语料包含的用户标识，并将所述用户标识作为标注结果筛选条件。6.根据权利要求1所述语音语料标注的处理方法，其特征在于，所述获取语音语料，...

【专利技术属性】
技术研发人员：杨声钟，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人