【技术实现步骤摘要】
用于语料处理的质量控制方法及装置
本申请涉及自然语言生成领域,具体而言,涉及一种用于语料处理的质量控制方法及装置。
技术介绍
自然语言生成(英文全称:NaturalLanguageGeneration,简称:NLG)是任务导向型对话系统的重要组成模块之一。专利技术人发现,当获得用于自然语言生成的相关语料后无法确保语料的质量,进一步影响到高质量语料数据的收集。针对相关技术中当获得用于自然语言生成的相关语料后无法确保语料的质量的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种用于语料处理的质量控制方法及装置,以解决当获得用于自然语言生成的相关语料后无法确保语料的质量的问题。为了实现上述目的,根据本申请的一个方面,提供了一种用于语料处理的质量控制方法。根据本申请的用于语料处理的质量控制方法包括:接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以 ...
【技术保护点】
1.一种用于语料处理的质量控制方法,其特征在于,包括:接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众包任务满足第二质量控制条件,则将所述改述语料入库。
【技术特征摘要】
1.一种用于语料处理的质量控制方法,其特征在于,包括:接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众包任务满足第二质量控制条件,则将所述改述语料入库。2.根据权利要求1所述的质量控制方法,其特征在于,判断所述改述语料是否满足第一质量控制条件包括:在所述改述语料生成和上传时,判断是否满足质量控制预处理要求;以及如果判断满足质量控制预处理要求,则判断所述改述语料中是否覆盖预设的信息类型和信息类型数值。3.根据权利要求1所述的质量控制方法,其特征在于,判断所述校验众包任务是否满足第二质量控制条件包括:发布包含任务题干和众包模板的校验众包任务;以及接收对于所述任务题干和所述众包模板是否含义一致但是表述不同的校验判断结果。4.根据权利要求1所述的质量控制方法,其特征在于,接收通过众包任务获得的改述语料的过程中还包括:测评众包任务的执行者;判断所述执行者的任务完成指标;以及将所述任务完成指标结果可视化。5.根据权利要求1所述的质量控制方法,其特征在于,接收通过众包任务获得的改述语料的过程中还包括:测评众包任务的任务完成结果;判断所述任务完成结果是否满足改述语料的预设因素指标,其中,所述预设因素指标至少包括:准确判断因子、多样判断因子以及自然判断因子。6.一种用于语料处理的质量控制装置,其特征在于,包括:接收模块,用于接收通...
【专利技术属性】
技术研发人员:周义廷,汪冠春,胡一川,张海雷,
申请(专利权)人:北京来也网络科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。