用于语料处理的质量控制方法及装置制造方法及图纸

技术编号:20724906 阅读:35 留言:0更新日期:2019-03-30 17:41
本申请公开了一种用于语料处理的质量控制方法及装置。该方法包括接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众包任务满足第二质量控制条件,则将所述改述语料入库。本申请解决了当获得用于自然语言生成的相关语料后无法确保语料的质量的问题技术问题。通过本申请可综合众包质量控制方法,并利用NLP自然语言处理技术、各类指标,可以监控发布的众包任务结果的正确性、多样性和自然性。

【技术实现步骤摘要】
用于语料处理的质量控制方法及装置
本申请涉及自然语言生成领域,具体而言,涉及一种用于语料处理的质量控制方法及装置。
技术介绍
自然语言生成(英文全称:NaturalLanguageGeneration,简称:NLG)是任务导向型对话系统的重要组成模块之一。专利技术人发现,当获得用于自然语言生成的相关语料后无法确保语料的质量,进一步影响到高质量语料数据的收集。针对相关技术中当获得用于自然语言生成的相关语料后无法确保语料的质量的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种用于语料处理的质量控制方法及装置,以解决当获得用于自然语言生成的相关语料后无法确保语料的质量的问题。为了实现上述目的,根据本申请的一个方面,提供了一种用于语料处理的质量控制方法。根据本申请的用于语料处理的质量控制方法包括:接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众本文档来自技高网...

【技术保护点】
1.一种用于语料处理的质量控制方法,其特征在于,包括:接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众包任务满足第二质量控制条件,则将所述改述语料入库。

【技术特征摘要】
1.一种用于语料处理的质量控制方法,其特征在于,包括:接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众包任务满足第二质量控制条件,则将所述改述语料入库。2.根据权利要求1所述的质量控制方法,其特征在于,判断所述改述语料是否满足第一质量控制条件包括:在所述改述语料生成和上传时,判断是否满足质量控制预处理要求;以及如果判断满足质量控制预处理要求,则判断所述改述语料中是否覆盖预设的信息类型和信息类型数值。3.根据权利要求1所述的质量控制方法,其特征在于,判断所述校验众包任务是否满足第二质量控制条件包括:发布包含任务题干和众包模板的校验众包任务;以及接收对于所述任务题干和所述众包模板是否含义一致但是表述不同的校验判断结果。4.根据权利要求1所述的质量控制方法,其特征在于,接收通过众包任务获得的改述语料的过程中还包括:测评众包任务的执行者;判断所述执行者的任务完成指标;以及将所述任务完成指标结果可视化。5.根据权利要求1所述的质量控制方法,其特征在于,接收通过众包任务获得的改述语料的过程中还包括:测评众包任务的任务完成结果;判断所述任务完成结果是否满足改述语料的预设因素指标,其中,所述预设因素指标至少包括:准确判断因子、多样判断因子以及自然判断因子。6.一种用于语料处理的质量控制装置,其特征在于,包括:接收模块,用于接收通...

【专利技术属性】
技术研发人员:周义廷汪冠春胡一川张海雷
申请(专利权)人:北京来也网络科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1