【技术实现步骤摘要】
关键词标注审核系统及审核方法
[0001]本专利技术属于自然语言处理
,应用于关键词标注后的审核过程中,具体为关键词标注审核系统及审核方法。
技术介绍
[0002]在自然语言处理的分词、命名实体识别和关键词抽取等过程中,标注高质量的关键词能极大提升系统算法性能。对关键词标注结果的审核,则是保障优质标注的重要手段。而标注审核的质量,依赖于专业知识和关键词上下文等信息,在对特定领域内的语料库标注的审核尤其如此。
[0003]关键词标注审核的效率,取决于审核工具、审核方法和标注工具等因素。现有技术中,往往只注重于如何对关键词进行标注的过程,却忽视了在特定领域需要对已标注关键词进行严格审核的过程。当前能实现关键词标注的系统有很多,比如Doccano、SUTDAnnotator等,但能够高质高效审核标注结果的系统却几乎没有研究或提及。当面临审核任务时,通常直接将关键词标注系统用于审核工作,或是基于关键词标注系统,定制一些审核功能。所以,审核在自然语言处理
,尤其是各类标注工作中,往往是被忽视的部分;但是此部分内容在 ...
【技术保护点】
【技术特征摘要】
1.关键词标注审核系统,其特征在于:包括数据生成模块和审核交互模块;所述数据生成模块用于获取关键词的标注数据,并将关键词的标注数据输出至审核交互模块;所述审核交互模块用于接收并展示关键词的标注数据,同时为关键词的标注审核提供交互操作。2.根据权利要求1所述的关键词标注审核系统,其特征在于,数据生成模块获取的关键词的标注数据,包括:关键词、关键词的上下文、关键词的选定标签和关键词的候选标签。3.根据权利要求1所述的关键词标注审核系统,其特征在于:所述审核交互模块,包括关键词交互模块、上下文交互模块和标签交互模块;所述数据生成模块,用于将关键词的标注数据中,由多个关键词构成的序列,输出至所述关键词交互模块中,并根据关键词交互模块设置的焦点关键词,将焦点关键词的上下文信息输出至所述上下文交互模块中,将焦点关键词的选定标签和候选标签输出至所述标签交互模块中。4.根据权利要求3所述的关键词标注审核系统,其特征在于:所述关键词交互模块,用于展示关键词序列,提供关键词交互操作;所述关键词交互操作包括:从关键词序列中删除关键词;设置关键词序列中的某一个关键词为焦点关键词。5.根据权利要求3所述的关键词标注审核系统,其特征在于:所述上下文交互模块,用于展示焦点关键词的上下文,提供上下文交互操作;所述上下文交互操作包括:删除焦点关键词的上下文。6.根据权利要求3所述的关键词标注审核系统,其特征在于:所述标签交互模块,用于展示焦点关键词的选定标签和候选标签,提供标签交互操作;所述标签交互操作包括:将焦点关键词的选定标签更改为候选标签;将焦点关键词的候选标签更改为选定标签。7....
【专利技术属性】
技术研发人员:钱基德,钮益峰,陈亚青,孙宏,徐海文,高浩然,秦小林,曾昶畅,梁琰,钱基业,
申请(专利权)人:中国民用航空飞行学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。