【技术实现步骤摘要】
本专利技术设计领域,尤其涉及一种冲突检验方法以及计算机系统。
技术介绍
标签是互联网环境中用于描述特定资源的一个或多个词语的集合,标签的准确度直接影响到资源的个性化推荐、营销等互联网应用的效率。因此,提升标签的准确度具有重要的商业价值。然而在为资源打上标签的过程中,由于用户身份发生改变、人工标注不规范、机器标注不完善等各种原因,标签的准确度并不高,甚至标签中的词语会出现语义冲突。为了提升标签的准确度,现有技术中一般会对标签中的词语进行冲突检验,进而判定标签中是否存在语义冲突的词语。但是,现有技术中并没有提供足够高效的冲突检验方法。例如在判断“资深美女”与“购物狂人”之间是否存在冲突的时候,现有技术需要依次判断“资深美女”的每个同义词与“购物狂人”的每个同义词之间是否存在冲突。若“资深美女”有M个同义词,“购物狂人”有N个同义词,则判断的总次数为M×N。在M、N较大的时候,该冲突检验操作会花费较长的时间和较多的计算资源,检验效率非常低下。
技术实现思路
本专利技术提供了一种冲突检验方法,用于提高计算机系统的冲突检验效率。本专利技术还提供了相关的计算机系统以及冲突检验装置。本专利技术的第一方面提供了一种冲突检验方法,其中,计算机系统获取待检验的第一词语和第二词语,并获取概念标识对应表。其中,概念标识对应表中记录了多个概念标识,以及每个概念标识对应的一个或多个词语,且一个概念标识对应的多个词 ...
【技术保护点】
一种冲突检验方法,适用于计算机系统,其特征在于,包括:获取待检验的第一词语与第二词语;获取概念标识对应表,所述概念标识对应表中记录了多个概念标识和每个概念标识对应的一个或多个词语;根据所述概念标识对应表,确定所述第一词语对应的第一概念标识,并确定所述第二词语对应的第二概念标识;判断所述第一概念标识与所述第二概念标识是否互为反义;若判断结果为是,则确定所述第一词语与所述第二词语冲突。
【技术特征摘要】
1.一种冲突检验方法,适用于计算机系统,其特征在于,包括:
获取待检验的第一词语与第二词语;
获取概念标识对应表,所述概念标识对应表中记录了多个概念标识和每
个概念标识对应的一个或多个词语;
根据所述概念标识对应表,确定所述第一词语对应的第一概念标识,并
确定所述第二词语对应的第二概念标识;
判断所述第一概念标识与所述第二概念标识是否互为反义;
若判断结果为是,则确定所述第一词语与所述第二词语冲突。
2.根据权利要求1所述的冲突检验方法,其特征在于,所述获取概念标
识对应表包括:
从同义词词库中获取多个同义词组,每个同义词组包括至少两个互为同
义的词语;
为所述每个同义词组设置对应的概念标识,并根据所述每个同义词组包
括的词语和所述每个同义词组对应的概念标识生成所述概念标识对应表。
3.根据权利要求1或2所述的冲突检验方法,其特征在于,所述判断所
述第一概念标识与所述第二概念标识是否互为反义包括:
获取所述概念标识对应表中的概念标识之间的逻辑拓扑关系图,所述逻
辑拓扑关系图中,相邻的两个概念标识之间的逻辑拓扑关系包括:反义拓扑
关系或非反义拓扑关系;
在所述逻辑拓扑关系图中,判断所述第一概念标识与所述第二概念标识
之间的反义拓扑关系的个数;
若所述第一概念标识与所述第二概念标识之间的反义拓扑关系的个数为
奇数,则确定所述第一概念标识与所述第二概念标识互为反义。
4.根据权利要求3所述的冲突检验方法,其特征在于,所述获取所述概
念标识对应表中的概念标识之间的逻辑拓扑关系图包括:
从反义词词库中获取反义词组,所述反义词组中包括互为反义的第三词
语和第四词语;
根据所述概念标识对应表,确定所述第三词语对应的第三概念标识,以
及所述第四词语对应的第四概念标识;
在所述第三概念标识与所述第四概念标识之间建立反义拓扑关系并存入
所述逻辑拓扑关系图。
5.根据权利要求3或4所述的冲突检验方法,其特征在于,所述获取所
述概念标识对应表中的概念标识之间的逻辑拓扑关系图包括:
从上下位词库中获取上下位词组,上下位词组中包括互为上下位的第五
词语和第六词语;
根据所述概念标识对应表,确定所述第五词语对应的第五概念标识,以
及所述第六词语对应的第六概念标识;
在所述第五概念标识和所述第六概念标识之间建立...
【专利技术属性】
技术研发人员:沈志宏,钟伟才,季振峰,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。