【技术实现步骤摘要】
一种同义词语义映射关系确定方法及装置
本申请涉及计算机应用
,特别是涉及一种同义词语义映射关系确定方法及装置。
技术介绍
随着搜索引擎的发展,传统的基于关键词匹配的策略已经无法满足用户的搜索需求,语义匹配策略已经广泛应用于现代搜索引擎中。同义词,是指词条名称不同但这些词条所指代的含义或某个义项所指代的含义相同的词条。作为一种语义匹配资源,同义词在现代搜索引擎中占据着重要的地位。例如,“北京大学”和“北大”构成同义词,则当用户以关键词“北京大学”进行搜索时,搜索引擎能够将包含“北大”相关内容的资源也作为搜索结果展现给用户。同义词关系往往不仅限存在于两个词之间,例如“哈尔滨工程大学”、“哈尔滨工程学院”、“哈尔滨军工大学”、“哈尔滨船舶学院”、“哈工大”、“哈军工”、“哈船舶”......这些词彼此之间都可以构成同义词,对于这种情况,将这些具有同一词义的多个同义词称为一个同义词簇。根据现有的同义词资源处理方法,是在已知的同义词对之间两两建立映射关系。 例如对于上述7个同义词,理论上应存在C〗=21组映射关系,然而在实际应用中,同义词资源需要从大量的语料资源中挖掘 ...
【技术保护点】
一种同义词语义映射关系确定方法,其特征在于,包括:获取对文档资源进行挖掘得到的各组同义词词对;对于每一组同义词词对,确定两个同义词的映射方向;遍历所有同义词词对,根据所确定的映射方向,建立同义词映射关系树,其中,每组映射的起点和终点分别对应于树形结构的父节点和子节点;判断所述同义词映射关系树的收敛程度是否满足预设要求,如果是,则确定该同义词映射关系树收敛到的叶子节点,并确定该叶子节点与其他节点存在同义词映射关系。
【技术特征摘要】
【专利技术属性】
技术研发人员:方高林,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。