【技术实现步骤摘要】
同名人物的识别处理方法及处理装置
本专利技术涉及人物分类领域,具体而言,涉及一种同名人物的识别处理方法及处理装置。
技术介绍
知识图谱又称为科学知识图谱,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,在各个领域得到了广泛的应用,尤其在同名人物识别领域,往往利用原有的知识图谱进行人物的相似度判断,但这种方法往往忽略了时间变迁导致的人物属性的表更对人物相似度的影响,进而在判断同名人物是够指代同一实体时,存在识别不准确的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种同名人物的识别处理方法及处理装置,以至少解决由于人物属性及关系信息不充分造成的识别同名人物是否指代同一实体不准确的技术问题。根据本专利技术实施例的一个方面,提供了一种同名人物的识别处理方法,包括:获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息;从描述信息中提取包含时间上下文的人物属性和事件信息;计算人物集合中任意两个人物的属性相似度和事件信息相似度;至少基于属性相似度和事件信息相似度确定人物集合中任意两个人物是否为同一人物。可选地,获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息,包括:从知识图谱数据库中提取具有相同姓名的人物集合,以及每个任务集合中获取每一个人物的描述信息。可选地,至少基于属性相似度和事件信息相似度确定人物集合中任意两个人物是否为 ...
【技术保护点】
1.一种同名人物的识别处理方法,其特征在于,包括:/n获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息;/n从所述描述信息中提取包含时间上下文的人物属性和事件信息;/n计算所述人物集合中任意两个人物的属性相似度和事件信息相似度;/n至少基于所述属性相似度和事件信息相似度确定所述人物集合中所述任意两个人物是否为同一人物。/n
【技术特征摘要】
1.一种同名人物的识别处理方法,其特征在于,包括:
获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息;
从所述描述信息中提取包含时间上下文的人物属性和事件信息;
计算所述人物集合中任意两个人物的属性相似度和事件信息相似度;
至少基于所述属性相似度和事件信息相似度确定所述人物集合中所述任意两个人物是否为同一人物。
2.根据权利要求1所述的识别处理方法,其特征在于,获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息,包括:
从人物知识图谱数据库中提取具有相同姓名的人物集合,以及从每个人物集合中获取所述每一个人物的描述信息。
3.根据权利要求1所述的识别处理方法,其特征在于,至少基于所述属性相似度和事件信息相似度确定所述人物集合中所述任意两个人物是否为同一人物,包括:
获取所述目标人物所在的知识图谱中的目标关系相似度;
基于所述属性相似度、所述事件信息相似度和所述目标关系相似度确定所述人物集合中所述任意两个人物是否为同一实体。
4.根据权利要求3所述的识别处理方法,其特征在于,所述目标关系相似度通过以下方式确定:
对所述任意两个人物的亲属关系相似度与社交关系相似度进行加权求和,得到所述目标关系相似度;
其中,所述亲属关系相似度权重系数大于社交关系相似度。
5.根据权利要求3所述的识别处理方法,其特征在于,基于所述属性相似度、所述事件信息相似度和所述目标关系相似度确定所述人物集合中所述任意两个人物是否为同一实体,包括:
对所述属性相似度、所述事件信息相似度和所述目标关系相似度进行加权求和,得到目标相似度;
比较所述目标相似度与设定阈值,若所述目标相似度大于或等于所述设定阈值,则确定所述任意两个人物属于同一实体。
6.根据权利要求3所述的识别处理方法,其特征在于,获取所述任意两个人物在所述目标人物所在的知识图谱中的目标关系相似度之前,还包括:
获取现有的每个人物的关系列表其中,rsubject表示关系主体,rname表示关系名,robject表示关系客体。
7.根据权利要求1所述的识别处理方法,其特征在于,从所述描述信息中提取包含时间上下文的人物属性和事件信息,包括:
对于人物pi,采用时间正则表达式提取描述信息中的时间序列将人物pi描述信息按所述时间序列Ti分段,得到分段文本序列W={W1,W2,...Wn},其中分段文本bk表示文本、表示时间标签,k=1,2,3,…,n。
8.根据权利要求7所述的识别处理方法,其特征在于,采用时间正则表达式提取描述信息中的时间序列将描述信息按所述时间序列Ti分段,得分段文本序列W={W1,W2,...Wn}之后,所述方法包括:
对分段文本依据字典库和依存句法分析工具或关系抽取工...
【专利技术属性】
技术研发人员:吴信东,刘古刘,李磊,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。