一种演职人员命名实体消歧方法及系统技术方案

技术编号:24457853 阅读:37 留言:0更新日期:2020-06-10 16:05
本申请实施例示出一种演职人员命名实体消歧方法及系统,本申请实施例示出的技术方案中,所述方法包括:获取演职人员信息,其中,所述演职人员信息包括姓名;根据所述演职人员信息,确定歧义姓名,所述歧义姓名是指数量不小于两个的姓名;利用搜索引擎,确定所述歧义姓名对应的搜索信息;根据所述演职人员信息和搜索信息,处理歧义姓名对应的演职人员信息。本申请实施例中,通过利用搜索引擎,得到搜索信息,通过搜索信息和媒资库中的演职人员信息的对应关系,处理歧义姓名对应的演职人员信息。

A method and system for disambiguation of actor named entity

【技术实现步骤摘要】
一种演职人员命名实体消歧方法及系统
本专利技术涉及软件
,特别涉及一种演职人员命名实体消歧方法及系统。
技术介绍
利用智能电视上的软件播放电视剧、电影等艺术作品时,通常通过媒资库存储艺术作品的相关信息,相应的,电视剧的演职人员信息会存在媒资库中。但是经常出现同一演职人员的演职人员信息多次存储在媒资库中,造成占用媒资库的大量资源。所以,如何避免媒资库中存储有同一演职人员的多个演职人员信息成为本领域技术人员亟待解决的问题。
技术实现思路
基于上述技术问题,本专利技术的专利技术目的在于提供一种演职人员命名实体消歧方法及系统。本申请实施例第一方面示出一种演职人员命名实体消歧方法,包括:获取演职人员信息,其中,所述演职人员信息包括姓名;根据所述演职人员信息,确定歧义姓名,所述歧义姓名是指数量不小于两个的姓名;利用搜索引擎,确定所述歧义姓名对应的搜索信息;根据所述演职人员信息和搜索信息,处理歧义姓名对应的演职人员信息。本申请实施例第二方面示出一种演职人员命名实体消歧装置,包括:服务器本文档来自技高网...

【技术保护点】
1.一种演职人员命名实体消歧方法,其特征在于,包括:/n获取演职人员信息,其中,所述演职人员信息包括姓名;/n根据所述演职人员信息,确定歧义姓名,所述歧义姓名是指数量不小于两个的姓名;/n利用搜索引擎,确定所述歧义姓名对应的搜索信息;/n根据所述演职人员信息和搜索信息,处理歧义姓名对应的演职人员信息。/n

【技术特征摘要】
1.一种演职人员命名实体消歧方法,其特征在于,包括:
获取演职人员信息,其中,所述演职人员信息包括姓名;
根据所述演职人员信息,确定歧义姓名,所述歧义姓名是指数量不小于两个的姓名;
利用搜索引擎,确定所述歧义姓名对应的搜索信息;
根据所述演职人员信息和搜索信息,处理歧义姓名对应的演职人员信息。


2.根据权利要求1所述的方法,其特征在于,所述根据演职人员信息和搜索信息,处理歧义姓名对应的演职人员信息的步骤包括:
确定演职人员信息和搜索信息的相似度;
筛选出与演职人员信息相似度最高的搜索信息;
根据每个演职人员信息对应的相似度最高的搜索信息,处理歧义姓名对应的演职人员信息。


3.根据权利要求2所述的方法,其特征在于,所述确定演职人员信息和搜索信息的相似度的步骤包括:
所述演职人员信息和搜索信息均包括代表作信息和人物简介;
根据所述演职人员信息和搜索信息中的代表作信息,确定代表作相似度;
根据所述演职人员信息和搜索信息中的人物简介,确定人物相似度;
根据所述代表作相似度和人物相似度,确定最终相似度。


4.根据权利要求3所述的方法,其特征在于,所述根据所述演职人员信息和搜索信息中的代表作信息,确定代表作相似度按照以下公式计算:



其中,所述代表作信息包括代表作名称和代表作简介,simP为代表作相似度,sim(wi,mi)为代表作名称相似度,sim(Ii,Li)为代表作简介相似度,W为搜索信息中的代表作名称集合,wi为搜索信息中的一个代表作名称,mi为演职人员信息中的一个代表作名称,M为演职人员信息中的代表作名称集合...

【专利技术属性】
技术研发人员:隋雪芹
申请(专利权)人:青岛聚看云科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1