【技术实现步骤摘要】
一种人名匹配方法、装置、电子设备及存储介质
本申请涉及人名匹配
,具体而言,涉及一种人名匹配方法、装置、电子设备及存储介质。
技术介绍
目前,为了筛选出包含人名的文章,一般需要进行文章进行人名筛选。然而,现有技术中在进行人名筛选时,仅能简单的识别文章中的人名,而无法确定该文章介绍的人名是否与需要筛选的人名匹配,例如,当需要查找演员“张三”时,现有技术中可能筛选出画家“张三”,人名匹配存在误差。综上,现有技术中在进行人名筛选时,存在匹配误差较大的问题。
技术实现思路
本申请的目的在于提供一种人名匹配方法、装置、电子设备及存储介质,以解决现有技术中在进行人名筛选时,存在匹配误差较大的问题。为了实现上述目的,本申请实施例采用的技术方案如下:第一方面,本申请提供了一种人名匹配方法,所述方法包括:对待检测文章进行分词与词频分析,以获取所述待检测文章的目标人名及与所述目标人名对应的目标关键词;将所述目标人名与所述目标关键词输入向量空间模型,以获取所述目标人名对应的
【技术保护点】
1.一种人名匹配方法,其特征在于,所述方法包括:/n对待检测文章进行分词与词频分析,以获取所述待检测文章的目标人名及与所述目标人名对应的目标关键词;/n将所述目标人名与所述目标关键词输入向量空间模型,以获取所述目标人名对应的目标特征向量;/n确定所述目标特征向量与预存储的特征向量的相似度;/n当所述相似度大于阈值时,确定所述目标特征向量与所述预存储的特征向量匹配。/n
【技术特征摘要】
1.一种人名匹配方法,其特征在于,所述方法包括:
对待检测文章进行分词与词频分析,以获取所述待检测文章的目标人名及与所述目标人名对应的目标关键词;
将所述目标人名与所述目标关键词输入向量空间模型,以获取所述目标人名对应的目标特征向量;
确定所述目标特征向量与预存储的特征向量的相似度;
当所述相似度大于阈值时,确定所述目标特征向量与所述预存储的特征向量匹配。
2.如权利要求1所述的人名匹配方法,其特征在于,在所述确定所述目标特征向量与预存储的特征向量的相似度的步骤之前,所述方法还包括:
获取预设定的人名介绍信息;
对所述人名介绍信息进行分词与词频分析,以获取所述人名介绍信息中的人名及与所述人名对应的关键词;
将所述人名与所述关键词输入向量空间模型,以获取所述预存储的特征向量。
3.如权利要求1所述的人名匹配方法,其特征在于,所述确定所述目标特征向量与预存储的特征向量的相似度的步骤包括:
利用余弦相似度或K最近邻分类算法确定所述目标特征向量与预存储的特征向量的相似度。
4.如权利要求1所述的人名匹配方法,其特征在于,所述余弦相似度满足公式:
其中,Ai表示目标特征向量的各分量,Bi表示预存储的特征向量的各分量。
5.一种人名匹配装置,其特征在于,所述装置包括:
信息获取单元,用于对待检测文章进行分词与词频分析,以获取所述待检测文章的目标人名及与所述目标人名对应的目标关键...
【专利技术属性】
技术研发人员:黄建颖,
申请(专利权)人:成都颜创启新信息技术有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。