【技术实现步骤摘要】
用于信息处理的方法、装置、设备和计算机可读存储介质
本公开的实施例主要涉及信息处理领域,并且更具体地,涉及用于信息处理的方法、装置、设备和计算机可读存储介质。
技术介绍
随着网络技术的快速发展,信息日益增长,准确获得所请求的信息的需求也随之增长。然而,由于自然语言存在歧义性,用户的搜索结果通常并不准确。已有的消歧方案无法满足用户的搜索需求,以至于降低了用户的搜索体验。
技术实现思路
根据本公开的示例实施例,提供了一种用于信息处理的方案。在本公开的第一方面中,提供了一种用于信息处理方法,包括:获取第一实体的特征和第二实体的特征;基于第一实体的特征,生成第一实体表示;基于第二实体的特征,生成第二实体表示;确定第一实体的特征和第二实体的特征之间的特征相似性;以及基于第一实体表示、第二实体表示和特征相似性,确定第一实体和第二实体之间的实体相似性。在本公开的第二方面中,提供了一种信息处理装置,包括:特征获取模块,被配置为获取第一实体的特征和第二实体的特征;第一实体表示生成模块,被配置为基于第一实体的特征,生成第一实体表示;第二实体表示生成模块,被配置为基于第二实体的特征,生成第 ...
【技术保护点】
1.一种信息处理方法,包括:获取第一实体的特征和第二实体的特征;基于所述第一实体的特征,生成第一实体表示;基于所述第二实体的特征,生成第二实体表示;确定所述第一实体的特征和所述第二实体的特征之间的特征相似性;以及基于所述第一实体表示、所述第二实体表示和所述特征相似性,确定所述第一实体和所述第二实体之间的实体相似性。
【技术特征摘要】
1.一种信息处理方法,包括:获取第一实体的特征和第二实体的特征;基于所述第一实体的特征,生成第一实体表示;基于所述第二实体的特征,生成第二实体表示;确定所述第一实体的特征和所述第二实体的特征之间的特征相似性;以及基于所述第一实体表示、所述第二实体表示和所述特征相似性,确定所述第一实体和所述第二实体之间的实体相似性。2.根据权利要求1所述的方法,其中获取所述第一实体的特征包括:从所述第一实体中提取所述第一实体的特征,所述特征包括以下中的至少一项:标识、类型、描述信息、键值对、相关实体、和多媒体内容。3.根据权利要求1所述的方法,其中获取所述第二实体的特征包括:获取所述第一实体的标识;以及响应于所述第一实体的标识与候选实体的标识之间的标识相似性超过预定阈值,获取所述第二实体的特征。4.根据权利要求1所述的方法,其中生成所述第一实体表示包括:从所述第一实体的特征获取针对所述第一实体的第一描述信息;基于所述第一描述信息,生成表示所述第一描述信息的第一文本表示;以及将所述第一文本表示应用于相似性模型的第一映射单元,以将所述第一文本表示映射为所述第一实体表示。5.根据权利要求4所述的方法,其中生成所述第二实体表示包括:从所述第二实体的特征获取针对所述第二实体的第二描述信息;基于所述第二描述信息,生成表示所述第二描述信息的第二文本表示;以及将所述第二文本表示应用于所述相似性模型的第二映射单元,以将所述第二文本表示映射为所述第二实体表示,其中所述第一映射单元和所述第二映射单元具有相同参数。6.根据权利要求1所述的方法,其中确定所述实体相似性包括:将所述第一实体表示、所述第二实体表示和所述特征相似性应用于相似性模型的全连接单元,以生成全连接表示;以及将所述全连接表示应用于分类单元,以生成所述第一实体和所述第二实体是相同实体的概率作为所述实体相似性。7.根据权利要求1所述的方法,其中确定所述实体相似性包括:获取所述第一实体是否存在歧义实体的概率;以及基于所述第一实体表示、所述第二实体表示、所述特征相似性和所述概率,确定所述第一实体和所述第二实体之间的实体相似性。8.根据权利要求1所述的方法,其中确定所述实体相似性包括:接收对与所述第一实体和所述第二实体的要比较的特征的选择;通过对选择的所述第一实体的特征和选择的所述第二实体的特征进行比较,以确定所述第一实体和所述第二实体是否为不同实体;以及响应于所述第一实体和所述第二实体为不同实体,确定所述实体相似性。9.根据权利要求8所述的方法,其中所述比较包括以下至少一项:精确比较、编辑距离比较、时间比较、文本相似度比较、共现比较、数字比较和类型比较。10.一种信息处理装置,包括:特征获取模块,被配置为获取第一实体的特征和第二实体的特征;第一实体表示生成模块,被配置为基于所述第一实体的特征,生成第一实体表示;第二实体表示生成模块,被配置为基于所述第二实体的特征,生成第二实体表示;特征相似性确...
【专利技术属性】
技术研发人员:方舟,冯知凡,张扬,陆超,朱勇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。