一种用于对命名实体进行关联的方法和装置制造方法及图纸

技术编号:12386619 阅读:55 留言:0更新日期:2015-11-25 18:59
本发明专利技术提供了一种用于在计算机设备中对命名实体进行关联的方法,其中,该方法包括:根据用户的访问信息,获得所述访问信息所针对的命名实体;根据所述用户的历史访问记录,确定与所述命名实体相关联的至少一个关联命名实体。根据本实施例的方案,能够基于用户的历史访问记录,来确定与命名实体相关联的至少一个关联命名实体,从而避免在进行命名实体的关联时,遗漏在含义上并不相似的一些命名实体,从而能够覆盖更多的网站流量,能够更好的提供面向用户的推荐或推广服务。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种用于在计算机设备中对命名实体进行关联的方法和装置。
技术介绍
现有技术中,命名实体作为自然语言理解的一个重要组成成分,被广泛的应用于各种领域,如商业领域、服务领域等。目前,通常采用基于字符串相似度的方法来对命名实体进行关联,例如,对于命名实体“彩虹连珠”,计算机设备基于字符串相似度的方法获得与该命名实体的含义相似的关联命名实体,如“七彩连珠”、“五子连珠”等;也即,仅与命名实体含义相似或相近的其他命名实体,能够被关联至该命名实体。
技术实现思路
本专利技术的目的是提供一种用于在计算机设备中对命名实体进行关联的方法和装置。根据本专利技术的一个方面,提供一种用于在计算机设备中对命名实体进行关联的方法,其中,该方法包括:根据用户的访问信息,获得所述访问信息所针对的命名实体;根据所述用户的历史访问记录,确定与所述命名实体相关联的至少一个关联命名实体。根据本专利技术的另一个方面,还提供了一种用于在计算机设备中对命名实体进行关联的装置,其中,该装置包括:第一获得装置,用于根据用户的访问信息,获得所述访问信息所针对的命名实体;确定装置,用于根据所述用户的历史访问记录,确定与所述命名实体相关联的至少一个关联命名实体。与现有技术相比,本专利技术具有以下优点:1)能够基于用户的历史访问记录,来确定与命名实体相关联的至少一个关联命名实体,也即,并不仅考虑与用户当前所针对的命名实体在含义上的相近或者相似,而是从用户角度出发,来确定至少一个关联命名实体,从而避免在进行命名实体的关联时,遗漏在含义上并不相似的一些命名实体,从而能够覆盖更多的网站流量,能够更好的提供面向用户的推荐或推广服务;2)能够将针对多个用户所获得的、访问信息所针对的命名实体的所有关联命名实体进行聚合,获得所述命名实体的关联实体集合,从而进行更广泛、更全面的关联;3)能够通过确定或更新关联命名实体的权重信息,并根据权重信息向用户提供与关联命名实体相对应的关联内容信息,从而实现更有效的推荐或推广服务。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术一个实施例的用于在计算机设备中对命名实体进行关联的方法的流程示意图;图2为本专利技术一个实施例的用于在计算机设备中对命名实体进行关联的装置的结构示意图;图3为本专利技术一个示例的通过聚合获得命名实体的关联实体集合的示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。图1为本专利技术一个实施例的用于在计算机设备中对命名实体进行关联的方法的流程示意图。其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括网络设备和用户设备;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。需要说明的是,所述计算机设备仅为举例,其他现有的或今后可能出现的计算机设备如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。根据本实施例的方法包括步骤S1和步骤S2。在步骤S1中,计算机设备根据用户的访问信息,获得所述访问信息所针对的命名实体。其中,所述访问信息包括任何与用户在计算机设备中当前访问的页面相关的信息;优选地,所述访问信息包括但不限于:当前页面的地址信息、访问时间信息、与当前页面中的内容相关的信息(如当前页面中的内容为一个文档,所述内容信息包括但不限于该文档的名称信息、标识信息、介绍信息等)等。其中,所述命名实体包括任何能够以名称为标识的实体;优选地,所述命名实体包括但不限于:人名、地名、机构名称、货品名称等。具体地,计算机设备根据用户的访问信息,获得所述访问信息所针对的命名实体的实现方式包括但不限于:1)计算机设备直接从用户的访问信息中提取该访问信息所针对的命名实体。例如,当前页面中的内容为一个文档,用户的访问信息包括该文档的名称“海南旅游景点介绍”,则计算机设备从该名称中提取出该访问信息所针对的命名实体“海南”。2)计算机设备中预先存储有访问信息与命名实体之间的对应关系,计算机设备根据用户的访问信息,并结合所述对应关系,从本地读取与该访问信息相对应的命名实体。例如,计算机设备中预先存储有页面的地址信息与命名实体之间的对应关系。在步骤S1中,计算机设备获得用户的访问信息中所包含的、当前页面的地址信息,并根据该对应关系从本地读取与该地址信息相对应的命名实体。又例如,计算机设备中预先存储有文档的名称信息与命名实体之间的对应关系。在步骤S1中,计算机设备获得用户的访问信息中所包含的、文档的名称信息,并根据该对应关系从本地读取与该名称信息相对应的命名实体。需要说明的是,上述举例仅为更好地说明本专利技术的技术方案,而非对本专利技术的限制,本领域技术人员应该理解,任何根据用户的访问信息,获得所述访问信息所针对的命名实体的实现方式,均应包含在本专利技术的范围内。需要说明的是,在步骤S1中,计算机设备获得的命名实体可为多个;例如,当前页面中的内容为一个文档,用户的访问信息包括该文档的名称“泰山和嵩山文化”,计算机设备获得该访问信息所针对的命名实体包括:“泰山”和“嵩山”。在步骤S2中,计算机设备根据用户的历史访问记录,确定与所述命名实体相关联的至少一个关联命名实体。其中,所述关联命名实体标识与用户当前所针对的命名实体相关的其他命名实体。其中,所述历史访问记录包括任何与用户的历史访问操作相关的记录;优选地,所述历史访问记录包括但不限于:1)用户历史所针对的命名实体。其中,用户历史所针对的命名实体表示针对该用户所历史获得的命名实体。例如,计算机设备根据用户在当前时间“2015-04-2809:30”的访问信息,所获得的命名实体为“泰山”,则计算机设备在该当前时间之前,针对该用户所历史获得的命名实体“嵩山”、本文档来自技高网...

【技术保护点】
一种用于在计算机设备中对命名实体进行关联的方法,其中,该方法包括:根据用户的访问信息,获得所述访问信息所针对的命名实体;根据所述用户的历史访问记录,确定与所述命名实体相关联的至少一个关联命名实体。

【技术特征摘要】
1.一种用于在计算机设备中对命名实体进行关联的方法,其中,该
方法包括:
根据用户的访问信息,获得所述访问信息所针对的命名实体;
根据所述用户的历史访问记录,确定与所述命名实体相关联的至少
一个关联命名实体。
2.根据权利要求1所述的方法,其中,所述用户的历史访问记录包
括以下至少一项:
-所述用户历史所针对的命名实体;
-与所述历史所针对的命名实体相对应的历史访问时间;
-所述用户历史所针对的命名实体之间的关联关系。
3.根据权利要求2所述的方法,其中,所述历史访问记录包括所述
历史访问过的命名实体以及所述历史访问时间,所述确定至少一个关联
命名实体的步骤包括:
根据所述历史访问过的命名实体以及所述历史访问时间,将用户在
访问所述访问信息的时间点附近历史访问过的至少一个命名实体,作为
与所述访问信息所针对的命名实体相关联的至少一个关联命名实体。
4.根据权利要求2所述的方法,其中,所述历史访问记录包括所述
关联关系,所述确定至少一个关联命名实体的步骤包括:
根据所述关联关系,确定与所述访问信息所针对的命名实体相关联
的至少一个关联命名实体。
5.根据权利要求2所述的方法,其中,所述历史访问记录包括所述
历史访问过的命名实体,所述确定至少一个关联命名实体的步骤包括:
将所述历史访问过的命名实体与所述访问信息所针对的命名实体进
行匹配,确定与所述访问信息所针对的命名实体相关联的至少一个关联
命名实体。
6.根据权利要求1至5中任一项所述的方法,其中,所述确定至少
一个关联命名实体的步骤还包括:
-确定所述至少一个关联命名实体的权重信息。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:
将针对多个用户所获得的、所述访问信息所针对的命名实体的所有
关联命名实体进行聚合,获得所述命名实体的关联实体集合。
8.根据权利要求7所述的方法,其中,该方法还包括:
根据以下至少一项,确定或更新所述关联实体集合中的至少一个关
联命名实体的权重信息:
-一个关联命名实体在所述所有关联命名实体中的出现情况信息;
-一个关联命名实体和所述访问信息所针对的命名实体之间的匹配
度。
9.根据权利要求1至8中任一项所述的方法,其中,在所述确定与
所述命名实体相关联的至少一个命名实体的步骤之后,该方法还包括:
-将与所述至少一个关联命名实体相对应的关联内容信息提供给所
述用户。
10.根据权利要求9所述的方法,其中,将与所述至少一个关联命
名实体相对应的关联访问信息提供给所述用户的步骤包括:
根据所述至少一个关联命名实体的权重信息,将与所述至少一个关
联命名实体相对应的关联内容信息提供给所述用户。
11.一种用于在计算机设备中对...

【专利技术属性】
技术研发人员:刘水姚源林
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1