实体相似度计算方法及装置、物品推荐系统、介质、设备制造方法及图纸

技术编号:23316183 阅读:17 留言:0更新日期:2020-02-11 18:11
本发明专利技术实施例是关于一种实体相似度计算方法及装置、物品推荐系统、介质、设备,涉及大数据处理技术领域,该方法包括:获取基于用户对各实体进行行为操作时生成的用户行为记录,并对所述用户行为记录进行切分得到多个切分结果;根据各所述切分结果得到各所述实体之间的实体关系网络,并根据所述实体关系网络得到各所述实体的实体路径集合;根据所述实体路径集合得到各所述实体的实体向量,并根据各所述实体向量得到各所述实体之间的相似度。本发明专利技术实施例提高了各实体之间的相似度计算的准确率。

Entity similarity calculation method and device, item recommendation system, medium and equipment

【技术实现步骤摘要】
实体相似度计算方法及装置、物品推荐系统、介质、设备
本专利技术实施例涉及大数据处理
,具体而言,涉及一种实体相似度计算方法、实体相似度计算装置、物品推荐系统、计算机可读存储介质、电子设备。
技术介绍
随着互联网技术的不断发展与普及,网上商城也越来越多。为了吸引更多的消费者,以及促使消费者可以加大购买力度,如何为用户推荐符合用户需求的产品也成了各大电商平台亟需解决的难题。在现有的推荐方法中,大多数都是通过使用关联规则分析方法,挖掘两个商品被同一个用户购买的可能性。基于这样的相似性度量技术,可以根据用户当前有行为的实体,推荐相关性高的其他实体给用户,帮助用户寻找需要的商品。但是,上述方法存在如下缺陷:由于上述相似度是通过使用关联规则分析得到的,并没有使用实体的向量化表示,因此使得相似度计算结果的准确率较低。因此,需要提供一种的实体相似度计算方法及装置。需要说明的是,在上述
技术介绍
部分专利技术的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术的目的在于提供一种实体相似度计算方法、实体相似度计算装置、物品推荐系统、计算机可读存储介质、电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的相似度计算结果的准确率较低的问题。根据本公开的一个方面,提供一种实体相似度计算方法,包括:获取基于用户对各实体进行行为操作时生成的用户行为记录,并对所述用户行为记录进行切分得到多个切分结果;>根据各所述切分结果得到各所述实体之间的实体关系网络,并根据所述实体关系网络得到各所述实体的实体路径集合;根据所述实体路径集合得到各所述实体的实体向量,并根据各所述实体向量得到各所述实体之间的相似度。在本公开的一种示例性实施例中,对所述用户行为记录进行切分得到多个切分结果包括:根据所述用户行为记录的生成时间对所述用户行为记录进行排序;根据预设时间条件对排序后的用户行为记录进行切分,得到多个切分结果;其中,各所述切分结果中包括的任意两个所述用户行为记录对应的生成时间之间的时间差不大于预设时间阈值。在本公开的一种示例性实施例中,根据各所述切分结果得到各所述实体之间的实体关系网络包括:判断任意两个所述实体对应的用户行为记录之间的关系是否满足预设关系条件;在确定任意两个所述实体对应的用户行为记录之间的关系满足所述预设关系条件时,确定该两个所述实体之间存在实体连接;根据各所述切分结果中存在的各所述实体之间的实体连接,得到各所述实体之间的实体关系网络。在本公开的一种示例性实施例中,所述预设关系条件为任意两个所述实体属于同一所述切分结果,且任意两个所述实体对应的用户行为记录在同一所述切分结果中处于相邻位置。在本公开的一种示例性实施例中,所述实体相似度计算方法还包括:计算各所述切分结果中的任意两个所述实体之间被确认存在所述实体连接的数量;根据任意两个所述实体之间被确认存在所述实体连接的数量,得到任意两个实体的实体连接在所述实体关系网络中的权重。在本公开的一种示例性实施例中,根据所述实体关系网络得到与各所述实体对应的实体路径集合包括:步骤S10,随机选取实体i作为与所述实体i对应的实体路径的起点,并在所述实体关系网络中选取与所述实体i之间存在最多数量的实体连接的实体j作为下一个节点;步骤S20,遍历所述实体关系网络中的其他实体,根据所述其他实体与所述实体i的实体连接在所述实体关系网络中的权重的大小,得到多个其他节点;步骤S30,根据所述多个其他节点、所述实体j以及所述实体i得到与所述实体i对应的实体路径;步骤S40,循环所述步骤S10至步骤S30,直至得到与所述实体关系网络中包括的所有实体对应的实体路径;步骤S50,根据各所述实体对应的实体路径,得到与各所述实体对应的所述实体路径集合。在本公开的一种示例性实施例中,根据所述实体路径集合得到各所述实体的实体向量包括:利用向量化处理工具对所述实体路径集合中包括的各所述实体对应的实体路径进行处理,得到各所述实体的实体向量。在本公开的一种示例性实施例中,根据各所述实体向量得到各所述实体之间的相似度包括:计算各所述实体向量之间的余弦值,并将各所述余弦值作为各所述实体之间的相似度。在本公开的一种示例性实施例中,所述实体相似度计算方法还包括:根据各所述实体之间的相似度,得到与所述用户行为记录对应的相似度矩阵;根据所述相似度矩阵,得到与所述用户行为记录对应的目标推荐数据。根据本公开的一个方面,提供一种实体相似度计算装置,包括:行为记录切分模块,用于获取基于用户对各实体进行行为操作时生成的用户行为记录,并对所述用户行为记录进行切分得到多个切分结果;实体关系网络确定模块,用于根据各所述切分结果得到各所述实体之间的实体关系网络,并根据所述实体关系网络得到各所述实体的实体路径集合;相似度确定模块,用于根据所述实体路径集合得到各所述实体的实体向量,并根据各所述实体向量得到各所述实体之间的相似度。根据本公开的一个方面,提供一种物品推荐系统,包括:服务器,用于获取基于用户对各实体进行行为操作时生成的用户行为记录并对所述用户行为记录进行切分得到多个切分结果;以及根据各所述切分结果得到各所述实体之间的实体关系网络,并根据所述实体关系网络得到各所述实体的实体路径集合;以及根据所述实体路径集合得到各所述实体的实体向量,并根据各所述实体向量得到各所述实体之间的相似度;以及根据各所述实体之间的相似度,得到与所述用户行为记录对应的目标推荐数据;终端设备,与所述服务器通信连接,用于接收所述用户对各实体进行的行为操作;以及对所述目标推荐数据进行显示。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的实体相似度度计算方法。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的实体相似度计算方法。本专利技术实施例一种实体相似度计算方法及装置,一方面,通过获取基于用户对各实体进行行为操作时生成的用户行为记录,并对用户行为记录进行切分得到多个切分结果;并根据各切分结果得到各实体之间的实体关系网络,并根据实体关系网络得到各实体的实体路径集合;再根据实体路径集合得到各实体的实体向量,并根据各实体向量得到各实体之间的相似度,使得各实体之间的相似度可以基于各实体的实体向量得到,解决了现有技术中由于相似度是通过使用关联规则分析得到的,并没有使用实体的向量化表示,因此使得相似度计算结果的准确率较低的问题,提高了各实体之间的相似度计算的准确率;另一方面,通过获取基于用户对各实本文档来自技高网...

【技术保护点】
1.一种实体相似度计算方法,其特征在于,包括:/n获取基于用户对各实体进行行为操作时生成的用户行为记录,并对所述用户行为记录进行切分得到多个切分结果;/n根据各所述切分结果得到各所述实体之间的实体关系网络,并根据所述实体关系网络得到各所述实体的实体路径集合;/n根据所述实体路径集合得到各所述实体的实体向量,并根据各所述实体向量得到各所述实体之间的相似度。/n

【技术特征摘要】
1.一种实体相似度计算方法,其特征在于,包括:
获取基于用户对各实体进行行为操作时生成的用户行为记录,并对所述用户行为记录进行切分得到多个切分结果;
根据各所述切分结果得到各所述实体之间的实体关系网络,并根据所述实体关系网络得到各所述实体的实体路径集合;
根据所述实体路径集合得到各所述实体的实体向量,并根据各所述实体向量得到各所述实体之间的相似度。


2.根据权利要求1所述的实体相似度计算方法,其特征在于,对所述用户行为记录进行切分得到多个切分结果包括:
根据所述用户行为记录的生成时间对所述用户行为记录进行排序;
根据预设时间条件对排序后的用户行为记录进行切分,得到多个切分结果;
其中,各所述切分结果中包括的任意两个所述用户行为记录对应的生成时间之间的时间差不大于预设时间阈值。


3.根据权利要求2所述的实体相似度计算方法,其特征在于,根据各所述切分结果得到各所述实体之间的实体关系网络包括:
判断任意两个所述实体对应的用户行为记录之间的关系是否满足预设关系条件;
在确定任意两个所述实体对应的用户行为记录之间的关系满足所述预设关系条件时,确定该两个所述实体之间存在实体连接;
根据各所述切分结果中存在的各所述实体之间的实体连接,得到各所述实体之间的实体关系网络。


4.根据权利要求3所述的实体相似度计算方法,其特征在于,所述预设关系条件为任意两个所述实体属于同一所述切分结果,且任意两个所述实体对应的用户行为记录在同一所述切分结果中处于相邻位置。


5.根据权利要求3所述的实体相似度计算方法,其特征在于,所述实体相似度计算方法还包括:
计算各所述切分结果中的任意两个所述实体之间被确认存在所述实体连接的数量;
根据任意两个所述实体之间被确认存在所述实体连接的数量,得到任意两个实体的实体连接在所述实体关系网络中的权重。


6.根据权利要求5所述的实体相似度计算方法,其特征在于,根据所述实体关系网络得到与各所述实体对应的实体路径集合包括:
步骤S10,随机选取实体i作为与所述实体i对应的实体路径的起点,并在所述实体关系网络中选取与所述实体i之间存在最多数量的实体连接的实体j作为下一个节点;
步骤S20,遍历所述实体关系网络中的其他实体,根据所述其他实体与所述实体i的实体连接在所述实体关系网络中的权重的大小,得到多个其他节点;
步骤S30,根据所述多个其他节点、所述实体j以及所述实体i得到与所述实体i对应的实体路径;
步骤S40,循环所述步骤S10至步骤S30,直至得到与所述实体关系网络中...

【专利技术属性】
技术研发人员:李懿崔娜李晓霞
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1