一种网络资源确定方法及装置制造方法及图纸

技术编号:26478816 阅读:41 留言:0更新日期:2020-11-25 19:23
本发明专利技术实施例提供了一种网络资源确定方法及装置,针对每一待推荐网络资源,基于该待推荐网络资源的文本标题、文本内容和语义模型,确定该待推荐网络资源的第一初始标题向量;按照目标用户浏览网络资源的时间先后顺序,从目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为备选网络资源;基于备选网络资源的第二初始标题向量和第一初始标题向量,确定该待推荐网络资源的目标标题向量;根据各待推荐网络资源的目标标题向量,从各待推荐网络资源中确定与该待推荐网络资源相关联的网络资源。基于上述处理,可以提高推荐的网络资源的有效性。

【技术实现步骤摘要】
一种网络资源确定方法及装置
本专利技术涉及计算机
,特别是涉及一种网络资源确定方法及装置。
技术介绍
随着计算机技术的发展,当今社会正处于一个信息爆发的时代,用户很难从海量的网络资源中快速的选择出自己感兴趣的网络资源。基于用户的历史行为的网络资源推荐方法,可以对海量的网络资源进行过滤,确定出用户可能感兴趣的网络资源,作为目标网络资源,进而,基于确定出的目标网络资源,向用户进行网络资源推荐。现有技术中,每一待推荐网络资源可以具有多个标签,待推荐网络资源的标签可以包括能够表示该待推荐网络资源的主题的关键词。当向用户推荐网络资源时,可以获取在历史时间段内用户已浏览的网络资源的一个标签(可以称为待匹配标签),从待推荐网络资源中确定出具有该待匹配标签的待推荐网络资源,作为目标网络资源。进而,基于确定出的目标网络资源,向用户进行网络资源推荐。然而,由于具有待匹配标签的目标网络资源的一个标签可能无法准确表达目标网络资源的主题,会导致确定出的目标网络资源与用户已浏览的网络资源的主题差异性较大,即确定出的目标网络资源与用户已浏览的网络资源的相关性较低,基于确定出的目标网络资源进行推荐,会导致推荐的网络资源的有效性较低。
技术实现思路
本专利技术实施例的目的在于提供一种网络资源确定方法及装置,可以提高推荐的网络资源的有效性。具体技术方案如下:在本专利技术实施的第一方面,首先提供了一种网络资源确定方法,所述方法包括:针对每一待推荐网络资源,将该待推荐网络资源的文本标题和文本内容输入至预先训练的语义模型,得到所述语义模型输出的该待推荐网络资源的文本标题对应的向量,作为第一初始标题向量,其中,所述语义模型为基于预设训练样本进行训练得到的,所述预设训练样本包括:样本网络资源的文本标题、所述样本网络资源的文本内容,以及所述样本网络资源的文本标题与文本内容的相似度;按照目标用户浏览网络资源的时间先后顺序,从所述目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为备选网络资源;其中,所述目标用户为已浏览该待推荐网络资源的用户;获取所述备选网络资源的文本标题对应的向量,作为第二初始标题向量;基于所述第二初始标题向量对所述第一初始标题向量进行调整,得到该待推荐网络资源的目标标题向量;根据各待推荐网络资源的目标标题向量,从所述各待推荐网络资源中,确定与该待推荐网络资源相关联的网络资源。可选的,所述获取所述备选网络资源的文本标题对应的向量,作为第二初始标题向量,包括:将所述备选网络资源的文本标题和文本内容输入至所述语义模型,得到所述语义模型输出的所述备选网络资源的文本标题对应的向量,作为第二初始标题向量;所述基于所述第二初始标题向量对所述第一初始标题向量进行调整,得到该待推荐网络资源的目标标题向量,包括:基于预先训练的词向量模型,将所述第二初始标题向量作为迭代参数,对所述第一初始标题向量进行调整,得到调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量。可选的,所述目标用户为多个;所述按照目标用户浏览网络资源的时间先后顺序,从所述目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为备选网络资源,包括:针对每一所述目标用户,按照该目标用户浏览网络资源的时间先后顺序,从该目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为该目标用户对应的备选网络资源;所述基于预先训练的词向量模型,将所述第二初始标题向量作为迭代参数,对所述第一初始标题向量进行调整,得到调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量,包括:针对每一所述目标用户,计算该目标用户对应的所述备选网络资源的第二初始标题向量的平均值,作为均值向量;按照预设顺序,从各所述均值向量中,选取一个均值向量,作为当前的待比较均值向量;计算当前的待比较均值向量与上一次调整后的第一初始标题向量的相似度;如果计算得到的相似度大于第一相似度阈值,判断当前的待比较均值向量是否为所述预设顺序中的最后一个均值向量;如果当前的待比较均值向量是所述预设顺序中的最后一个均值向量,将上一次调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量;如果当前的待比较均值向量不是所述预设顺序中的最后一个均值向量,返回执行按照预设顺序,从各所述均值向量中,选取一个均值向量,作为当前的待比较均值向量的步骤。可选的,在所述计算当前的待比较均值向量,与上一次调整后的第一初始标题向量的相似度之后,所述方法还包括:如果计算得到的相似度不大于所述第一相似度阈值,基于最大似然算法和当前的待比较均值向量对应的备选网络资源的第二初始标题向量,对上一次调整后的第一初始标题向量进行调整;判断当前的待比较均值向量是否为所述预设顺序中的最后一个均值向量;如果当前的待比较均值向量是所述预设顺序中的最后一个均值向量,将本次调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量;如果当前的待比较均值向量不是所述预设顺序中的最后一个均值向量,返回执行按照预设顺序,从各所述均值向量中,选取一个均值向量,作为当前的待比较均值向量的步骤。可选的,所述根据各待推荐网络资源的目标标题向量,从所述各待推荐网络资源中,确定与该待推荐网络资源相关联的网络资源,包括:对所述各待推荐网络资源进行聚类,得到多个网络资源集合;计算该待推荐网络资源与该待推荐网络资源所属的网络资源集合中,除该待推荐网络资源外的其他网络资源的目标标题向量的相似度;基于确定出的相似度,从该待推荐网络资源所属的网络资源集合中,确定与该待推荐网络资源相关联的网络资源。可选的,所述基于确定出的相似度,从该待推荐网络资源所属的网络资源集合中,确定与该待推荐网络资源相关联的网络资源,包括:从该待推荐网络资源所属的网络资源集合中,确定与该待推荐网络资源的目标标题向量的相似度大于第二相似度阈值的待推荐网络资源,作为与该待推荐网络资源相关联的网络资源;或者,从该待推荐网络资源所属的网络资源集合中,确定第三数目个网络资源,作为与该待推荐网络资源相关联的网络资源,其中,所述第三数目个网络资源与该待推荐网络资源的目标标题向量的相似度,大于该网络资源集合中除所述第三数目个网络资源外的其他网络资源与该待推荐网络资源的目标标题向量的相似度。可选的,所述方法还包括:当接收到针对该待推荐网络资源的浏览请求时,基于与该待推荐网络资源相关联的网络资源,向用户进行网络资源推荐。在本专利技术实施的第二方面,还提供了一种网络资源确定装置,所述装置包括:第一确定模块,用于针对每一待推荐网络资源本文档来自技高网...

【技术保护点】
1.一种网络资源确定方法,其特征在于,所述方法包括:/n针对每一待推荐网络资源,将该待推荐网络资源的文本标题和文本内容输入至预先训练的语义模型,得到所述语义模型输出的该待推荐网络资源的文本标题对应的向量,作为第一初始标题向量,其中,所述语义模型为基于预设训练样本进行训练得到的,所述预设训练样本包括:样本网络资源的文本标题、所述样本网络资源的文本内容,以及所述样本网络资源的文本标题与文本内容的相似度;/n按照目标用户浏览网络资源的时间先后顺序,从所述目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为备选网络资源;其中,所述目标用户为已浏览该待推荐网络资源的用户;/n获取所述备选网络资源的文本标题对应的向量,作为第二初始标题向量;/n基于所述第二初始标题向量对所述第一初始标题向量进行调整,得到该待推荐网络资源的目标标题向量;/n根据各待推荐网络资源的目标标题向量,从所述各待推荐网络资源中,确定与该待推荐网络资源相关联的网络资源。/n

【技术特征摘要】
1.一种网络资源确定方法,其特征在于,所述方法包括:
针对每一待推荐网络资源,将该待推荐网络资源的文本标题和文本内容输入至预先训练的语义模型,得到所述语义模型输出的该待推荐网络资源的文本标题对应的向量,作为第一初始标题向量,其中,所述语义模型为基于预设训练样本进行训练得到的,所述预设训练样本包括:样本网络资源的文本标题、所述样本网络资源的文本内容,以及所述样本网络资源的文本标题与文本内容的相似度;
按照目标用户浏览网络资源的时间先后顺序,从所述目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为备选网络资源;其中,所述目标用户为已浏览该待推荐网络资源的用户;
获取所述备选网络资源的文本标题对应的向量,作为第二初始标题向量;
基于所述第二初始标题向量对所述第一初始标题向量进行调整,得到该待推荐网络资源的目标标题向量;
根据各待推荐网络资源的目标标题向量,从所述各待推荐网络资源中,确定与该待推荐网络资源相关联的网络资源。


2.根据权利要求1所述的方法,其特征在于,所述获取所述备选网络资源的文本标题对应的向量,作为第二初始标题向量,包括:
将所述备选网络资源的文本标题和文本内容输入至所述语义模型,得到所述语义模型输出的所述备选网络资源的文本标题对应的向量,作为第二初始标题向量;
所述基于所述第二初始标题向量对所述第一初始标题向量进行调整,得到该待推荐网络资源的目标标题向量,包括:
基于预先训练的词向量模型,将所述第二初始标题向量作为迭代参数,对所述第一初始标题向量进行调整,得到调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量。


3.根据权利要求2所述的方法,其特征在于,所述目标用户为多个;
所述按照目标用户浏览网络资源的时间先后顺序,从所述目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为备选网络资源,包括:
针对每一所述目标用户,按照该目标用户浏览网络资源的时间先后顺序,从该目标用户已浏览的网络资源中,确定浏览时刻在该待推荐网络资源之前的第一数目个网络资源和/或,浏览时刻在该待推荐网络资源之后的第二数目个网络资源,作为该目标用户对应的备选网络资源;
所述基于预先训练的词向量模型,将所述第二初始标题向量作为迭代参数,对所述第一初始标题向量进行调整,得到调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量,包括:
针对每一所述目标用户,计算该目标用户对应的所述备选网络资源的第二初始标题向量的平均值,作为均值向量;
按照预设顺序,从各所述均值向量中,选取一个均值向量,作为当前的待比较均值向量;
计算当前的待比较均值向量与上一次调整后的第一初始标题向量的相似度;
如果计算得到的相似度大于第一相似度阈值,判断当前的待比较均值向量是否为所述预设顺序中的最后一个均值向量;
如果当前的待比较均值向量是所述预设顺序中的最后一个均值向量,将上一次调整后的第一初始标题向量,作为该待推荐网络资源的目标标题向量;
如果当前的待比较均值向量不是所述预设顺序中的最后一个均值向量,返回执行按照预设顺序,从各所述均值向量中,选取一个均值向量,作为当前的待比较均值向量的步骤。


4.根据权利要求3所述的方法,其特征在于,在所述计算当前的待比较均值向量,与上一次调整后的第一初始标题向量的相似度之后,所述方法还包括:
如果计算得到的相似度不大于所述第一相似度阈值,基于最大似然算法和当前的待比较均值向量对应的备选网络资源的第二初...

【专利技术属性】
技术研发人员:尚斌
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1