基于概率分布的层级增量式标签传播方法及装置制造方法及图纸

技术编号:36524181 阅读:12 留言:0更新日期:2023-02-01 16:01
本申请涉及一种基于概率分布的层级增量式标签传播方法及装置。该方法包括:通过多个用户之间的关系构建关系网络;根据标签策略为所述关系网络中的第一部分用户分配用户标签;根据层级式标签传播算法通过第一部分用户的用户标签的概率分布生成所述关系网络中的第二部分用户的标签维度集合;根据所述标签维度集合为所述第二部分用户确定用户标签。本申请涉及的基于概率分布的层级增量式标签传播方法、装置、电子设备及计算机可读介质,能够在实际应用中,快速准确的为没有标签的用户确定用户标签,满足计算分析的需求,相较于现有技术中的标签分配方式,本申请中的方式提高了计算速度、减小了内容和计算资源的占用。减小了内容和计算资源的占用。减小了内容和计算资源的占用。

【技术实现步骤摘要】
基于概率分布的层级增量式标签传播方法及装置


[0001]本申请涉及计算机信息处理领域,具体而言,涉及一种基于概率分布的层级增量式标签传播方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]机器学习现如今在各个人工智能研究领域中已经得到了极大的发展,对于机器学习模型的一般应用来说,用户首先确定某一个类别或者算法的机器学习模型,然后根据用户想解决的特定问题,用户输入特定的数据,机器学习模型建立特定的任务,然后通过特定的数据来对机器学习进行训练,在训练结束后,得到适用于某一个特定任务的机器学习模型。通常情况下,即使用同一个机器学习模型的算法,但是用不同的数据训练得到的机器学习模型是完全不同的。
[0003]通常情况下机器学习模型需要对正样本和负样本进行学习。但是对于很多领域而言,大部分的用户属于未标记样本。比如在购物领域,用户是否喜欢一件商品(正样本)是可以通过用户的购买习惯确定的;用户是否不喜欢一件商品(负样本)也可以通过用户的评价内容确定,但是绝大第一部分用户是否喜欢这件商品是未知的(未标记样本)。大量未标记的样本会影响机器学习模型训练时候的精度和准确度。如何为未标记的用户准确快速的分配样本标签,进而进行机器学习模型的训练是机器学习模型训练过程中的关键问题。
[0004]因此,需要一种新的基于概率分布的层级增量式标签传播方法、装置、电子设备及计算机可读介质。
[0005]在所述
技术介绍
部分公开的上述信息仅用于加强对本申请的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]有鉴于此,本申请提供一种基于概率分布的层级增量式标签传播方法、装置、电子设备及计算机可读介质,能够在实际应用中,快速准确的为没有标签的用户确定用户标签,满足计算分析的需求,相较于现有技术中的标签分配方式,本申请中的方式提高了计算速度、减小了内容和计算资源的占用。
[0007]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0008]根据本申请的一方面,提出一种基于概率分布的层级增量式标签传播方法,该方法包括:通过多个用户之间的关系构建关系网络;根据标签策略为所述关系网络中的第一部分用户分配用户标签;根据层级式标签传播算法通过第一部分用户的用户标签生成所述关系网络中的第二部分用户的标签维度集合;根据所述标签维度集合为所述第二部分用户确定用户标签。
[0009]可选地,根据标签策略为所述关系网络中的第一部分用户分配用户标签,包括:确定待分配的用户标签的目标和维度;根据所述目标和所述维度生成所述标签策略;根据所
述标签策略和关系网络中多个用户的历史数据为第一部分用户分配用户标签。
[0010]可选地,根据所述标签策略和关系网络中多个用户的历史数据为第一部分用户分配用户标签,包括:获取多个用户的历史数据;根据所述标签策略中的所述目标由所述历史数据中提取目标数据;将所述目标数据和所述标签策略进行比较以为第一部分用户分配用户标签。
[0011]可选地,将所述目标数据和所述标签策略进行比较以为第一部分用户分配用户标签,包括:根据所述标签策略中的所述目标和所述维度确定标签区间;将所述目标数据和所述标签区间进行比较;为符合所述标签区间的第一部分用户分配标签。
[0012]可选地,根据层级式标签传播算法通过第一部分用户的用户标签的概率分布生成所述关系网络中的第二部分用户的标签维度集合,包括:将所述第一部分用户在所述关系网络中设置为源节点;依据标签传播算法和概率分布由所述源节点开始将源节点对应的标签以层级式的关系向所述关系网络中的第二部分用户对应的节点传播;在所述关系网络的变化量参数满足阈值时,停止传播;通过第二部分用户对应的节点的标签的维度和数量生成所述标签维度集合。
[0013]可选地,依据标签传播算法和概率分布由所述源节点开始将源节点对应的标签以层级式的关系向所述关系网络中的第二部分用户对应的节点传播,包括:将源节点设置为活跃节点,将第二部分用户对应的节点设置为非活跃节点;逐一提取活跃节点,将所述源节点的标签数组传递给其他节点;其他节点根据所述源节点的标签数组的概率分布生成其自身对应的本次临时标签;在所述本次临时标签和上一次临时标签不同时,将所述其他节点设置为活跃节点。
[0014]可选地,其他节点根据所述源节点的标签数组的概率分布生成其自身对应的本次临时标签,包括:其他节点根据所述源节点的标签数组更新其自身对应的标签数组;根据标签数据中多个临时标签和其对应的标签数量计算出每个临时标签对应的概率;根据每个临时标签对应的概率为所述第二部分用户确定本次临时标签。
[0015]可选地,在所述关系网络的变化量参数满足阈值时,停止传播,包括:计算每次传播之后的所述关系网络中活跃节点的变化数量;在所述活跃节点的变化数量小于阈值时,停止传播。
[0016]可选地,根据所述标签维度集合为所述第二部分用户确定用户标签,包括:获取所述标签集合中多个标签和其对应的标签数量;根据所述多个标签和其对应的标签数量计算出每个标签对应的概率;根据每个标签对应的概率为所述第二部分用户确定用户标签。
[0017]可选地,根据每个标签对应的概率为所述第二部分用户确定用户标签,包括:根据标签区间提取每个标签对应的标签等级;根据标签等级依次将当前级别的标签概率和其之前级别的标签概率的和进行比较;将当前级别的标签概率大于其之前级别的标签概率和时,将当前的标签作为所述第二部分用户的用户标签。
[0018]根据本申请的一方面,提出一种基于概率分布的层级增量式标签传播装置,该装置包括:网络模块,用于通过多个用户之间的关系构建关系网络;分配模块,用于根据标签策略为所述关系网络中的第一部分用户分配用户标签;传播模块,用于根据层级式标签传播算法通过第一部分用户的用户标签的概率分布生成所述关系网络中的第二部分用户的标签维度集合;标签模块,用于根据所述标签维度集合为所述第二部分用户确定用户标签。
[0019]根据本申请的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
[0020]根据本申请的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
[0021]根据本申请的基于概率分布的层级增量式标签传播方法、装置、电子设备及计算机可读介质,通过多个用户之间的关系构建关系网络;根据标签策略为所述关系网络中的第一部分用户分配用户标签;根据层级式标签传播算法通过第一部分用户的用户标签的概率分布生成所述关系网络中的第二部分用户的标签维度集合;根据所述标签维度集合为所述第二部分用户确定用户标签的方式,能够在实际应用中,快速准确的为没有标签的用户确定用户标签,满足计算分析的需求,相较于现有技术中的标签分配方式,本申请中的方式提高了计算速度、减小本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于概率分布的层级增量式标签传播方法,其特征在于,包括:通过多个用户之间的关系构建关系网络;基于标签策略为所述关系网络中的第一部分用户分配用户标签;根据层级式标签传播算法通过所述第一部分用户的用户标签的概率分布生成所述关系网络中第二部分用户的标签维度集合;依据所述标签维度集合为所述第二部分用户确定用户标签。2.如权利要求1所述的方法,其特征在于,根据标签策略为所述关系网络中的第一部分用户分配用户标签,包括:确定待分配的用户标签的目标和维度;根据所述目标和所述维度生成所述标签策略;根据所述标签策略和关系网络中一个或多个用户的历史数据为第一部分用户分配用户标签。3.如权利要求2所述的方法,其特征在于,根据所述标签策略和关系网络中多个用户的历史数据为第一部分用户分配用户标签,包括:获取多个用户的历史数据;根据所述标签策略中的所述目标由所述历史数据中提取目标数据;将所述目标数据和所述标签策略进行比较以为第一部分用户分配用户标签。4.如权利要求3所述的方法,其特征在于,将所述目标数据和所述标签策略进行比较以为第一部分用户分配用户标签,包括:根据所述标签策略中的所述目标和所述维度确定标签区间;将所述目标数据和所述标签区间进行比较;为符合所述标签区间的第一部分用户分配标签。5.如权利要求1所述的方法,其特征在于,根据层级式标签传播算法通过第一部分用户的用户标签的概率分布生成所述关系网络中的第二部分用户的标签维度集合,包括:将所述第一部分用户在所述关系网络中设置为源节点;依据标签传播算法和概率分布由所述源节点开始将源节点对应的标签以层级式的关系向所述关系网络中的第二部分用户对应的节点传播;在所述关系网络的变化量参数满足阈值时,停止传播;通过第二部分用户对应的节点的标签的维度和数量生成所述标签维度集合。6.如权利要求5所述的方法,其特征在于,依据标签传播算法和概率分布由所述源节点开始将源节点对应的标签以层级式的关系向所述关系网络中的第二部分用户对应的节点传播,包括:将源节点设置为活跃节点,将第二部分用户对应的节点设置为非活跃节点;逐一提取活跃节点,将所述源节点的标签数组传递给其他节点;其他节点根据所述源节点的标签数组的概率分布生成其自身对应的本次临时标签;在所述本次临时标签和上...

【专利技术属性】
技术研发人员:张小川费浩峻
申请(专利权)人:北海淇诚信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1