【技术实现步骤摘要】
本专利技术涉及数据挖掘,尤其涉及基于多源异构数据的用户标签自动化构建方法及系统。
技术介绍
1、随着互联网和移动互联网的快速发展,用户在各类平台和应用中产生了海量的行为数据,包括浏览历史、购买记录、社交互动等多种形式。这些多源异构数据蕴含着丰富的用户兴趣和特征信息,对于精准营销、个性化推荐和用户画像构建具有重要价值。用户标签是对用户特征、兴趣和行为模式的高度概括,已成为理解用户需求和提供个性化服务的关键手段。传统的用户标签构建方法主要依赖于人工规则定义和单一数据源分析,随着数据规模和复杂性的增加,自动化构建用户标签的需求日益迫切。
2、现有的用户标签自动化构建技术存在以下不足:
3、现有技术在处理多源异构数据时缺乏有效的数据融合机制,往往采用简单的数据拼接或加权平均方法,忽略了不同数据源之间的内在关联性和互补性,导致融合后的特征表达能力有限,无法充分挖掘用户的多维度特征。
4、现有的用户聚类分析方法多采用静态聚类算法,未能有效应对用户兴趣和行为随时间变化的动态特性,导致聚类结果不能及时反映用户群体的演
...【技术保护点】
1.基于多源异构数据的用户标签自动化构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述标准化处理后的行为数据,计算不同数据源之间的关联权重矩阵,利用双向注意力机制根据所述关联权重矩阵对不同数据源的行为数据进行自适应特征融合,生成融合特征向量,包括:
3.根据权利要求2所述的方法,其特征在于,基于所述初始关联权重矩阵计算数据源之间的注意力分数,通过正向计算提取数据源间的全局依赖关系得到全局权重矩阵,通过反向计算提取数据源间的局部依赖关系得到局部权重矩阵,将所述全局权重矩阵与所述局部权重矩阵进行自适应加权组合得到优化后
...【技术特征摘要】
1.基于多源异构数据的用户标签自动化构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述标准化处理后的行为数据,计算不同数据源之间的关联权重矩阵,利用双向注意力机制根据所述关联权重矩阵对不同数据源的行为数据进行自适应特征融合,生成融合特征向量,包括:
3.根据权利要求2所述的方法,其特征在于,基于所述初始关联权重矩阵计算数据源之间的注意力分数,通过正向计算提取数据源间的全局依赖关系得到全局权重矩阵,通过反向计算提取数据源间的局部依赖关系得到局部权重矩阵,将所述全局权重矩阵与所述局部权重矩阵进行自适应加权组合得到优化后的关联权重矩阵,包括:
4.根据权利要求1所述的方法,其特征在于,根据所述融合特征向量对用户进行聚类分析,并基于用户群体的时序漂移程度对聚类中心进行动态调整,得到用户聚类结果,包括:
5.根据权利要求1所述的方法,其特征在于,将用户作为节点构建图结构的标签传播网络,将用户之间的相...
【专利技术属性】
技术研发人员:王渊博,周洋,
申请(专利权)人:中芯万业科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。