一种基于网页语义分析的用户画像优化方法及系统技术方案

技术编号:42081938 阅读:16 留言:0更新日期:2024-07-19 16:59
本发明专利技术提供了一种基于网页语义分析的用户画像优化方法及系统,包括:采集用户在网页上的实时行为数据,并将所述实时行为数据作为预先训练的用户画像模型的输入进行语义提取,输出第一初始用户画像知识;将所述第一初始用户画像知识作为预先训练的蒸馏模型的输入进行深度语义提取,输出描述用户画像的多个实时类别中心词;将多个实时类别中心词作为预先训练的推荐模型的输入进行中心词组合,输出第一组合结果,将所述第一组合结果作为待推荐产品的描述特征;从产品库中查找与描述特征相似度最高的产品特征,并根据所述产品特征对应的产品,向所述用户进行推荐;采用本发明专利技术能够提高运算效率,并同时获取用户画像的精确度,从而提高推荐精确度。

【技术实现步骤摘要】

本专利技术涉及内容推荐,尤其涉及一种基于网页语义分析的用户画像优化方法及系统


技术介绍

1、传统的内容推荐服务通常是基于规则的,然而这种方法会忽略用户本身多方面特征之间的耦合,导致其内容推荐受限,且推送的内容与用户实际需求不匹配;而采用深度学习的内容推荐服务在面对海量特征数据时,直接将所有特征数据喂给模型,由于没有事先判断是否存在无关信息,因此也会将无关信息也喂给了模型,导致模型受到噪声干扰大,从而使得推荐的准确性低;然而,若要提高推荐准确度,就需要多种算法进行联合优化,但又导致模型更大、参数更多和训练收敛速度更慢,从而难以权衡运算资源利用率与推荐准确度。


技术实现思路

1、本专利技术的目的是针对上述现有的相关技术的不足,提出一种基于网页语义分析的用户画像优化方法及系统,能够降低模型参数和运算资源需求,同时提高提高内容推送精确度,从而提高用户体验感。

2、第一方面,本专利技术提供了一种基于网页语义分析的用户画像优化方法,包括:

3、采集用户在网页上的实时行为数据,并将所述实时行为数据本文档来自技高网...

【技术保护点】

1.一种基于网页语义分析的用户画像优化方法,其特征在于,包括:

2.如权利要求1所述的基于网页语义分析的用户画像优化方法,其特征在于,所述蒸馏模型包括:基于文本深度网络的第一教师模型、基于图像深度网络的第二教师模型和基于混合模态的学生模型;所述混合模态是对文本模态和图像模态进行同时学习;所述学生模型是根据所述第一教师模型和第二教师模型进行联合知识蒸馏,并根据历史行为数据与所述推荐模型同时进行离线训练得到的。

3.如权利要求2所述的基于网页语义分析的用户画像优化方法,其特征在于,所述学生模型是根据所述第一教师模型和第二教师模型进行联合知识蒸馏,并根据历史行为数据与所...

【技术特征摘要】

1.一种基于网页语义分析的用户画像优化方法,其特征在于,包括:

2.如权利要求1所述的基于网页语义分析的用户画像优化方法,其特征在于,所述蒸馏模型包括:基于文本深度网络的第一教师模型、基于图像深度网络的第二教师模型和基于混合模态的学生模型;所述混合模态是对文本模态和图像模态进行同时学习;所述学生模型是根据所述第一教师模型和第二教师模型进行联合知识蒸馏,并根据历史行为数据与所述推荐模型同时进行离线训练得到的。

3.如权利要求2所述的基于网页语义分析的用户画像优化方法,其特征在于,所述学生模型是根据所述第一教师模型和第二教师模型进行联合知识蒸馏,并根据历史行为数据与所述推荐模型同时进行离线训练得到的,包括:

4.如权利要求3所述的基于网页语义分析的用户画像优化方法,其特征在于,所述根据所述第二组合结果和所述第一标签,对所述初始学生模型和所述初始推荐模型依次进行参数更新,对应得到训练好的学生模型和推荐模型,包括:

5.如权利要求4所述的基于网页语义分析的用户画像优化方法,其特征在于,根据所述...

【专利技术属性】
技术研发人员:宋瑞银朱鹏
申请(专利权)人:广州风腾网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1