【技术实现步骤摘要】
本专利技术涉及一种基于数据湖的推荐系统数据处理方法、装置及存储介质。
技术介绍
1、推荐系统已成为众多互联网应用的核心组件,其作用在于精准匹配用户需求与海量信息,提升用户满意度与平台的运营效率。然而,随着数据量的激增,传统推荐系统在处理大规模、高维度的特征数据时,暴露出存储与计算效率低、更新不及时、扩展性差等问题。特别是在实时性要求较高的场景下,难以实现有效存储与快速检索特征数据,且无法保证样本数据的时效性与准确性。
2、近年来,数据湖技术的兴起为解决上述问题提供了新思路。数据湖以其开放、灵活的数据存储架构,支持海量数据的存储与分析,尤其在处理非结构化和半结构化数据方面展现出优势。然而,现有技术中还没有基于数据湖技术的推荐系统的相关数据处理方法。
技术实现思路
1、本专利技术提供了一种基于数据湖的推荐系统数据处理方法、装置及存储介质,可以有效解决上述问题。
2、本专利技术是这样实现的:
3、本专利技术提供一种基于数据湖的推荐系统数据处理方法,包括以下步骤
4、本文档来自技高网...
【技术保护点】
1.一种基于数据湖的推荐系统数据处理方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于数据湖的推荐系统数据处理方法,其特征在于,在步骤S1中,短期有效特征,通过动态标签机制划分为高频更新短期有效特征和低频更新短期有效特征,并将所述高频更新短期有效特征存储于Redis缓存,所述频更新短期有效特征存储于Lindorm中,以实现用户ID的特征数据的层次化存储和快速访问。
3.如权利要求1所述的基于数据湖的推荐系统数据处理方法,其特征在于,所述短期有效特征和长期有效特征的分类基于机器学习模型预测不同特征的更新频率,以动态调整特征的类别。
>4.如权利要...
【技术特征摘要】
1.一种基于数据湖的推荐系统数据处理方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于数据湖的推荐系统数据处理方法,其特征在于,在步骤s1中,短期有效特征,通过动态标签机制划分为高频更新短期有效特征和低频更新短期有效特征,并将所述高频更新短期有效特征存储于redis缓存,所述频更新短期有效特征存储于lindorm中,以实现用户id的特征数据的层次化存储和快速访问。
3.如权利要求1所述的基于数据湖的推荐系统数据处理方法,其特征在于,所述短期有效特征和长期有效特征的分类基于机器学习模型预测不同特征的更新频率,以动态调整特征的类别。
4.如权利要求1所述的基于数据湖的推荐系统数据处理方法,其特征在于,长期有效类别的特征数据包括性别、城市、手机号归属地...
【专利技术属性】
技术研发人员:黄俊杰,王庭杰,吕金松,阮争志,郑颖,罗浩,陈晓亮,陈智生,余承超,魏陈超,陈玉明,卢俊文,
申请(专利权)人:厦门她趣信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。