System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机应用,尤其涉及一种数据处理方法、装置、电子设备和存储介质。
技术介绍
1、随着互联网技术的发展,银行领域内掌银功能不断丰富,伴随着掌银用户的数量增长,用户行为数据也在海量增加。目前银行领域内往往会对这些海量用户数据先进性过滤分析,然后针对用户提供客制化服务,例如提供精细化服务或准确化信息推荐等。
2、目前,掌银常见用户行为数据常常包括页面、广告何时被用户点击、停留的时间等埋点数据,这些数据基于时间或空间的先后次序,并且在大数据访问模式下,这些数据存储在分布式文件系统中,如hadoop等,目前基于机器学习、深度学习等基于学习的方法存在训练时间过长和预测时间长等问题,不能及时的为用户进行推荐,并且关联规则挖掘算法会生成过量的候选项目集挖掘和匹配的过程耗时较长,也无法很好地满足生产环境的时效性需求。目前亟需一种高效的数据处理方法,以提高数据特征密度,便于数据进行挖掘推荐等场景的应用。
技术实现思路
1、本专利技术提供了一种数据处理方法、装置、电子设备和存储介质,旨在通过对历史用户数据集按照时间顺序进行处理,以提高数据特征密度,可增强数据利用的便利性,便于基于处理后的数据进行数据挖掘以及数据推荐,可提高用户的使用体验。
2、根据本专利技术的一方面,提供了一种数据处理方法,其中,该方法包括:
3、根据历史用户数据集确定不同用户的时间数据序列;
4、根据预设支持度阈值在对应所述不同用户的时间数据序列确定频繁序列;
6、根据本专利技术的另一方面,提供了一种数据处理装置,其中,该装置包括:
7、序列确定模块,用于根据历史用户数据集确定不同用户的时间数据序列;
8、频繁序列模块,用于根据预设支持度阈值在对应所述不同用户的时间数据序列确定频繁序列;
9、模糊合并模块,用于基于预设条件对确定出的各所述频繁序列进行模糊合并。
10、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的数据处理方法。
14、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的数据处理方法。
15、本专利技术实施例的技术方案,通过对历史数据进行按照不同用户划分为时间数据序列,基于预设支持度阈值在应不同用户的时间数据序列内确定频繁序列,按照预设条件对频繁序列进行模糊合并,解决了数据特征密度低,数据利用率低的问题,便于基于处理后的数据进行数据挖掘以及数据推荐,可提高用户的使用体验。
16、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述方法,其特征在于,所述根据历史用户数据集确定不同用户的时间数据序列,包括:
3.根据权利要求1所述方法,其特征在于,所述根据预设支持度阈值在对应所述不同用户的时间数据序列确定频繁序列,包括:
4.根据权利要求3所述方法,其特征在于,所述根据所述支持度和所述预设支持度阈值将所述时间数据序列处理为所述频繁序列,包括:
5.根据权利要求1所述方法,其特征在于,所述基于预设条件对确定出的各所述频繁序列进行模糊合并,包括以下至少之一:
6.根据权利要求1所述方法,其特征在于,还包括:
7.根据权利要求6所述方法,其特征在于,所述预设时间窗包括的维度至少包括时间维度以及数据序列长度维度。
8.一种数据处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述方法,其特征在于,所述根据历史用户数据集确定不同用户的时间数据序列,包括:
3.根据权利要求1所述方法,其特征在于,所述根据预设支持度阈值在对应所述不同用户的时间数据序列确定频繁序列,包括:
4.根据权利要求3所述方法,其特征在于,所述根据所述支持度和所述预设支持度阈值将所述时间数据序列处理为所述频繁序列,包括:
5.根据权利要求1所述方法,其特征在于,所述基于预设条件对确定出的各所述频繁...
【专利技术属性】
技术研发人员:路建业,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。