本公开涉及一种用户多维度数据处理方法、装置、电子设备及计算机可读介质。该方法包括:将用户的多维度数据按照维度进行拆分,生成多个数据单元;基于所述多个数据单元确定多个用户特征子模型;将所述多个数据单元中的每一个数据单元分别输入到其对应的用户特征模型中,生成多个特性值;以及基于所述多个特征值确定用户特征。本公开涉及的用户多维度数据处理方法、装置、电子设备及计算机可读介质,根据用户数据的特征确定其对应的机器学习模型,能够获取准确的用户特征分析结果。
User multidimensional data processing methods, devices and electronic equipment
【技术实现步骤摘要】
用户多维度数据处理方法、装置及电子设备
本公开涉及计算机信息处理领域,具体而言,涉及一种用户多维度数据处理方法、装置、电子设备及计算机可读介质。
技术介绍
机器学习现如今在各个人工智能研究领域中已经得到了极大的发展,在当今大部分的应用场景中,人们都可以很方便的找到适合于自身问题的机器学习模型。对于机器学习模型的一般应用来说,用户首先确定某一个类别或者算法的机器学习模型,然后根据用户想解决的特定问题,用户输入特定的数据,机器学习模型建立特定的任务,然后通过特定的数据来对机器学习进行训练,在训练结束后,得到适用于某一个特定任务的机器学习模型。通常情况下,即使用同一个机器学习模型的算法,但是用不同的数据训练得到的机器学习模型是完全不同的。特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。对于常见的用户特征提取而言,特征工程常见的做法是,获取原始用户数据;然后利用数据处理技术,从这些数据中获取、处理和提取有意义的特征和属性生成多维度用户数据。特征工程变量数据在提取之后,会将多维度用户数据输入到机器学期模型中,机器学习模型基于这些数据进行运算,特征工程变量数据的处理时间的和准确度极大的影响整个机器学习模型的计算时间和计算准度,对于同一批用户数据,不同的特征工作生成的多维度用户数据不同,从而得到的机器学习模型也不相同,最终的用户特征结果也不相同。如何尽量减小由不同的特征工程数据处理带来的结果差异,是目前亟待解决的问题之一。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本公开提供一种用户多维度数据处理方法、装置、电子设备及计算机可读介质,根据用户数据的特征确定其对应的机器学习模型,能够获取准确的用户特征分析结果。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提出一种用户多维度数据处理方法,该方法包括:将用户的多维度数据按照维度进行拆分,生成多个数据单元;基于所述多个数据单元确定多个用户特征子模型;将所述多个数据单元中的每一个数据单元分别输入到其对应的用户特征模型中,生成多个特性值;以及基于所述多个特征值确定用户特征。可选地,还包括:基于历史用户的多维度数据与多个机器学习模型生成所述多个用户特征子模型。可选地,基于历史用户的多维度数据与多个机器学习模型生成所述多个用户特征子模型,包括:将历史用户的多维度数据照维度进行拆分,生成多个历史数据单元;基于所述多个历史数据单元的特征确定多个机器学习模型;通过所述多个历史数据单元分别对所述多个机器学习模型进行训练生成所述多个用户特征子模型。可选地,基于所述多个历史数据单元的特征确定多个机器学习模型,包括:对历史数据单元的数据特征进行分析,以确定其对应的机器学习模型;和/或对历史数据单元的数据分布进行分析,以确定其对应的机器学习模型;和/或对历史数据单元的数据状态进行分析,以确定其对应的机器学习模型。可选地,将用户的多维度数据按照维度进行拆分,生成多个数据单元,包括:将用户的多维度数据按照维度进行拆分,生成多个用户数据;以及将所述多个用户数据进行数据处理生成所述多个数据单元。可选地,基于所述多个数据单元确定多个用户特征子模型,包括:确定所述多个数据单元的多个属性特性,以及基于属性特性由特征模型库中筛选出所述多个用户特征子模型。可选地,将所述多个数据单元中的每一个数据单元分别输入到其对应的用户特征子模型中,生成多个特性值,包括:将数据单元输入到其对应的用户特征子模型中;以及用户特征子模型基于所述数据单元中的数据进行计算,生成所述数据单元对应的特征值。可选地,基于所述多个特征值确定用户特征,包括:将所述多个特征值输入到用户特征模型中以确定用户特征。可选地,还包括:通过历史用户的多个特征值和机器学习模型生成所述用户特征模型。可选地,通过历史用户的多个特征值和机器学习模型生成所述用户特征模型,包括:将历史上已进行落地转化的用户对应的多个特征值作为正向标签数据;将历史上未进行落地转化的用户对应的多个特征值作为负向标签数据;通过所述正向标签数据与所述负向标签数据对机器学习模型进行训练生成所述用户特征模型。根据本公开的一方面,提出一种用户多维度数据处理装置,该装置包括:拆分模块,用于将用户的多维度数据按照维度进行拆分,生成多个数据单元;单元模块,用于基于所述多个数据单元确定多个用户特征子模型;输入模块,用于将所述多个数据单元中的每一个数据单元分别输入到其对应的用户特征模型中,生成多个特性值;特征模块,用于基于所述多个特征值确定用户特征。可选地,还包括:子模型训练模块,用于基于历史用户的多维度数据与多个机器学习模型生成所述多个用户特征子模型。可选地,所述子模型训练模块,还用于将历史用户的多维度数据照维度进行拆分,生成多个历史数据单元;基于所述多个历史数据单元的特征确定多个机器学习模型;通过所述多个历史数据单元分别对所述多个机器学习模型进行训练生成所述多个用户特征子模型。可选地,所述子模型训练模块,包括:模型确定单元,用于对历史数据单元的数据特征进行分析,以确定其对应的机器学习模型;和/或对历史数据单元的数据分布进行分析,以确定其对应的机器学习模型;和/或对历史数据单元的数据状态进行分析,以确定其对应的机器学习模型。可选地,进行拆分,生成多个用户数据;以及处理单元,用于将所述多个用户数据进行数据处理生成所述多个数据单元。可选地,所述单元模块,包括:筛选单元,用于确定所述多个数据单元的多个属性特性,以及基于属性特性由特征模型库中筛选出所述多个用户特征子模型。可选地,所述输入模块,包括:输入单元,用于将数据单元输入到其对应的用户特征子模型中;以及计算单元,用于用户特征子模型基于所述数据单元中的数据进行计算,生成所述数据单元对应的特征值。可选地,所述特征模块,还用于将所述多个特征值输入到用户特征模型中以确定用户特征。可选地,还包括:模型训练单元,用于通过历史用户的多个特征值和机器学习模型生成所述用户特征模型。可选地,所述模型训练单元,还用于将历史上已进行落地转化的用户对应的多个特征值作为正向标签数据;将历史上未进行落地转化的用户对应的多个特征值作为负向标签数据;通过所述正向标签数据与所述负向标签数据对机器学习模型进行训练生成所述用户特征模型。根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。根据本公开的用户多维度数据处理方法、装置、电子设备及计算机可读介质,将用户的多维度数据按照维度进行拆分,生成多本文档来自技高网...
【技术保护点】
1.一种用户多维度数据处理方法,其特征在于,包括:/n将用户的多维度数据按照维度进行拆分,生成多个数据单元;/n基于所述多个数据单元确定多个用户特征子模型;/n将所述多个数据单元中的每一个数据单元分别输入到其对应的用户特征模型中,生成多个特性值;以及/n基于所述多个特征值确定用户特征。/n
【技术特征摘要】
1.一种用户多维度数据处理方法,其特征在于,包括:
将用户的多维度数据按照维度进行拆分,生成多个数据单元;
基于所述多个数据单元确定多个用户特征子模型;
将所述多个数据单元中的每一个数据单元分别输入到其对应的用户特征模型中,生成多个特性值;以及
基于所述多个特征值确定用户特征。
2.如权利要求1所述的方法,其特征在于,还包括:
基于历史用户的多维度数据与多个机器学习模型生成所述多个用户特征子模型。
3.如权利要求1-2所述的方法,其特征在于,基于历史用户的多维度数据与多个机器学习模型生成所述多个用户特征子模型,包括:
将历史用户的多维度数据照维度进行拆分,生成多个历史数据单元;
基于所述多个历史数据单元的特征确定多个机器学习模型;
通过所述多个历史数据单元分别对所述多个机器学习模型进行训练生成所述多个用户特征子模型。
4.如权利要求1-3所述的方法,其特征在于,基于所述多个历史数据单元的特征确定多个机器学习模型,包括:
对历史数据单元的数据特征进行分析,以确定其对应的机器学习模型;和/或
对历史数据单元的数据分布进行分析,以确定其对应的机器学习模型;和/或
对历史数据单元的数据状态进行分析,以确定其对应的机器学习模型。
5.如权利要求1-4所述的方法,其特征在于,将用户的多维度数据按照维度进行拆分,生成多个数据单元,包括:
将用户的多维度数据按照维度进行拆分,生成多个用户数据;以及...
【专利技术属性】
技术研发人员:董静,常富洋,
申请(专利权)人:北京淇瑀信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。