当前位置: 首页 > 专利查询>SAP欧洲公司专利>正文

基于机器学习确定数据对象的类别制造技术

技术编号:31456136 阅读:30 留言:0更新日期:2021-12-18 11:22
一些实施例提供了存储程序的非暂时性机器可读介质。程序从存储装置中检索多个交易数据。多个交易数据中的每个交易数据包括项目和与该项目相关联的金额。基于多个交易数据,程序还确定金额范围集。基于金额范围集和数据对象集,程序还确定类别集。数据对象集中的每个数据对象属于类别集中的一类别。数据对象属于类别集中的一类别。数据对象属于类别集中的一类别。

【技术实现步骤摘要】
基于机器学习确定数据对象的类别


[0001]本申请涉及数据分类技术,更具体地涉及基于机器学习确定数据对象的类别的技术。

技术介绍

[0002]机器学习(ML)是涉及对通过经验来自动改进的计算机算法的研究的人工智能的子集。例如,ML算法可以基于样本数据(也被称为训练数据)建立数学模型,以便在没有被明确编程的情况下进行预测或决策。这些类型的ML算法通常被称为监督学习ML算法。另一类型的ML算法在没有预先存在的标签且几乎没有人监督的情况下,识别数据集中的隐藏模式。这些类型的ML算法通常被称为无监督学习ML算法。ML算法有多种不同的应用。例如,ML算法可以用于电子邮件过滤、情感分析、欺诈检测、计算机视觉、手写辨识、搜索引擎等。

技术实现思路

[0003]在一些实施例中,非暂时性机器可读介质存储可由设备的至少一个处理单元执行的程序。程序从存储装置(storage)中检索多个交易数据。多个交易数据中的每个交易数据包括项目(item)和与项目相关联的金额(amount)。基于多个交易数据,程序还确定金额范围集。基于金额范围集和数据对象集,程序本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种存储可由设备的至少一个处理单元执行的程序的非暂时性机器可读介质,所述程序包括指令集,所述指令集用于:从存储装置中检索多个交易数据,所述多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;基于所述多个交易数据,确定金额范围集;以及基于所述金额范围集和数据对象集,确定类别集,其中,所述数据对象集中的每个数据对象属于所述类别集中的类别。2.根据权利要求1所述的非暂时性机器可读介质,其中,确定所述金额范围集包括使用贝叶斯块算法来确定所述金额范围集。3.根据权利要求2所述的非暂时性机器可读介质,其中,所述程序还包括指令集,所述指令集用于:基于所述多个交易数据中的金额,确定唯一金额集;从最小到最大对所述唯一金额集排序;对于所述唯一金额集中的每对连续唯一金额,确定所述对连续唯一金额之间的中点;以及使用所述中点作为贝叶斯块算法的输入。4.根据权利要求1所述的非暂时性机器可读介质,其中,确定所述类别集包括使用分层的基于密度的聚类选择(HDBSCAN)算法。5.根据权利要求4所述的非暂时性机器可读介质,其中,所述数据对象集包括用户集,其中,所述程序还包括指令集,所述指令集用于:从客户端设备接收对用户的多个推荐项目的请求;确定与所述用户相关联的类别;识别与用户集相关联的交易数据,其中,所述用户集中的每个用户与所述类别相关联;确定在所识别的交易数据中具有最多实例的定义数量的项目;以及向所述客户端设备提供所述定义数量的项目。6.根据权利要求1所述的非暂时性机器可读介质,其中,所述数据对象集包括与第一租户相关联的用户集,其中,所述多个交易数据是与所述第一租户相关联的第一多个交易数据,其中,所述金额范围集是第一金额范围集,其中,所述类别集是第一类别集,其中,所述程序还包括指令集,所述指令集用于:从所述存储装置中检索与第二租户相关联的第二多个交易数据,所述第二多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;基于所述第二多个交易数据,确定第二金额范围集;以及基于所述第二金额范围集和与所述第二租户相关联的第二数据对象集,确定第二类别集,其中,所述第二数据对象集中的每个数据对象属于所述第二类别集中的类别。7.根据权利要求1所述的非暂时性机器可读介质,其中,确定所述类别集还基于活动数据集。8.一种方法,包括:从存储装置中检索多个交易数据,所述多个交易数据中的每个交易数据包括项目和与所述项目相关联的金额;
基于所述多个交易数据,确定金额范围集;以及基于所述金额范围集和数据对象集,确定类别集,其中,所述数据对象集中的每个数据对象属于所述类别集中的类别。9.根据权利要求8所述的方法,其中,确定所述金额范围集包括使用贝叶斯块算法来确定所述金额范围集。10.根据权利要求9所述的方法,还包括:基于所述多个交易数据中的金额,确定唯一金额集;从最小到最大对所述唯一金额集排序;对于所述唯一金额集中的每对连续唯一金额,确定所述对连续唯一金额之间的中点;以及使用所述中点作为贝叶斯块算法的输入。11.根据权利要求8所述的方法,其中,确定所述类别集包括使用分层的基于密度的聚类选择(HDBSCAN)算法。12.根据权利要求11所述的方法,其中,所述数据对象集包括用户集,其中,所述方法还包...

【专利技术属性】
技术研发人员:C伍德B阮V怀科夫PR塔蒂尼N方
申请(专利权)人:SAP欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1