AI驱动的交易管理系统技术方案

技术编号:24997524 阅读:30 留言:0更新日期:2020-07-24 17:59
提供了一种对花费数据进行分类的极其自动化的方法,该方法不需要对组织的交易数据的在先深厚知识。对交易数据的文本数据应用自然语言处理以生成包含用于分类的信息的被合并的经清理数据集(CDS)。基于相似性对交易数据的日志进行聚类而形成最小数据集(MDS)。自动化的算法选择高值簇的子集,通过请求用户人工地对该子集中的每个簇中的一个或更多个代表性日志进行分类来对该子集进行分类。然后使用经人工分类的簇子集来训练模型,并且使用该模型来以高的准确度预测剩余日志的花费类别。AI引擎基于客户背景自动地分析预测结果,并且自动调谐机器学习模型或者识别要人工地进行分类的新的簇子集。可以持续该循环,直到95%至100%的花费被分类为止。

【技术实现步骤摘要】
AI驱动的交易管理系统
技术介绍
预算是各组织使它们的成本透明以及提供改善它们的底线的机会的一个关键方面。零基预算(Zero-basedbudgeting,ZBB)是一种预算方法,在该方法中,从零开始有效构建预算,迫使成本所有者重新评估它们的费用。预算是通过对各活动的考核而生成的,所述考核使用价格和消费杠杆来评估企业在即将到来的时期的花费需求,而无论各项预算是高于还是低于先前预算。ZBB通过以使得能够对照先前结果和当前预期进行衡量的方式将预算和相应的花费与特定职能、位置和业务单位以及集团成本且因而战略优先性联系起来而允许在预算过程中推动顶级战略目标。虽然零基预算可以通过避免典型的预算陷阱(诸如相对于前期预算的全面增长或减少)来帮助降低成本,但是零基预算通常是耗时的过程,其比传统的、基于成本的预算耗费更长时间。在某些情况下,为了解价格和消费驱动因素的真实性质,并且为了解花费的哪些部分具有明确价值以及哪些部分是浪费的,各组织将使用交易数据。在某些情况下,这可能需要对数千项或数百万项交易进行排序、分级和分类。会计分级不准确、记录保存杂乱无章、存储效率低下以及与基础财务数据有关的其他问题使得审核这些驱动因素以及准确地对费用进行重新分类较困难。常规的方法需要大量的人力来对数据进行重新分级,通常需要数百个人来审核交易级数据并且将这些数据重新分级至相关的成本类别中。然而,因为不同个人的成本分类知识可能导致非常不透明以及不可复制的分类,所以人为分类可能是较大型问题的不利者。在用于对交易级数据进行评估和分级的一些比较近期的方法中,使用机器学习技术来补充这种人工工作。即使是这些方法,也需要对特定数据集有深厚知识,以便准确地对这些数据集进行分类。虽然这些方法可以成功地减少对花费数据进行人工分类,但是用于对花费数据进行分级的模型和系统通常高度特定于各客户及它们的业务。用于对数据进行分类的模型通常不可转移给其他客户,特别是不可转移给不同行业部门中的那些客户。结果,这些模型的准确度普遍不足。附图说明将参考附图描述根据本公开的各种实施方式,在附图中:图1A和图1B描绘了用于呈现经分类的花费数据并且允许用户研究花费数据的应用程序界面。图2A和图2B描绘了可能包括在原始花费数据中的日志或发票的实施例。图3描绘了项目发生矩阵,该项目发生矩阵可以包括描述个体日志的特性的日志向量。图4描绘了树状图,该树状图示出了可以按层级对日志进行聚类的一种方式。图5例示了对费用日志进行聚类和分类的各方面。图6例示了使用一种或多种机器学习技术来预测费用日志的类别的模型的各方面。图7是提供在本文所描述的方法的基本映射、高值标记和AI映射阶段期间可以如何对花费数据进行分类的一个实施例的曲线图。图8提供了在某些实施方式中可以使用的、用于对花费数据进行分类的方法。具体实施方式根据本公开的各种实施方式的系统和方法可以克服在对数据进行分类和分析的常规方法中所经历的上述缺陷以及其他缺陷中的一个或更多个缺陷。特别地,本文所描述的各种实施方式提供了用于对花费数据进行分类的方法,所述花费数据可以包括总分类帐(generalledger,GL)、应付账款(accountspayable,AP)、采购订单(purchaseorder,PO)信息,包括但不限于交易(transaction)、发票、支出收据、基于供应商的数据集和其他被记录费用,本文统称为花费日志(或者简称为日志)。在从所有相关的数据系统和/或来源收集花费数据之后,对数据进行处理并且进行合并,以生成经清理数据集(cleaneddataset,CDS)。CDS包括已被过滤而去除了不太重要的信息和/或已被处理而对用于日志分类的信息进行标准化的花费数据。在某些情况下,CDS包括经组织的结构,该经组织的结构通过字段类型(例如,总成本、供应者、交易日期等)来划分花费信息。在某些情况下,对花费数据进行标准化涉及对与日志相关联的文本信息应用自然语言处理操作。然后基于词、成本、日期或其他模式和特征的相似性,将来自CDS的日志聚类为组,这将生成具有较小尺寸的新数据集:最小数据集(minimaldataset,MDS)。MDS构成代表相同类型的交易的日志组(例如,“出租车费”和“供应商A”)。基于聚类操作,可以将同一簇内的每个日志映射至同一成本类别。在某些情况下,至少部分地根据聚类结构来确定层级类别结构,并且在某些情况下,类别结构基于特定的客户需求。然后按阶段对日志进行标记或分类,其中使用来自各个簇的一个或更多个代表性日志来确定就与该簇相关联的日志中的每个日志而言的类别信息。在阶段一,可以通过智能算法和预定规则来对日志或簇中的某些日志或簇进行分类——例如,可以自动地对满足特定准则并且包括客户背景信息(例如,包括帐户结构)的日志或簇进行分类。在第二阶段,选择高值簇并且人工地进行分类。在第三阶段,使用经分类的花费数据来训练机器学习模型,并且使用该模型来自动地对剩余的未分类的花费数据进行分类。在某些情况下,可以使用人在回路中(Human-In-the-Loop,HITL)方法来提高分类的准确度。由此,算法确定了模型预测性能的质量。如果确定了花费中的一部分花费的质量低于特定阈值,则该算法要么调整模型参数,要么识别待人工地进行分类的另外日志。然后重复第二阶段和第三阶段,直到95%-100%的花费被分类为止。与常规方法不同,即使当没有对客户实践的在先深厚知识时,本文所公开的方法也是适当的。例如,在使用所公开的方法时,在先分类的大量数据库(例如,通过供应商匹配的)并非是必须的。通过生成花费数据的MDS的操作、对与相似交易相对应的日志进行聚类的操作以及请求用户对高值簇进行分类的操作,可以快速获得合适的训练数据集,所获得的数据集适合于训练模型,而该模型又可以用于以高的准确度自动地对剩余的日志进行分类。通过对日志进行聚类,可以大大减少类别决策数量,这进而使过程更快并且资源密集性更低。所公开的方法还允许如下的机器学习技术,这些机器学习技术允许该过程随着时间的推移变得劳动密集性更低并且更准确。这些优点和其他优点将在下文的描述中变得明显。图1A描绘了一种应用程序,该应用程序用于向用户呈现经分类的花费数据,通常被称为花费立方体。在所描绘的界面100中,描绘了各种级别1类别104a的费用合计102,以及用于向用户传达对经分类的花费数据的划分的可视数据106(曲线图、图表、框图等等)。界面可以提供允许用户研究花费数据的多种用户可选择特征——这允许用户快速地了解组织在所选时期内(例如,1个月、6个月、1年或已提供花费数据的其他选定量)的花费的状态。花费立方体允许用户查看花费在公司的各组织单位内及其之间如何进行分布,从而对所有成本包提供最细粒度级别的透明度。图1B描绘了由应用程序提供的屏幕截图101,该屏幕截图示出了经分类的花费数据的更高分辨率视图,并且从而允许比由图1A中的屏幕截图所示出的更深入的分析。使用各种费用日志被分类于其中的层级分类结构来提供附加细节。在所描绘的界面中,每个级别1本文档来自技高网...

【技术保护点】
1.一种用于对交易记录进行处理的计算机实现方法,所述计算机实现方法包括:/n接收交易数据;/n基于所述交易数据生成经清理的数据集(CDS),所述经清理的数据集包括就多个交易而言的日志,其中每个日志与文本相关联,所述文本的至少一部分已经使用自然语言处理(NLP)被进行了处理;/n至少部分地基于相关联的所述文本和相似性阈值而对来自所述CDS的日志的至少子集进行聚类,其中聚类产生簇集;/n对所述簇集的特定子集进行识别,并且接收用户确定的对于就所述特定子集中的每个簇而言的代表性日志的交易类型,其中所接收到的交易类型与相应的簇的每个日志相关联;/n使用来自所述特定子集的簇的日志和相关联的所述交易类型而对预测模型进行训练;/n使用所述预测模型来对就所述CDS中的还没有与交易类型相关联的日志而言的交易类型进行确定;以及/n生成交易报告,所述交易报告包括至少部分地基于所述日志及其相关联的交易类型所确定的多个计算出的参数。/n

【技术特征摘要】
20190117 US 16/251,0511.一种用于对交易记录进行处理的计算机实现方法,所述计算机实现方法包括:
接收交易数据;
基于所述交易数据生成经清理的数据集(CDS),所述经清理的数据集包括就多个交易而言的日志,其中每个日志与文本相关联,所述文本的至少一部分已经使用自然语言处理(NLP)被进行了处理;
至少部分地基于相关联的所述文本和相似性阈值而对来自所述CDS的日志的至少子集进行聚类,其中聚类产生簇集;
对所述簇集的特定子集进行识别,并且接收用户确定的对于就所述特定子集中的每个簇而言的代表性日志的交易类型,其中所接收到的交易类型与相应的簇的每个日志相关联;
使用来自所述特定子集的簇的日志和相关联的所述交易类型而对预测模型进行训练;
使用所述预测模型来对就所述CDS中的还没有与交易类型相关联的日志而言的交易类型进行确定;以及
生成交易报告,所述交易报告包括至少部分地基于所述日志及其相关联的交易类型所确定的多个计算出的参数。


2.根据权利要求1所述的计算机实现方法,还包括:
对所述簇集的另外子集进行识别以及使用基本映射规则集来对要与所述另外子集的簇的所述日志相关联的交易类型进行确定,其中对所述预测模型进行训练还包括使用来自所述另外子集的所述日志和相关联的所述交易类型来对所述模型进行训练。


3.根据权利要求1所述的计算机实现方法,其中,对所述特定子集的簇进行识别包括至少部分地基于与每个簇相关联的交易值为所述子集选择簇。


4.根据权利要求1所述的计算机实现方法,其中,对所述簇集的特定子集进行识别包括至少部分地基于所述子集中的相应簇之间的距离度量来选择所述簇。


5.根据权利要求1所述的计算机实现方法,其中,生成所述CDS包括去除范围外的日志或重复的日志。


6.一种用于对交易记录进行处理的计算机实现方法,所述计算机实现方法包括:
接收包括多个日志的交易数据,所述日志具有相关联的文本;
基于所述相关联的文本和相似性阈值来对所述日志的至少子集进行聚类,其中聚类产生簇集;
接收用户确定的就所述簇集的特定子集中的每个簇而言的交易类型,其中所接收到的交易类型与相应簇的每个日志相关联;
使用来自所述特定子集的簇的日志和相关联的所述交易类型而对预测模型进行训练;以及
使用所述预测模型来对就另外日志而言的交易类型进行预测。


7.根据权利要求6所述的计算机实现方法,还包括对所述簇集的另外子集进行识别以及使用基本映射规则集来确定要与所述另外子集的簇的日志相关联的交易类型,其中对所述预测模型进行训练还包括使用来自所述另外子集的日志和相关联的所述交易类型来对所述模型进行训练。


8.根据权利要求6所述的计算机实现方法,所述方法还包括:
根据所述交易数据生成日志的经清理的数据集(CDS),其中生成所述CDS包括使用自然语言处理(NLP)来对与所述日志相关联的所述文本的至少一部分进行处理。


9.根据权...

【专利技术属性】
技术研发人员:罗尼·菲灵萨曼莎·肖特阿克塞尔·德古尔萨克拉斐尔·杜布瓦乔格·埃尔莱巴赫卡林·冯·丰克
申请(专利权)人:波士顿咨询集团公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1