System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于快速且准确的异常检测的元模型和特征生成制造技术_技高网

用于快速且准确的异常检测的元模型和特征生成制造技术

技术编号:40088891 阅读:6 留言:0更新日期:2024-01-23 15:53
公开了用于快速且准确地训练机器学习模型以执行与新上下文相关的任务的方法和系统,特别是几乎没有可用训练数据的新上下文。一个或多个源数据集可被分成多个源子集,所述多个源子集可用于训练多个源子模型。根据此多个源子模型,可以确定估计参数集。所述估计参数集和目标数据集(可以包括相对较少数量的数据元素)可以用于训练目标模型来执行一些任务。这样,可以利用所述源数据集来训练所述目标模型。此外,公开了生成颜色映射,即非图像数据的图像表示的新颖方法。这些颜色映射可用于训练所述子模型和所述目标模型,从而提高模型性能。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、在数据分析领域,机器学习可用于在特定上下文(例如,电子邮件消息)中完成任务(例如,检测垃圾邮件)。通常,数据科学家将使用大量数据(例如,包括正常邮件消息和垃圾电子邮件消息)、大量计算资源(例如,服务器计算机网络)以及几个小时或几天的计算时间来训练机器学习模型。然后,经训练的模型可用于完成其各自的任务,例如,识别传入的电子邮件消息是正常的还是垃圾邮件。

2、有时,特定任务(例如垃圾邮件检测)适用于多个上下文。例如,机器学习模型可用于检测垃圾电子邮件消息或垃圾邮件文本消息。通常,数据科学家为每个上下文开发单独的模型,例如,用于检测垃圾电子邮件消息的第一模型和用于检测垃圾邮件文本消息的第二模型。就时间、数据和计算资源而言,这种建模策略可能是昂贵的,因为需要为每个上下文训练不同的模型,并且每个模型需要大量的数据、大量的计算资源和几个小时来训练。

3、已建立的上下文(例如,已经存在几年的那些上下文)通常具有大量的现有训练数据。对于这些环境,有可能开发出可用于特定任务的有效机器学习模型。例如,存在大量可用于诸如检测欺诈性信用卡交易之类的任务的可用信用卡交易数据。然而,对于新的上下文,通常不存在大量的可用训练数据。例如,“实时支付”,即在短时间段内发起并结算的支付,相对较新并且几乎没有数据可用。因此,难以开发机器学习模型来例如检测欺诈性实时支付。

4、由于新计算机和互联网技术的发展,新的上下文频繁出现,并且因此,难以训练机器学习模型来执行与这些新上下文相对应的任务。因此,需要用于训练机器学习模型的新方法来克服上述问题。

5、实施方案单独地和共同地解决了这些和其他问题。


技术实现思路

1、本公开的实施方案涉及新的机器学习模型和训练方法。这些方法可以用于快速训练机器学习模型来执行任务,即使对于没有大量可用训练数据的新上下文也是如此。总之,实施方案可以通过利用用于类似上下文和任务的现有数据,以及使用用于训练目标机器学习模型的输入数据的新颖的“图像表示”或“颜色映射”表示来实现这一点。

2、在整个公开中,术语“源”通常用于指数据集、上下文、任务等,它们是“公认的”,并且对于它们,存在大量可用的有用训练数据。术语“目标”通常用于指数据集、上下文、任务等,对于它们,几乎没有可用的数据,这可能是因为目标上下文是新的,即对应于新的技术或实践(例如,实时支付)。常规地,可能难以训练目标机器学习模型来执行对应于这些新目标上下文的任务,因为几乎没有训练数据可用。本公开的实施方案提供了可用于克服这些困难的新颖训练方法。

3、在实施方案中,为了训练目标模型(例如,用于检测欺诈性实时支付),计算机系统可以使用一个或多个源数据集来生成多个源子集。作为示例,计算机系统可以将包括1000万个数据元素的源数据集分成10,000个子集,每个子集包括例如1,000个数据元素。多个子集中的每个子集可用于训练子模型来执行子任务。例如,如果源数据集包括对应于正常信用卡交易和欺诈性信用卡交易的信用卡交易数据,则可以训练每个子模型来识别其对应的子集中的欺诈性信用卡交易。

4、在训练子模型之后,计算机系统可以使用经训练的子模型和它们各自的模型参数来确定估计参数集。稍后,估计参数集可用于促进目标机器学习模型(例如,实时支付欺诈检测模型)的训练。在正常条件下,可能难以训练该目标机器学习模型,因为它可能对应于几乎没有可用训练数据的上下文和任务。然而,通过使用这种参数估计方法,实施方案可以利用现有的源数据来训练目标机器学习模型,即使在只存在少量可用目标数据时。

5、除了在精度(大约7%改进)和召回率(大约10%改进)方面比诸如深度神经网络之类的传统模型实现更好的性能之外,实施方案极大地减少了训练目标模型(诸如卷积神经网络)以执行新任务所需的训练数据量。对于需要超过1000万个数据元素以便训练常规深度神经网络的任务,本公开的实施方案可能仅需要大约20,000个数据元素。同样,本公开的实施方案可以用于比常规深度神经网络快大致120倍地针对新任务训练目标模型。

6、本公开的实施方案的另一个方面是使用“颜色映射”,这是输入数据(通常是非图像)的新颖配置。在训练子模型或目标模型之前,可以对来自源数据集或目标数据集的数据执行特征提取,以便产生源特征向量和目标特征向量。这些特征向量然后可以被转换成颜色映射,该颜色映射可用于训练子模型或目标模型。例如,1×192特征向量可以被转换成具有3个颜色通道(例如,红色、绿色和蓝色)的8×8颜色映射。该转换过程可用于将数据向量中的元素之间的关系捕获为颜色映射中“像素”之间的空间关系。子模型或目标模型可以更容易地检测到这些空间关系,从而提高模型性能。此外,这些颜色映射使得能够使用通常用于图像处理的高效机器学习模型,诸如卷积神经网络(cnn)。

7、一个实施方案涉及由计算机系统执行的用于训练目标模型以将多个目标数据值分类为正常或异常的方法。计算机系统可以使用一个或多个源数据集来生成多个源子集。一个或多个源数据集可包括多个源数据值。每个源子集可以包括来自多个源数据值的源数据值的子集。可以标记源数据值。计算机系统可以训练对应于多个源子集的多个子模型,以对多个源子集中的多个源数据值进行分类。在这样做时,计算机系统可以产生多个损失函数,这些损失函数可以将多个性能度量与多个子模型参数集相关。多个性能度量中的每个性能度量和多个子模型参数集中的每个子模型参数集可以对应于多个子模型中的子模型。计算机系统可以使用多个损失函数来确定估计参数集,并使用目标数据集和估计参数集来训练目标模型,在这样做时,生成对应于目标模型的目标参数集。训练目标模型可使得目标模型能够用于将多个目标数据值分类为正常或异常。

8、另一个实施方案涉及由计算机系统执行的方法。计算机系统可以接收包括多个数据值的数据集,这些数据值可以被标记。计算机系统可以对多个数据值执行特征提取过程,从而产生多个数据向量,每个数据向量包括多个特征值。对于多个数据向量中的每个数据向量,计算机系统可以基于数据向量中的多个特征值中的特征值的数量来确定宽度维度、高度维度和深度维度。计算机系统还可以生成包括多个值单元的一个或多个值映射,其中一个或多个值映射中的值映射的数量等于深度维度。一个或多个值映射中的每个值映射的宽度可以等于宽度维度,并且一个或多个值映射中的每个值映射的高度等于高度维度。计算机系统可以通过将多个特征值指派给多个值单元,使用多个特征向量来填充一个或多个值映射。计算机系统可以基于一个或多个值映射生成包括多个颜色单元的一个或多个颜色映射,多个颜色单元中的每个颜色单元与对应于特征值的颜色值相关联。每个颜色映射可以与一个或多个颜色通道中的特定颜色通道相关联。计算机系统可以生成包括一个或多个颜色映射的统一颜色映射,从而生成多个统一颜色映射。计算机系统可以使用多个统一颜色映射和对应于多个数据值的多个标签来训练机器学习模型。

9、下文详细描述本公开的这些和其他实施方案。例如,其他实本文档来自技高网...

【技术保护点】

1.一种用于训练目标模型以将多个目标数据值分类为正常或异常的方法,所述方法包括由计算机系统执行:

2.如权利要求1所述的方法,其中使用多个处理器并行训练所述多个子模型,并且其中所述方法还包括在所述多个处理器之间划分所述多个子模型。

3.如权利要求1所述的方法,其中所述多个子模型包括多个子任务模型,所述多个子任务模型中的每个子任务模型与多个子任务中的子任务相关联,所述多个子任务中的每个子任务包括将对应源子集的源数据值分类为正常或异常,并且其中所述目标模型包括目标任务模型,与目标任务相关联的所述目标任务模型包括将所述多个目标数据值分类为正常或异常。

4.如权利要求1所述的方法,其中所述多个性能度量中的每个性能度量包括损失度量或误差度量,所述损失度量或所述误差度量基于多个标签和多个分类之间的差异来测量对应子模型的性能,其中所述多个标签和所述多个分类对应于与所述对应子模型相对应的源子集。

5.如权利要求1所述的方法,其中使用所述目标数据集和所述估计参数集来训练所述目标模型是使用贝叶斯元学习过程来完成的,所述过程包括:

6.如权利要求1所述的方法,其中:

7.如权利要求6所述的方法,其中所述多个源事件包括多个源实时交易,并且其中所述多个目标事件包括多个目标实时交易。

8.如权利要求1所述的方法,其中:

9.如权利要求8所述的方法,其中每个源特征向量包括多个源特征值,并且其中使用所述多个源特征向量生成所述多个源统一颜色映射包括,对于所述多个源特征向量中的每个源特征向量:

10.如权利要求8所述的方法,其中每个目标特征向量包括多个目标特征值,并且其中使用所述多个目标特征向量生成所述多个目标统一颜色映射包括,对于所述多个目标特征向量中的每个目标特征向量:

11.一种方法,所述方法包括由计算机系统执行:

12.如权利要求11所述的方法,还包括在基于特征值的所述数量确定所述宽度维度、所述高度维度和所述深度维度之后:

13.如权利要求11的方法,其中所述宽度维度、所述高度维度和所述深度维度的乘积等于每个特征向量中的特征值的所述数量,并且其中所述宽度维度等于所述高度维度。

14.如权利要求11所述的方法,其中所述宽度维度至少为二,所述高度维度至少为二,并且所述深度维度至少为一。

15.如权利要求11所述的方法,其中所述一个或多个颜色通道包括青色通道、品红色通道、黄色通道和黑色通道。

16.如权利要求11所述的方法,其中所述一个或多个颜色通道包括红色通道、绿色通道和蓝色通道。

17.如权利要求16所述的方法,其中所述一个或多个颜色通道另外包括阿尔法通道。

18.如权利要求11所述的方法,其中使用所述多个特征值填充所述一个或多个值映射包括,对于所述多个特征值中的每个特征值:

19.如权利要求18所述的方法,其中所述特征值对应于在对应时间段内发生的事件的数量,其中所述特征值的所述时间特性是所述对应时间段,其中所述多个列中的每一列对应于多个时间段中的时间段,并且其中所述列对应于所述对应时间段。

20.一种计算机系统,所述计算机系统包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于训练目标模型以将多个目标数据值分类为正常或异常的方法,所述方法包括由计算机系统执行:

2.如权利要求1所述的方法,其中使用多个处理器并行训练所述多个子模型,并且其中所述方法还包括在所述多个处理器之间划分所述多个子模型。

3.如权利要求1所述的方法,其中所述多个子模型包括多个子任务模型,所述多个子任务模型中的每个子任务模型与多个子任务中的子任务相关联,所述多个子任务中的每个子任务包括将对应源子集的源数据值分类为正常或异常,并且其中所述目标模型包括目标任务模型,与目标任务相关联的所述目标任务模型包括将所述多个目标数据值分类为正常或异常。

4.如权利要求1所述的方法,其中所述多个性能度量中的每个性能度量包括损失度量或误差度量,所述损失度量或所述误差度量基于多个标签和多个分类之间的差异来测量对应子模型的性能,其中所述多个标签和所述多个分类对应于与所述对应子模型相对应的源子集。

5.如权利要求1所述的方法,其中使用所述目标数据集和所述估计参数集来训练所述目标模型是使用贝叶斯元学习过程来完成的,所述过程包括:

6.如权利要求1所述的方法,其中:

7.如权利要求6所述的方法,其中所述多个源事件包括多个源实时交易,并且其中所述多个目标事件包括多个目标实时交易。

8.如权利要求1所述的方法,其中:

9.如权利要求8所述的方法,其中每个源特征向量包括多个源特征值,并且其中使用所述多个源特征向量生成所述多个源统一颜色映射包括,对于所述多个源特征向量中的每个源特征向量:

1...

【专利技术属性】
技术研发人员:田晓C·切蒂亚Y·谢
申请(专利权)人:维萨国际服务协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1