一种基于数据模糊性的在线学习方法、设备及介质技术

技术编号:29956005 阅读:11 留言:0更新日期:2021-09-08 08:56
本申请公开了一种基于数据模糊性的在线学习方法、设备及介质,用以解决输入在线学习模型的输入数据过多,且输入的数据中具有典型性的数据相对稀疏等技术问题。方法包括:服务器基于训练样本数据完成模糊分类器的训练,其中,模糊分类器的数量为2N+1个,N为正整数;将来自终端的数据流输入到模糊分类器中;确定数据流中各个输入数据的模糊度;根据预设选取方式和输入数据的模糊度,确定来自终端的数据流中具有典型性的输入数据,并将具有典型性的输入数据发送给终端,其中,具有典型性的输入数据用于使终端更新随机权神经网络的在线学习模型。本申请通过上述方法降低了输入在线学习模型的输入数据数量,同时保证了输入数据的典型性。型性。型性。

【技术实现步骤摘要】
一种基于数据模糊性的在线学习方法、设备及介质


[0001]本申请涉及深度学习
,尤其涉及一种基于数据模糊性的在线学习方法、设备及介质。

技术介绍

[0002]在一些实际应用场景中,对学习模型进行训练的数据要随着时间的推移逐步获取,传统的一次性获取全部训练数据的批量机器学习模型不再满足这些实际应用场景的需求,这使得能够不断更新自我学习机制的在线学习模型得到了广泛应用。因为随机权神经网络学习速度快和对硬件计算资源要求低等优点,随机权神经网络被逐渐被应用在线学习模型中。
[0003]但是,基于随机权神经网络的在线学习模型并不能有效处理海量的输入数据,需要先降低海量数据的数量。现阶段,降低在线学习模型输入的数据量的方法有:(1)、改进随机权神经网络,如,Liang NY等人将基于极限学习机算法设计为在线序贯极限学习机算法;(2)、增加数据过滤器,如,基于数据异常的数据过滤器。
[0004]虽然,上述方法能够在一定程度上降低输入的数据量,但是,当输入的数据激增时,基于随机权神经网络的在线学习模型获得的输入数据依然过多,且输入的数据中具有典型性的数据相对稀疏。也就是说,具有典型性的数据依然被隐藏在过多的非典型数据中,训练学习模型的效果不佳,该学习模型的泛化能力较弱。

技术实现思路

[0005]本申请实施例提供了一种基于数据模糊性的在线学习方法、设备及介质,用以解决现有的基于随机权神经网络的在线学习模型的输入数据过多,且输入的数据中具有典型性的数据相对稀疏,导致该学习模型的泛化能力弱等技术问题
[0006]第一方面,本申请实施例提供了一种基于数据模糊性的在线学习方法服务器基于训练样本数据完成模糊分类器的训练,其中,模糊分类器的数量为2N+1个,N为正整数;将来自终端的数据流输入到模糊分类器中,其中,数据流中包含若干个输入数据;根据预设投票机制,确定各个输入数据的模糊度;根据预设选取方式和输入数据的模糊度,确定来自终端的数据流中具有典型性的输入数据,并将具有典型性的输入数据发送给终端,其中,具有典型性的输入数据用于使终端更新随机权神经网络的在线学习模型。
[0007]本申请实施例提供的在线学习方法,通过2N+1个模糊分类器,确定了输入数据对应的模糊度,提高了模糊分类器计算模糊度的准确性;其中,通过模糊分类器计算各个输入数据的模糊度,实现了从若干个输入数据中确定高模糊度(典型性)的输入数据的效果;在确定输入数据对应的模糊度后,模糊分类器根据输入数据的模糊度大小来对大规模的数据流进行筛选,将数据规模从极大转化为相对较小,实现了降低数据规模,避免了大规模数据求解极大矩阵的广义逆的带来的不准确性的问题;然后,将具有典型性的输入数据发送给终端,实现了将这些最有学习价值的数据(具有典型性的数据)应用于终端的在线模型的更
新中。本申请实施例中的终端将具有典型性的数据应用在在线学习模型的更新中,这些高模糊性(具有典型性)的数据能够有效提升在线模型的泛化能力,以及提高终端的在线学习模型的更新稳定性和预测准确性。此外,输入终端数据规模的降低,使得其它相关的模型也能够在配置不变的终端设备中进行有效的训练。
[0008]在本申请的一种实现方式中,根据预设投票机制,确定各个输入数据的模糊度,具体包括:通过2N+1个模糊分类器,获取输入数据的若干个预测模糊度;根据预设分类等级,将输入数据对应的若干个预测模糊度进行预测等级的划分,以确定输入数据对应的若干个预测等级;根据预设投票机制对若干个预测等级进行投票,确定输入数据的分类等级;根据输入数据的分类等级,确定输入数据的模糊度。
[0009]本申请实施例提供的在线学习方法,将一个输入数据输入到2N+1个模糊分类器中,通过多个模糊度确定该输入数据对应的分类等级,进而确定该输入数据的对应模糊度,提高了模糊分类器计算模糊度发准确性,有利于服务器筛选出有价值的输入数据。
[0010]在本申请的一种实现方式中,根据预设投票机制对若干个预测等级进行投票,确定输入数据的分类等级,根据输入数据的分类等级,确定输入数据的模糊度,具体包括:在确定输入数据对应的若干个预测等级后;根据少数服从多数的投票机制,将出现次数最多的预测等级,确定为输入数据对应的分类等级;将与分类等级相同的预测等级设置为计算等级;确定若干计算等级的预测模糊度的平均数,并将平均数设置为输入数据的模糊度。
[0011]在本申请的一种实现方式中,2N+1个模糊分类器中的第一模糊分类器,通过计算输入数据对应的模糊度;2N+1个模糊分类器中的第二模糊分类器,通过计算输入数据对应的模糊度;2N+1个模糊分类器中的第三模糊分类器,通过计算输入数据对应的模糊度;其中,F(μ)表示模糊度,μ
i
为输入数据中第i条样本的预设类别的隶属度向量。
[0012]本申请实施例提供的在线学习方法,通过引用数学模型中计算模糊性的方法计算输入数据的模糊度,增加了模糊分类器计算输入数据的模糊度的方法,避免了单一公式计算模糊度带来的计算误差,提高了模糊度的可信性。
[0013]在本申请的一种实现方式中,根据预设选取方式和输入数据的模糊度,确定来自终端的数据流中具有典型性的输入数据,并将具有典型性的输入数据发送给终端,具体包括:在确定数据流中各个输入数据的模糊度之后,将各个输入数据按照模糊度进行排序;根据预设比例,确定具有典型性的输入数据,并将输入数据发送给终端。
[0014]在本申请的一种实现方式中,方法还包括:当满足预设更新条件时,根据当前获取的数据流更新训练样本,再次对模糊分类器进行训练,以更新模糊分类器;其中,满足预设更新条件,具体包括以下任意一下或多项:检测到模糊分类器的工作时间,达到预设更新时间;检测到模糊分类器的分类准确率,低于预设阈值。
[0015]本申请实施例提供的在线学习方法,通过不同的预设更新条件对模糊分类器进行更新,实现了模糊分类器的不断更新,提高了模糊分类器发泛化能力。
[0016]在本申请的一种实现方式中,在服务器基于训练样本数据完成模糊分类器的训练前,方法还包括:获取终端输入的数据流,标记数据流中的部分输入数据,以获得训练样本数据;基于训练样本数据对模糊分类器中的模糊神经网络进行训练,以确定模糊神经网络对应的权重和偏置,进而完成模糊分类器的训练。
[0017]在本申请的一种实现方式中,服务器接收多个终端的数据流,当多个终端在同一时间段向服务器发送数据流时,服务器按照预设接收方式依次接收各个终端的数据流;其中,预设接收方式,包括以下任意一项或多项:按照发送数据流的时间的先后顺序,依次接收各个数据流;按照各个终端的预设接收等级,接收各个数据流。
[0018]第二方面,本申请实施例还提供了一种基于数据模糊性的在线学习设备,设备包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被执行时,使得处理器执行上述的一种基于数据模糊性的在线学习方法。
[0019]第三方面,本申请实施例还提供了一种非易失性计算机存储介质,其上存储有计算机指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据模糊性的在线学习方法,其特征在于,所述方法包括:服务器基于训练样本数据完成模糊分类器的训练,其中,所述模糊分类器的数量为2N+1个,N为正整数;将来自终端的数据流输入到所述模糊分类器中,其中,数据流中包含若干个输入数据;根据预设投票机制,确定各个所述输入数据的模糊度;根据预设选取方式和所述输入数据的模糊度,确定来自终端的数据流中具有典型性的所述输入数据,并将具有典型性的所述输入数据发送给所述终端,其中,具有典型性的所述输入数据用于使所述终端更新随机权神经网络的在线学习模型。2.根据权利要求1所述的一种基于数据模糊性的在线学习方法,其特征在于,根据预设投票机制,确定各个所述输入数据的模糊度,具体包括:通过所述2N+1个模糊分类器,获取所述输入数据的若干个预测模糊度;根据预设分类等级,将所述输入数据对应的若干个所述预测模糊度进行预测等级的划分,以确定所述输入数据对应的若干个预测等级;根据预设投票机制对若干个预测等级进行投票,确定所述输入数据的分类等级;根据所述输入数据的所述分类等级,确定所述输入数据的所述模糊度。3.根据权利要求2所述的一种基于数据模糊性的在线学习方法,其特征在于,根据预设投票机制对若干个预测等级进行投票,确定所述输入数据的分类等级,根据所述输入数据的所述分类等级,确定所述输入数据的所述模糊度,具体包括:在确定所述输入数据对应的若干个预测等级后;根据少数服从多数的投票机制,将出现次数最多的预测等级,确定为所述输入数据对应的分类等级;将与所述分类等级相同的预测等级设置为计算等级;确定若干所述计算等级的预测模糊度的平均数,并将平均数设置为所述输入数据的模糊度。4.根据权利要求1所述的一种基于数据模糊性的在线学习方法,其特征在于,所述2N+1个所述模糊分类器中的第一模糊分类器,通过计算所述输入数据对应的模糊度;所述2N+1个所述模糊分类器中的第二模糊分类器,通过计算所述输入数据对应的模糊度;所述2N+1个所述模糊分类器中的第三模糊分类器,通过计算所述输入数据对应的模糊度;其中,F(μ)表示所述模糊度,μ
i
为所述输入数据中第i条样本的预设类别的隶属度向量。5.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:曹伟朋庄浩张继勇蔡恒张均贺李圣东
申请(专利权)人:华瑞新智科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1