一种时序数据的聚类方法及装置制造方法及图纸

技术编号:36040501 阅读:29 留言:0更新日期:2022-12-21 10:46
本发明专利技术实施例涉及一种时序数据的聚类方法及装置。该方法包括:获取任一待聚类时序数据;将待聚类时序数据输入至预测模型,得到待聚类时序数据分别属于k个聚类分区的k个概率值;k个聚类分区是至少以第一目标函数为目标且采用样本时序数据对预测模型进行训练得到的;第一目标函数用于实现k个聚类分区中任意两个聚类分区中的样本时序数据的数量的差值小于第一预设阈值;将k个概率值中满足预设条件的概率值对应的聚类分区确定为待聚类时序数据所属的聚类分区。将待聚类时序数据输入至以第一目标函数为目标进行训练的预测模型中,可以进行更加合理更加均衡的聚类,体现出不同时序数据之间的差异性,提高时序数据之间的区分度,提高聚类的准确性。提高聚类的准确性。提高聚类的准确性。

【技术实现步骤摘要】
一种时序数据的聚类方法及装置


[0001]本专利技术实施例涉及计算机
,尤其涉及一种时序数据的聚类方法、装置、计算设备及计算机可读存储介质。

技术介绍

[0002]随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。
[0003]时序数据是指时间序列数据,时序数据产生于社会生产生活的方方面面。例如,根据某用户在一段时间内的交易量变化情况形成时序数据;根据服务器在一段时间内的某个性能指标的变化情况形成时序数据;根据某个应用在一段时间内消耗的网络流量的变化情况形成时序数据等等。
[0004]对时序数据进行聚类在对时序数据的分析挖掘中具有重要的意义。目前对时序数据进行聚类的方法为,对每个时序数据进行特征提取,得到特征向量,将多个时序数据的特征向量按照常规的聚类方法进行聚类,得到多个聚类分区,每个聚类分区对应有聚类中心,常规的聚类方法有K

means聚类、最大最小距离聚类算法等;针对待聚类时序数据,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种时序数据的聚类方法,其特征在于,包括:获取任一待聚类时序数据;将所述待聚类时序数据输入至预测模型,得到所述待聚类时序数据分别属于k个聚类分区的k个概率值;所述k个聚类分区是至少以第一目标函数为目标且采用样本时序数据对所述预测模型进行训练得到的;所述第一目标函数用于实现所述k个聚类分区中任意两个聚类分区中的样本时序数据的数量的差值小于第一预设阈值;将所述k个概率值中满足预设条件的概率值对应的聚类分区确定为所述待聚类时序数据所属的聚类分区。2.如权利要求1所述的方法,其特征在于,所述预测模型至少包括判别器;通过如下方式训练所述预测模型,包括:对多个第一样本时序数据进行聚类,得到k个初始聚类分区;针对任一第二样本时序数据,将所述第二样本时序数据输入至初始判别器,得到所述第二样本时序数据属于所述k个初始聚类分区的k个判别概率;至少以所述第一目标函数为目标,根据所述k个判别概率对所述初始判别器进行调参,得到更新判别器,将所述初始判别器更新为所述更新判别器;根据所述k个判别概率确定所述第二样本时序数据所属的初始聚类分区;根据所述第二样本时序数据对所述第二样本时序数据所属的初始聚类分区进行更新,得到所述第二样本时序数据所属的更新聚类分区;将所述初始聚类分区更新为所述更新聚类分区,返回针对任一第二样本时序数据,将所述第二样本时序数据输入至所述判别器的步骤,直至通过所述更新判别器得到的k个判别概率满足所述第一目标函数。3.如权利要求2所述的方法,其特征在于,在得到k个初始聚类分区之后,还包括:计算所述第二样本时序数据与所述k个初始聚类分区的初始聚类中心的k个距离,根据所述k个距离确定所述第二样本时序数据分别属于所述k个初始聚类分区的k个计算概率;至少以所述第一目标函数为目标,根据所述k个判别概率对所述初始判别器进行调参,包括:以所述第一目标函数和第二目标函数为目标,根据所述k个判别概率对所述初始判别器进行调参;所述第二目标函数用于实现所述第二样本时序数据针对同一初始聚类分区对应的计算概率与判别概率的差值小于第二预设阈值;根据所述k个判别概率确定所述第二样本时序数据所属的初始聚类分区,包括:根据所述k个判别概率和所述k个计算概率确定所述第二样本时序数据所属的初始聚类分区。4.如权利要求3所述的方法,其特征在于,在针对任一第二样本时序数据,将所述第二样本时序数据输入至所述判别器之前,还包括:在第三样本时序数据中截取多个子样本时序数据,所述子样本时序数据为所述第二样本时序数据;根据所述第二样本时序数据对所述第二样本时序数据所属的初始聚类分区进行更新,得到所述第二样本时序数据所属的更新聚类分区,包括:根据多个所述第二样本时序数据所属的初始聚类分区,确定所述第三样本时序数据所属的初始聚类分区;
根据所述第...

【专利技术属性】
技术研发人员:王嘉川陈雷尤嘉李泽宇李诚
申请(专利权)人:香港科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1