基于时间数据确定并行业务数量及时间区间的方法及装置制造方法及图纸

技术编号:28035264 阅读:37 留言:0更新日期:2021-04-09 23:17
本发明专利技术提供一种时间数据确定并行业务数量及时间区间的方法及装置,该方法将传统的最小时间颗粒度分片的复杂计算方式转换为二值特征数字顺序累加计算方式,在某时间节点前累加所有满足指定特征的待处理时间数据即可获取在该时间节点上的并行业务的数量,对各个时间节点的并行业务数量进行统计分析后即可确定并行业务数量最多的时间区间,该方案可高效且全方位地对海量时间数据进行分析挖掘,具有运算逻辑简单、计算量小、计算效率高的优势。

【技术实现步骤摘要】
基于时间数据确定并行业务数量及时间区间的方法及装置
本专利技术涉及数据挖掘
,特别涉及一种基于时间数据确定并行业务数量及时间区间的方法及装置。
技术介绍
大数据挖掘,指的是从海量数据中挖掘符合指定特征的数据,并对挖掘得到的数据进行分析的一种数据处理方式。在大数据挖掘领域中,经常需要对以时间为维度的海量时间数据进行挖掘分析,挖掘分析的内容包括:确定某时间节点前满足指定特征的业务数据数量,以及,确定同时满足符合指定特征以及指定特征数量最大的两个筛选条件的时间区间,以为后续的决策提供数据支撑。而海量时间数据基本都是以秒为单位存在的,且每天、每小时、每分钟都有不确定数量的待处理时间数据产生,如何从海量时间数据中快速确定业务数据数量以及满足需求的时间区间,一直是数据挖掘领域亟需解决的技术问题。目前通用的做法是先确定最小时间颗粒度,然后再将需要分析的时间区间按照最小颗粒度进行划分,如2020年1月1日0点到2020年1月1日1点为第一个时间区间,2020年1月1日1点到2020年1月1日2点为第二个时间区间,再根据海量时间数据的待处理时间数据本文档来自技高网...

【技术保护点】
1.一种基于时间数据确定并行业务数量的方法,其特征在于,包括以下步骤:获取所述时间数据中的待处理时间数据;/n获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;/n转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;/n以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。/n

【技术特征摘要】
1.一种基于时间数据确定并行业务数量的方法,其特征在于,包括以下步骤:获取所述时间数据中的待处理时间数据;
获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;
转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;
以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。


2.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,包括:依据分析特征处理所述待处理时间数据得到所述业务特征标志,所述分析特征以相对正反意义的特征内容表达任务内容。


3.根据权利要求2所述的基于时间数据确定并行业务数量的方法,其特征在于,若所述待处理时间数据对应所述分析特征内的正向含义,所述业务特征标志为所述正向特征,若所述待处理时间数据对应所述分析特征内的反向含义,所述业务特征标志为所述反向特征。


4.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,所述数据表中以所述业务时间的先后序列排列所述待处理时间数据。


5.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,利用SQL将所述业务特征标志转换为二值化的所述特征数值,所述特征数值满足:单个正向特征转换得到的特征数值+单个反向特征转换得到的特征数值=0。


6.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,“选择所述业务时间之前的所述待处理时间数据”之前包括:筛选符合指定特征的所述待处理时间数据,所述指定特征对应的是业务内容的特征。


7.一种基于时间数据确定时间区间的方法,其特征在于,包括以下步骤:
获取所述时间数据中的待处理时间数据;
获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;
转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;
以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的并行任务数量;
选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间。


8.根据权利要求7所述的基于时间数据确定时间区间的方法,其特征在于...

【专利技术属性】
技术研发人员:郁强马浩
申请(专利权)人:城云科技中国有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1