基于大数据挖掘性能的云计算业务分析方法、装置及系统制造方法及图纸

技术编号:34248059 阅读:20 留言:0更新日期:2022-07-24 10:52
本发明专利技术公开了一种基于大数据挖掘性能的云计算业务分析方法、装置及系统,涉及行为预测技术领域。主要包括:根据用户对不同业务的历史查询情况获得用户的查询特征值;利用预设时长内访问的所有用户的查询特征值进行用户分类,获得同一类用户的习惯业务序列;根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性,获得其在任一查询次数中任意两业务间的关联性;根据用户当前所查询业务、用户的习惯序列以及当前查询次数中各业务的关联性,预测用户下一个查询业务,并将预测查询业务提前放入供用户查询的缓存中。本发明专利技术实施例中各业务间的关联性更具针对性,从而提高用户查询的预测结果的准确性。从而提高用户查询的预测结果的准确性。从而提高用户查询的预测结果的准确性。

Cloud computing business analysis method, device and system based on big data mining performance

【技术实现步骤摘要】
基于大数据挖掘性能的云计算业务分析方法、装置及系统


[0001]本申请涉及行为预测
,具体涉及一种基于大数据挖掘性能的云计算业务分析方法、装置及系统。

技术介绍

[0002]银行数据中可访问或搜索的业务,包括但不限于客户的交易数据、流水数据、记账数据、借款数据以及贷款数据等业务数据;在银行的业务系统中,部分数据为不常用数据,导致数据仓库的存储存在冗余,从而降低查询效率,同时,在客户数据查询时,需要对客户个体的数据进行遍历检索,进而进一步降低系统运行效率。因此,需要对客户所需要查询或访问的业务进行预测,从而实现存储资源的提前部署以提升效率。
[0003]现有技术中对于用户需要查询的业务的预测,往往通过根据用户的对各业务的查询情况进行统计,从而将用户查询次数多的优先展示供用户选择。
[0004]然而,现有技术中通过对用户所查询业务的查询次数进行统计后排序的方法,忽略了各类用户在使用习惯上的差异,且无法通过用户的前一次查询行为对用户后续的查询行为实现预测。

技术实现思路

[0005]针对上述技术问题,本专利技术提供了一种基于大数据挖掘性能的云计算业务分析方法、装置及系统,能针对不同用户进行具有针对性的查询业务的预测,同时能够被用户所查询的业务类型发生改变时,能够重新确定各业务间的关联性,进而进行存储资源的提前部署以提升效率。
[0006]第一方面,本专利技术实施例提出了一种基于大数据挖掘性能的云计算业务分析方法,包括:根据用户对不同业务的历史查询情况,获得用户的查询特征值。r/>[0007]利用预设时长内访问的所有用户的查询特征值将用户聚类成多类,并按照查询次数的先后顺序,将同一类用户在各查询次数中查询频率最高的业务进行排序,以获得同一类用户的习惯业务序列。
[0008]根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性,获得同一类用户在任一查询次数中任意两业务间的关联性。
[0009]根据用户的查询特征值,确定该用户的习惯业务序列,并判断当前所查询的业务与习惯业务序列中当前查询次数对应的业务是否一致。
[0010]若判断结果为是,则将习惯业务序列中下一个业务作为预测查询业务。若判断结果为否,将与当前查询业务关联性最大的业务作为预测查询业务。将预测查询业务提前放入供用户查询的缓存中。
[0011]在一个可行的实施例中,根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性,获得同一类用户在任一查询次数中任意两业务间的关联
性,包括:其中,为同一类用户在进行第i次查询时业务与业务之间的关联性,为同一类用户在进行第i次查询时业务被查询的频率,为同一类用户在进行第i次查询时业务被查询的频率,为同一类用户在进行第i

1次查询时业务被查询的频率,为业务与业务之间的相关性,为指数曲线。
[0012]可选的,所述方法还包括:选取同一类用户中预设比例的用户作为代表用户,根据代表用户相邻查询次数的最高查询频率之差以及不同业务间的相关性,获得代表用户在进行任一查询次数下任意两业务间的关联性。
[0013]将代表用户在进行任一查询次数下任意两业务间的关联性,作为同一类用户在进行任一查询次数下任意两业务间的关联性。
[0014]本专利技术实施例中所得到的业务间的关联性与用户的类型以及用户的查询次数存在关系,由于现有技术中只考虑两个业务本身的相关性,而未考虑业务在被用户查询或访问之后,也会对该用户是否会继续查询该业务产生影响,因此本专利技术实施例中得到的业务间的关联性更具准确性,同时更加契合实际场景。
[0015]在一个可行的实施例中,根据用户对不同业务的历史查询情况,获得用户的查询特征值,包括:对历史查询情况中同一查询次数下不同用户对各业务的查询次数进行第一PCA,将第一PCA的最大主成分作为第一最大主成分。
[0016]分别将不同用户对各业务的查询次数对第一最大主成分进行投影,分别获得各用户在同一查询次数下的第一查询特征值。
[0017]将各用户在各查询次数下的所述第一查询特征值进行第二PCA,将第二PCA的最大主成分方向作为第二最大主成分。
[0018]分别将各用户在各查询次数下的所述第一查询特征值对第二最大主成分进行投影,分别获得各用户的第二查询特征值,并将用户的第二查询特征值作为用户的查询特征值。
[0019]可选的,所述方法还包括:当前所查询的业务与习惯业务序列中当前查询次数对应的业务一致时,将习惯业务序列中预测查询业务后预设数量个业务作为备选查询业务,将备选查询业务放入预测查询业务的缓存后。
[0020]这样,当用户下一次所查询的业务与所预测的业务不一致时,用户很有可能会访问备选查询业务中的业务,进而能够在预测失效的情况下提高效率。
[0021]可选的,所述方法还包括:当前所查询的业务与习惯业务序列中当前查询次数对应的业务不一致时,将与预测查询业务关联性最大的预设数量个业务作为备选查询业务,将备选查询业务放入预测查询业务的缓存后。
[0022]这样,当用户下一次所查询的业务与所预测的业务不一致时,用户很有可能会访
问备选查询业务中的业务,进而能够在预测失效的情况下提高效率。
[0023]可选的,根据用户对不同业务的历史查询情况,获得用户的查询特征值前,所述方法还包括:对用户对不同业务的历史查询情况进行数据清洗。
[0024]这样能够使得用户的查询情况的相关数据更具针对性和准确性。
[0025]可选的,利用预设时长内访问的所有用户的查询特征值将用户聚类成多类后,所述方法还包括:建立多个云数据仓库用于储存所有用户的查询数据,且同一个云数据仓库中存放同一类用户的查询数据。
[0026]第二方面,本专利技术实施例提出了一种基于大数据挖掘性能的云计算业务分析装置,包括:用户查询特征值获取模块,用于根据用户对不同业务的历史查询情况,获得用户的查询特征值。
[0027]用户聚类模块,用于利用预设时长内访问的所有用户的查询特征值将用户聚类成多类。
[0028]习惯业务序列获取模块,用于按照查询次数的先后顺序,将同一类用户在各查询次数中查询频率最高的业务进行排序,以获得同一类用户的习惯业务序列。
[0029]关联性获取模块,用于根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性,获得同一类用户在任一查询次数中任意两业务间的关联性。
[0030]判断模块,用于根据用户的查询特征值,确定该用户的习惯业务序列,并判断当前所查询的业务与习惯业务序列中当前查询次数对应的业务是否一致。
[0031]预测业务确定模块,若判断结果为是,则将习惯业务序列中下一个业务作为预测查询业务。若判断结果为否,将与当前查询业务关联性最大的业务作为预测查询业务。
[0032]缓存预调度模块,将预测查询业务提前放入供用户查询的缓存中。
[0033]第三方面,本专利技术实施例提出了一种基本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于大数据挖掘性能的云计算业务分析方法,其特征在于,包括:根据用户对不同业务的历史查询情况,获得用户的查询特征值;利用预设时长内访问的所有用户的查询特征值将用户聚类成多类,并按照查询次数的先后顺序,将同一类用户在各查询次数中查询频率最高的业务进行排序,以获得同一类用户的习惯业务序列;根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性,获得同一类用户在任一查询次数中任意两业务间的关联性;根据用户的查询特征值,确定该用户的习惯业务序列,并判断当前所查询的业务与习惯业务序列中当前查询次数对应的业务是否一致;若判断结果为是,则将习惯业务序列中下一个业务作为预测查询业务;若判断结果为否,将与当前查询业务关联性最大的业务作为预测查询业务;将预测查询业务提前放入供用户查询的缓存中。2.根据权利要求1所述的基于大数据挖掘性能的云计算业务分析方法,其特征在于,根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性,获得同一类用户在任一查询次数中任意两业务间的关联性,包括:其中,为同一类用户在进行第i次查询时业务与业务之间的关联性,为同一类用户在进行第i次查询时业务被查询的频率,为同一类用户在进行第i次查询时业务被查询的频率,为同一类用户在进行第i

1次查询时业务被查询的频率,为业务与业务之间的相关性,为指数曲线。3.根据权利要求2所述的基于大数据挖掘性能的云计算业务分析方法,其特征在于,所述方法还包括:选取同一类用户中预设比例的用户作为代表用户,根据代表用户相邻查询次数的最高查询频率之差以及不同业务间的相关性,获得代表用户在进行任一查询次数下任意两业务间的关联性;将代表用户在进行任一查询次数下任意两业务间的关联性,作为同一类用户在进行任一查询次数下任意两业务间的关联性。4.根据权利要求1所述的基于大数据挖掘性能的云计算业务分析方法,其特征在于,根据用户对不同业务的历史查询情况,获得用户的查询特征值,包括:对历史查询情况中同一查询次数下不同用户对各业务的查询次数进行第一PCA,将第一PCA的最大主成分作为第一最大主成分;分别将不同用户对各业务的查询次数对第一最大主成分进行投影,分别获得各用户在同一查询次数下的第一查询特征值;将各用户在各查询次数下的所述第一查询特征值进行第二PCA,将第二PCA的最大主成分方向作为第二最大主成分;分别将各用户在各查询次数下的所述第一查询特征值对第二最大主成分进行投影,分别获得各...

【专利技术属性】
技术研发人员:刘浏徐建娴叶飞
申请(专利权)人:联通江苏产业互联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1