基于层次聚类的风险分析方法、装置、设备及存储介质制造方法及图纸

技术编号:26479786 阅读:32 留言:0更新日期:2020-11-25 19:24
本发明专利技术涉及人工智能领域,公开了基于层次聚类的风险分析方法、装置、设备及存储介质,应用于智慧医疗领域中,通过对时间序列数据进行降噪和剪枝处理,避免陷入维数灾难,增强风险分析结果的可信度。本发明专利技术方法包括:获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;根据所述多个目标相关系数生成多个医院之间的距离矩阵;对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;根据所述聚类树进行风险分析,得到风险分析结果。

【技术实现步骤摘要】
基于层次聚类的风险分析方法、装置、设备及存储介质
本专利技术涉及医疗数据领域,尤其涉及一种基于层次聚类的风险分析方法、装置、设备及存储介质。
技术介绍
风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。在电商、信用卡防欺诈、医保基金防欺诈等领域,风控都是非常重要的方向。现有方案中,一般会通过关联分析、统计分析等异常识别模型,找到候选的异常结果,但是,由于数据往往噪音较大,得到的结果往往不是很理想。而且对于高维数据,很容易陷入维数灾难(curseofdimensionality)中,分析结果失真。
技术实现思路
本专利技术提供了一种基于层次聚类的风险分析方法、装置、设备及存储介质,用于避免在处理时间序列数据时陷入维数灾难。本专利技术实施例的第一方面提供一种基于层次聚类的风险分析方法,包括:获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;根据所述多个目标相关系数生成多个医院之间的距离矩阵;对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;根据所述聚类树进行风险分析,得到风险分析结果。可选的,在本专利技术实施例第一方面的第一种实现方式中,所述根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数,包括:分别确定医院i的药品销售额Yi和医院j的药品销售额Yj;将所述药品销售额Yi和所述药品销售额Yj输入到预置的相似度公式中,生成医院i和医院j的相关系数,预置的相似度公式为其中,Yi表示医院i的药品销售额,Yj表示医院j的药品销售额,i、j为正整数,<>表示均值,ρij为医院i和医院j的相关系数;计算其他任意两个医院之间的相关系数,得到多个其他相关系数,所述其他任意两个医院不同时包含医院i和医院j;生成多个目标相关系数,所述多个目标相关系数包括所述医院i和医院j的相关系数和所述多个其他相关系数。可选的,在本专利技术实施例第一方面的第二种实现方式中,所述根据所述多个目标相关系数生成多个医院之间的距离矩阵,包括:根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离;基于所述多个初始距离生成距离矩阵,所述距离矩阵用于指示任意两个医院之间的距离。可选的,在本专利技术实施例第一方面的第三种实现方式中,所述根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离,包括:调用预置的距离公式计算每个目标相关系数对应的距离,得到多个初始距离,d(i,j)表示医院i和医院j之间的距离,所述预置的距离公式为:可选的,在本专利技术实施例第一方面的第四种实现方式中,所述对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇,包括:对所述距离矩阵进行剪枝操作,得到剪枝后的距离矩阵;对所述剪枝后距离矩阵进行层次聚类,生成聚类树。可选的,在本专利技术实施例第一方面的第五种实现方式中,所述对所述距离矩阵进行剪枝操作,得到剪枝后的距离矩阵,包括:将所述距离矩阵转换为无向图;利用预置算法和所述无向图生成最小生成树;基于所述最小生成树对所述距离矩阵进行剪枝,得到剪枝后的距离矩阵。可选的,在本专利技术实施例第一方面的第六种实现方式中,所述对所述剪枝后距离矩阵进行层次聚类,生成聚类树,包括:调用预置的矩阵距离公式计算所述剪枝后的距离矩阵中每个数据点的距离,得到多个距离,预置的矩阵距离公式为D表示任意两个数据点之间的距离;将多个距离中最近的两个数据点进行层次聚类,得到多个数据类别,数据类别包括数据点和数据组合,并迭代执行层次聚类过程直至距离矩阵转换为多个簇,生成聚类树。本专利技术实施例的第二方面提供了一种基于层次聚类的风险分析装置,包括:获取模块,用于获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;计算模块,用于根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;生成模块,用于根据所述多个目标相关系数生成多个医院之间的距离矩阵;聚类模块,用于对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;分析模块,用于根据所述聚类树进行风险分析,得到风险分析结果。可选的,在本专利技术实施例第二方面的第一种实现方式中,计算模块包括:确定单元,用于分别确定医院i的药品销售额Yi和医院j的药品销售额Yj;输入单元,用于将所述药品销售额Yi和所述药品销售额Yj输入到预置的相似度公式中,生成医院i和医院j的相关系数,预置的相似度公式为其中,Yi表示医院i的药品销售额,Yj表示医院j的药品销售额,i、j为正整数,<>表示均值,ρij为医院i和医院j的相关系数;第一计算单元,用于计算其他任意两个医院之间的相关系数,得到多个其他相关系数,所述其他任意两个医院不同时包含医院i和医院j;第一生成单元,用于生成多个目标相关系数,所述多个目标相关系数包括所述医院i和医院j的相关系数和所述多个其他相关系数。可选的,在本专利技术实施例第二方面的第二种实现方式中,生成模块包括:第二计算单元,用于根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离;第二生成单元,用于基于所述多个初始距离生成距离矩阵,所述距离矩阵用于指示任意两个医院之间的距离。可选的,在本专利技术实施例第二方面的第三种实现方式中,第二计算单元具体用于:调用预置的距离公式计算每个目标相关系数对应的距离,得到多个初始距离,d(i,j)表示医院i和医院j之间的距离,所述预置的距离公式为:可选的,在本专利技术实施例第二方面的第四种实现方式中,聚类模块包括:剪枝单元,用于对所述距离矩阵进行剪枝操作,得到剪枝后的距离矩阵;聚类单元,用于对所述剪枝后距离矩阵进行层次聚类,生成聚类树。可选的,在本专利技术实施例第二方面的第五种实现方式中,剪枝单元具体用于:将所述距离矩阵转换为无向图;利用预置算法和所述无向图生成最小生成树;基于所述最小生成树对所述距离矩阵进行剪枝,得到剪枝后的距离矩阵。可选的,在本专利技术实施例第二方面的第六种实现方式中,聚类单元具体用于:调用预置的矩阵距离公式计算所述剪枝后的距离矩阵中每个数据点的距离,得到多个距离,预置的矩阵距离公式为D表示任意两个数据点之间的距离;将多个距离中最近的两个数据点进行层次聚类,得到多个数据类别,数据类别包括数据点和数据组合,并迭代执行层次聚类过程直至距离矩阵转换为多个簇,生成聚类树。本专利技术实施例的第三方面提供了一种基于层次聚类的风险分析设备,存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于层次聚类的风险分析设备执行上述的基于层次聚类的风险分析方法。本专利技术实施例的第四方面提供了一种计算机可读存储介本文档来自技高网...

【技术保护点】
1.一种基于层次聚类的风险分析方法,其特征在于,包括:/n获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;/n根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;/n根据所述多个目标相关系数生成多个医院之间的距离矩阵;/n对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;/n根据所述聚类树进行风险分析,得到风险分析结果。/n

【技术特征摘要】
1.一种基于层次聚类的风险分析方法,其特征在于,包括:
获取初始数据,所述初始数据用于指示多个医院的药品销售额数据,所述初始数据为时间序列数据;
根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数;
根据所述多个目标相关系数生成多个医院之间的距离矩阵;
对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树,所述聚类树包括多个簇;
根据所述聚类树进行风险分析,得到风险分析结果。


2.根据权利要求1所述的基于层次聚类的风险分析方法,其特征在于,所述根据预置的相似度公式和所述初始数据计算任意两个不同医院之间的相关系数,得到多个目标相关系数,包括:
分别确定医院i的药品销售额Yi和医院j的药品销售额Yj;
将所述药品销售额Yi和所述药品销售额Yj输入到预置的相似度公式中,生成医院i和医院j的相关系数,预置的相似度公式为其中,Yi表示医院i的药品销售额,Yj表示医院j的药品销售额,i、j为正整数,<>表示均值,ρij为医院i和医院j的相关系数;
计算其他任意两个医院之间的相关系数,得到多个其他相关系数,所述其他任意两个医院不同时包含医院i和医院j;
生成多个目标相关系数,所述多个目标相关系数包括所述医院i和医院j的相关系数和所述多个其他相关系数。


3.根据权利要求1所述的基于层次聚类的风险分析方法,其特征在于,所述根据所述多个目标相关系数生成多个医院之间的距离矩阵,包括:
根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离;
基于所述多个初始距离生成距离矩阵,所述距离矩阵用于指示任意两个医院之间的距离。


4.根据权利要求3所述的基于层次聚类的风险分析方法,其特征在于,所述根据所述多个目标相关系数计算任意两个不同医院之间的初始距离,得到多个初始距离,包括:
调用预置的距离公式计算每个目标相关系数对应的距离,得到多个初始距离,d(i,j)表示医院i和医院j之间的距离,所述预置的距离公式为:


5.根据权利要求1-4中任意一项所述的基于层次聚类的风险分析方法,其特征在于,所述对所述距离矩阵进行剪枝和层次聚类操作,生成聚类树...

【专利技术属性】
技术研发人员:郭建福张旭
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1