基于多粒度序贯三支决策的医疗区块链数据可信分析方法技术

技术编号:39305891 阅读:6 留言:0更新日期:2023-11-12 15:54
本发明专利技术公开了基于多粒度序贯三支决策的医疗区块链数据可信分析方法,其特征在于包括以下五个模块:1)链上医疗数据模块、2)医疗数据类别分类模块、3)链上医疗数据的属性约简模块、4)待上链的医疗数据模块、5)多粒度医疗数据的可信划分模块;本发明专利技术将医疗数据抽象为超图模型,以求解其顶点覆盖的形式获取医疗数据核属性集,减少或剔除医疗数据中的冗余属;将顶点覆盖核属性集与粗糙集数字特征结合提出一种适合医疗数据的多粒度分层策略,提高了模型整体的可信划分效率。型整体的可信划分效率。型整体的可信划分效率。

【技术实现步骤摘要】
基于多粒度序贯三支决策的医疗区块链数据可信分析方法


[0001]本专利技术涉及基于多粒度序贯三支决策的医疗区块链数据可信分析方法。

技术介绍

[0002]医疗信息化进程已进入大数据时代,海量数据的产生与流转成为常态,很多医院已从信息系统建设阶段迈入了数据利用阶段。但是许多医疗机构在利用医疗数据进行临床和决策研究时,却面临着数据质量差、数据可信度低的问题,这导致大部分医疗机构无法发挥其医疗数据的价值。医疗数据可信度低的的原因主要有:技术限制或恶意攻击导致系统收集到的数据与实际情况不符、数据传输前后数据不一致、数据存储时被非法篡改删除等原因,因此许多学者从医疗数据的收集、传输和存储等不同角度对医疗数据质量差的问题进行了大量研究。
[0003]三支决策理论作为为一种重要的粒计算和知识发现研究方法十分适合筛选待上链的可信医疗数据,从源头保证医疗区块链数据的可信性。

技术实现思路

[0004]为保证医疗区块链待上链源头数据的可信性,本专利技术提出了一种基于多粒度序贯三支决策的医疗区块链数据可信分析方法。为剔除原始医疗数据中的冗余属性,首先研究了一种基于超图模型的医疗数据属性约简方法,将链上医疗数据(默认可信)抽象为超图模型,然后从超图谱的角度提出一种基于顶点覆盖的约简算法ARHVC,从链上某类医疗数据中抽取其可信核属性集,从数据的属性层面提高待上链医疗数据三支决策可信划分的效率;然后本专利技术针对传统多粒度三支决策中的粒层决策冲突问题,研究了一种基于多粒度序贯三支决策的医疗数据可信划分方法,该方法提出一种医疗数据的多粒度分层策略从数据粒度角度进一步提高了序贯三支决策每个粒层的待上链医疗数据可信决策的精度和效率。
[0005]本专利技术所述方法分为两个部分,分别是

基于超图模型的医疗数据属性约简,原始医疗数据中存在许多冗余属性,这大大增加了医疗数据可信划分的代价,为提高医疗数据中属性等价关系的分类能力,本专利技术将医疗数据抽象为超图模型,以求解其顶点覆盖的形式获取医疗数据核属性集,减少或剔除医疗数据中的冗余属;

传统多粒度三支决策中缺乏有效的粒度选取策略,导致不同粒层间经常出现决策冲突,为减少粒层间的决策冲突,本专利技术将顶点覆盖核属性集与粗糙集数字特征结合提出一种适合医疗数据的多粒度分层策略,提高了模型整体的可信划分效率。
[0006]1、本专利技术提出了基于多粒度序贯三支决策的医疗区块链数据可信分析方法,该方法包括五个模块:
[0007]1)链上医疗数据模块,是医疗区块链数据存储系统;
[0008]2)医疗数据类别分类模块,是医疗数据分类别的过程,根据ICD国际疾病分类编码将链上可信数据分为不同种类疾病数据的决策信息系统;
[0009]3)链上医疗数据的属性约简模块,是对链上可信医疗数据抽取可信属性,将医疗
数据类别分类模块的每类决策信息系统进行属性约简,得到每类医疗数据的约简属性,为待上链数据的决策划分提供核属性集,对后续医疗数据进行粒度划分,直到决策代价已经大于剩余数据的划分价值即停止;
[0010]4)待上链的医疗数据模块,是指待上链的医疗数据,是医院本地待上链进行可信划分的数据,利用链上医疗数据的属性约简模块约简后的可信核属性集对待上链数据进行多粒度分层,减少后续三支决策的可信划分冲突;
[0011]5)多粒度医疗数据的可信划分模块,每个粒层的待上链数据划分为Pos_data,Bnd_data,Neg_data三个数据域,其中Pos_data域视为可信数据,可直接上链,Bnd_data域需要在更细粒层进行进一步划分,Neg_data域则作为不可信数据返回医院,拒绝上链。
[0012]优选的,所述链上医疗数据的属性约简模块是基于超图模型的。
[0013]优选的,所述待上链数据进行多粒度分层过程包括:
[0014]4‑
1)基于顶点覆盖集的粗粒层划分:
[0015]记极小顶点覆盖集mi2Cs的属性个数为丨mi2Cs丨,由于极小顶点覆盖集中的属性已经不可再减少,将属性个数越少的极小顶点覆盖集作为粗粒层的属性集,随着覆盖集属性数量的增多,其对应粒层也越细。其形式化表达为
[0016][0017]其中GL
i
为医疗数据的第i粒层,Snmi2Csi为极小顶点覆盖集mi2Csi在其集簇中属性数量排序的序号,ASi为第i粒层的属性集与极小覆盖集mi2Csi相对应,i代表粒层序号,其取值范围是:1≤i≤|vc|,|vc|为极小顶点覆盖集簇的大小。
[0018]4‑
2)基于粗糙集数字特征的细粒度划分:
[0019]通过决策信息表中系统属性参数的重要度描述系统的一组或单个的系统参数,得到各个系统参数对相关患者论域的重要程度,剔除重要程度为0的参数,将其记为集合A
sig
;剔除依赖程度为0的属性,记为集合B
γ
,以A
sig
、B
γ
做为细粒度粒度划分的基本属性集;通过计算A
sig
和B
γ
的交集Inset、并集Unset以及差集Diffset,并利用不确定性方法对差集的属性进行化简,得到基于粗糙集数字特征的细粒度划分的属性集。
[0020]本专利技术的有益效果是:
[0021](1)将经典谱图理论推广于超图模型,研究了超图拉普拉斯及其二分图的谱特征。发现了超图顶点的独立性和依赖性同其非平凡拉普拉斯特征向量的频次关系以及超图转换为二分图后其顶点度的大小与超图归一化拉普拉斯矩阵的平凡特征向量元素大小的一致性关系。
[0022](2)利用(1)的两个超图谱特征信息提出一种基于超图顶点覆盖的医疗数据属性约简算法(ARHVC,Attribute reduction based on hypergraph vertex cover)。该算法将超图顶点覆盖问题转换为传统二分图的组合问题,能够剔除医疗数据中的冗余属性,提高了属性的平均分类能力。
[0023](3)将顶点覆盖集属性和基于粗糙集的数字特征筛选的普通属性结合提出一种医疗数据粒度分层策略,该策略首先利用最小顶点覆盖集属性集、极小顶点覆盖属性集作为粗粒度数据的分层属性,然后对覆盖属性集合之外的普通属性提出一种基于粗糙集数字特征的粒度划分算法(Granularity partitioning algorithm based on rough set digital features,GPRSDF)衡量其粒度划分能力,得到细粒度数据分层的备选集。该策略
能够有效减少序贯三支决策的冲突问题并提高其对医疗数据的可信划分精度。
附图说明:
[0024]图1为:医疗区块链源数据可信分析模型数据流转示意图;
[0025]图2为:医疗数据流转图;
[0026]图3为:社区体检的简单超图示例;
[0027]图4为:血常规决策信息表诱导超图;
[0028]图5为:基于多粒度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多粒度序贯三支决策的医疗区块链数据可信分析方法,其特征在于包括以下五个模块:1)链上医疗数据模块,是医疗区块链数据存储系统;2)医疗数据类别分类模块,是医疗数据分类别的过程,根据ICD国际疾病分类编码将链上可信数据分为不同种类疾病数据的决策信息系统;3)链上医疗数据的属性约简模块,是对链上可信医疗数据抽取可信属性,将医疗数据类别分类模块的每类决策信息系统进行属性约简,得到每类医疗数据的约简属性,为待上链数据的决策划分提供核属性集,对后续医疗数据进行粒度划分,直到决策代价已经大于剩余数据的划分价值即停止;4)待上链的医疗数据模块,是指待上链的医疗数据,是医院本地待上链进行可信划分的数据,利用链上医疗数据的属性约简模块约简后的可信核属性集对待上链数据进行多粒度分层,减少后续三支决策的可信划分冲突;5)多粒度医疗数据的可信划分模块,每个粒层的待上链数据划分为Pos_data,Bnd_data,Neg_data三个数据域,其中Pos_data域视为可信数据,可直接上链,Bnd_data域需要在更细粒层进行进一步划分,Neg_data域则作为不可信数据返回医院,拒绝上链。2.根据权利要求1所述的基于多粒度序贯三支决策的医疗区块链数据可信分析方法,其特征在于,所述链上医疗数据的属性约简模块是基于超图模型的。3.根据权利要求1所述的基于多粒度序贯三支决策的医疗区块链数据可信分析方法,其特征在于,所述待上链数据...

【专利技术属性】
技术研发人员:姜茸王猛
申请(专利权)人:云南财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1