【技术实现步骤摘要】
一种医疗数据脱敏存储方法、装置、电子设备与存储介质
[0001]本专利技术涉及医疗数据脱敏存储
,具体涉及一种医疗数据脱敏存储方法
、
装置
、
电子设备与存储介质
。
技术介绍
[0002]5G
与人工智能应用等新技术使医疗服务大步走向真正意义的智能化
。
远程医疗
、AI
辅助诊断
、
远程急救
、
远程会诊
、
机器人超声等极大提升了医疗诊断工作的效率
。
[0003]但是随之产生的大量医疗数据,种类复杂
、
数据量大
、
数据存储年限长,并且每年递增数据量大
。
传统数据中心多以磁存储为主,数据运营能耗高
、
设备运维复杂
、
数据按年限需要多次迁移等问题愈发突出
。
而且这些医疗数据通常会记录有患者的隐私数据,在多机构进行数据采集
、
传输
、
共享等过程中,可能导致大量敏感信息泄露
、
个人隐私信息侵犯等数据安全事件
。
技术实现思路
[0004]本专利技术的目的就在于解决上述
技术介绍
的问题,而提出一种医疗数据脱敏存储方法
、
装置
、
电子设备与存储介质
。
[0005]本专利技术的目的可以通过以下技术方案实现:本专利技术实施例第一方面,提供了 ...
【技术保护点】
【技术特征摘要】
1.
一种医疗数据脱敏存储方法,其特征在于,所述方法包括:获取待存储的医疗数据,识别所述医疗数据包含的数据内容确定所述医疗数据的安全策略;所述安全策略包括数据脱敏方式与数据存储方式;根据所述安全策略对所述医疗数据进行数据脱敏处理,得到去标识化医疗数据;根据所述安全策略确定所述医疗数据在分布式数据库
IPFS
上的存储节点,并将数据存储时生成的索引存储在预设医疗数据区块链上
。2.
根据权利要求1所述的一种医疗数据脱敏存储方法,其特征在于,识别所述医疗数据包含的数据内容确定所述医疗数据的安全策略包括:识别所述医疗数据包含的数据内容,若所述数据内容仅包含患者的基础信息,则确定数据脱敏方式为文字数据脱敏,数据存储方式为连续存储;所述基础信息包括患者的基本信息
、
门诊记录
、
急诊记录
、
住院记录
、
检验检查记录
、
处方记录
、
手术记录和医保数据中的至少一种;若所述数据内容还包含患者的医学影像数据,则确定数据脱敏方式为文字数据和图像数据混合脱敏,数据存储方式为离散存储
。3.
根据权利要求2所述的一种医疗数据脱敏存储方法,其特征在于,根据所述安全策略对所述医疗数据进行数据脱敏处理,得到去标识化医疗数据包括:若所述数据脱敏方式为文字数据脱敏,扫描所述医疗数据确定预设字段的数据为敏感数据,使用预设脱敏方法对所述敏感数据进行脱敏处理,得到去标识化医疗数据;预设脱敏方法包括基于规则的脱敏方法
、
加密脱敏方法
、
伪装脱敏方法
、
数据扰动脱敏方法和数据屏蔽脱敏方法中的至少一种;若所述数据脱敏方式为文字数据和图像数据混合脱敏,将所述医疗数据分割为所述基础信息和所述医学影像数据,扫描所述基础信息确定预设字段的数据为敏感数据,使用预设脱敏方法对所述敏感数据进行脱敏处理,得到第一医疗数据,获取所述医学影像数据的元数据和数据格式,对所述元数据使用预设脱敏方法进行脱敏处理,根据所述数据格式确定所述医学影像数据的各数据元素类型,根据元素类型进行对应去标识操作,得到第二医疗数据,所述第一医疗数据和所述第二医疗数据合并作为所述去标识化医疗数据;所述去标识操作包括清除属性项的值
、
覆盖属性项的值和删除属性项
。4.
根据权利要求3所述的一种医疗数据脱敏存储方法,其特征在于,根据所述安全策略确定所述医疗数据在分布式数据库
IPFS
上的存储节点包括:计算所述医疗数据在分布式数据库
IPFS
上的存储节点的存储代价:其中,
P
为存储代价,
B
为传输带宽,
S
为存储节点的存储空间大小,
α
为预设常数,
D
为所述医疗数据所在服务器与存储节点的距离,
T
为传输时延;将各存储节点按照存储代价从小到大的顺序进行排序,得到节点列表;若所述数据存储方式为连续存储,选择所述节点列表中第一个作为所述医疗数据在分布式数据库
IPFS
上的存储节点;若所述数据存储方式为离散存储,选择所述节点列表中第一个和第二个作为所述医疗数据在分布式数据库
IPFS
上的存储节点,将所述第一医疗数据和所述第二医疗数据分别存储
。
5.
一种医疗数据脱敏存储装置,其特征在于,所述装置包括:识别模块,用于获取待存储的医疗数据,识别所述医疗数据包含的数据内容确定所述医疗数据的安全策略;所述安全策略包括数据脱敏方式与数据存储方式;脱敏模块,用于根据所述安全策略对所述医疗数据进行数...
【专利技术属性】
技术研发人员:李静,卢国栋,宋丙华,王峰,李滋,
申请(专利权)人:山东网安安全技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。