一种基于多源数据的健康档案信息平台建立方法技术

技术编号:38199696 阅读:13 留言:0更新日期:2023-07-21 16:40
本发明专利技术公开了一种基于多源数据的健康档案信息平台建立方法,所述健康档案信息平台建立方法包括以下步骤:A1:基于eHR应用设计前置机数据模型:首先将整块的医疗数据进行数据录入,再结合各医疗结构的数据调研情况后,完善模型设计,约定数据上云的范围,A2:所述A1步骤中医疗数据上云分为结构化数据和非结构化数据,每日进行增量抽取,所述结构化数据首先由医疗机构配置CDC生成增量表。本发明专利技术健康档案第一层的服务,就是打通各医疗卫生机构,实现数据的共享,打通了医疗数据的壁垒,提供了一定了业务操作便利,而第二层的功能便是除了打通数据的便利,并且为医院、医生、各用户创造数据的新价值,更便捷高效的服务。更便捷高效的服务。更便捷高效的服务。

【技术实现步骤摘要】
一种基于多源数据的健康档案信息平台建立方法


[0001]本专利技术涉及医疗
,具体为一种基于多源数据的健康档案信息平台建立方法。

技术介绍

[0002]随着医疗信息技术的进步,医疗信息统新模式、新技术、新架构的出现,医院的信息化水平大幅提升。目前要求医院准确把握新一轮科技革命和产业变革趋势,主动适应新兴技术、服务业态和发展形态,创新思维模式、管理模式和服务模式,以信息化为支撑,充分运用云计算、大数据、物联网及移动互联等技术,助推医院医疗模式创新和管理模式创新,促进病人就医便捷化、临床医疗智能化与医院管理精细化,努力建设适应“互联网+”时代背景和精准医疗发展。
[0003]健康档案是以个人的身心为核心,贯穿全生命周期,通过多种途径收集和记录各种健康数据,及时更新、保持个人健康信息的连续性和有效性,通过标准规范、科学地记录一个人一生中各项与健康相关的档案。健康档案不仅记录病史、病程、诊疗情况,进行客观展示,还将结合患者/居民的健康习惯、健康管理等信息,再基于大数据分析能力,将使医生会诊的时间大大缩短,质量大大提高;同时,上下级医院的信息交流更可以提高基层医院医疗水平。
[0004]基于健康档案的区域卫生信息平台的建设时间整体较早,只覆盖了个人基本信息或基本健康资料的收集,而个人的各类健康评估资料、保健资料、医疗资料等依然分散在各个医疗卫生业务系统中,无法为个人用户提供连续性、标准化的健康档案服务,也无法为医护人员提供全面性的医疗数据参考,更不能在急救、远程会诊、“互联网+”医疗、家庭医生服务等医疗业务场景下发挥协同作用,无法发挥健康档案的串联作用。此外由于健康档案方案储存的信息安全和隐私保护,阻碍了健康档案信息服务行业的发展,用户无法体会到健康管理的便利性和进一步的健康决策等服务。
[0005]同时,目前医患间信息同步仍重度依赖纸质病历本,造成医患间信息不对称。患者需要自行携带既往的检查检验报告,缺失漏拿情况时有发生,医生对于患者过往病史及治疗情况难以全面掌握,导致每去一家医院相同检验检查项重复做一遍,造成资源上的极大浪费,不仅造成患者负担,也对医生开具的诊断、处方等存疑,为此,我们提出一种基于多源数据的健康档案信息平台建立方法。

技术实现思路

[0006]本专利技术的目的在于提供一种基于多源数据的健康档案信息平台建立方法,以解决
技术介绍
中解决的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:一种基于多源数据的健康档案信息平台建立方法,所述健康档案信息平台建立方法包括以下步骤:
[0008]A1:基于eHR应用设计前置机数据模型:首先将整块的医疗数据进行数据录入;
[0025]K=k1.(1

b+b.fracdlavg(dl))
[0026]其中,k1、k2、b属于调节因子,设置为k1=2,b=0.75;
[0027]f
i
:表示语素q
i
在每篇相应医疗数据中出现的频率;
[0028]qf
i
:表示语素q
i
在搜索关键词中出现的频率;
[0029]dl:表示医疗数据的长度;
[0030]avg(dl):表示所有医疗数据集中所有医疗数据的平均长度
[0031]A7:利用通过大数据分析技术和NLP医疗知识图谱对诊疗数据进行分析处理进行检验项目相关性分析:利用多组医疗机构的各个科室的常检验项目族来确定各个科室和常检验项目族之间的关联关系,随后基于科室之间的相关性、检验项目归一或者检验项目之间的相关性,推荐就诊科室的医生关注历史的某些检验项目报告,医生查看患者既往健康信息时,可以通过相关度推荐查看相关度较高的检验项目报告;
[0032]A8:利用通过大数据分析技术和NLP医疗知识图谱对诊疗数据进行分析处理进行检验项目相关性分析,进行某些特定健康指标或项目的健康风险评估计算,个人用户可观察自身长期健康的变化状况及评估当前的健康风险,进行自我健康监测及管理,从而形成相应的档案信息管理平台。
[0033]优选的,所述A1步骤中录入的医疗数据分为患者身份识别数据、门诊就诊纪录、急诊就诊记录、住院出院病历、药品处方西成药、药品处方中药、检查报告、手术报告、检验结果、药敏结果、细菌结果、过敏及药物不良反应、防疫接种、个人疾病史等模型,再结合各医疗结构的数据调研情况后,完善模型设计,约定数据上云的范围。
[0034]优选的,所述健康档案信息平台支持面向各类场景的健康档案智能化、个性化展示,包括医生工作台的调阅、用户手机端和web端。
[0035]优选的,所述医疗数据的存储采用分层存储的数据集合当前在MaxCompute上建立的数据仓库构架可分成数据缓冲层、数据清洗层、数据明细层、应用数据层和增量数据同步层;
[0036]数据缓冲层:在存储数据上云的原始数据,与医院内部系统的数据内容、数据结构保持一致,主要为了后续数据处理有源可查;
[0037]数据清洗层:对数据缓冲层的数据进行标准化处理,对相应数值、姓名、手机号、身份证号等数据进行数据的标准化,并且将相应的无效数据进行清洗去除;
[0038]数据明细层:对数据清洗层的数据进行整合、关联,处理为各类主题的完整的明细数据;
[0039]应用数据层:按照各类应用不同的需求,对数据明细层的数据进行组装,最终将组装完成后的数据进行归类整理,并将数据给到不同应用场景中进行使用;
[0040]增量数据同步层:各类应用数据层的结果数据进行同步,将数据从大数据平台同步到应用的数据库,供应用进行使用。
[0041]优选的,所述数据质量同时提供了历史校验结果管理,以便对数据质量进行分析和定级,所述校验结果是对A1步骤中输入的数据进行验证的结果,所述校验结果属于数据质量的明细数据。
[0042]优选的,所述约定上云范围包括数据量范围以及数据类别,所述数据量为相应时间段的相关传输数据量数据,当数据量到达一定阈值之后即可将数据量进行上云,所述数
据类别约定为相应医院所存在的业务所产生的数据,比如近三个月的门诊、急诊就诊记录、药品处方、检查报告、检验报告等不同类型数据。
[0043]优选的,所述数据质量的分析和定级根据相应业务对数据质量进行分析和定级,所述数据质量的分析的密度是为了对现有的检测规则进行新增、修改和删除;所述数据质量的定级主要是为了给不同的规则做得分权重,来调整不同规则对于数据质量的关联程度。
[0044]优选的,所述相似关联度判断通过计算文本相似度来判断相似关联度,如文本检索、自动问答、文档分类聚类、文档查重、摘要;
[0045]所述相似关联度的判断在医疗数据的长度对相关性影响的中,长度越大,医疗数据的长度影响越大,而医疗数据的相对长度越长,值越大,相关性得分也相应越少,为此医疗数据越长包含的可能性就越大,相关性就要越弱;
[0046]为此,相似关联度得分公式为:
[0047][0048]与现本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源数据的健康档案信息平台建立方法,其特征在于:所述健康档案信息平台建立方法包括以下步骤:A1:基于eHR应用设计前置机数据模型:首先将整块的医疗数据进行数据录入;A2:所述A1步骤中医疗数据上云分为结构化数据和非结构化数据,将结构化数据和非结构化数据生成数据视图作数据统计展示;A3:数据质量以A2步骤形成的数据集(DataSet)为监控对象,当离线数据发生变化时,数据质量会对数据集进行校验,并且阻塞生产链路,以避免数据污染扩散,并形成整体数据质量评判表格,从而来表示数据质量的优劣;A4:利用大数据分析技术和NLP医疗知识图谱,辅助医护人员能够从多组的辅助各类医疗数据集中对需要的数据等进行快速定位、获取各场景下的重点信息;A5:通过大数据分析技术和NLP医疗知识图谱对诊疗数据进行分析处理,形成算法模型;A6:对就医患者进行就医信息以及相应的医疗数据进行相似关联度判断,在判断过程中需要考虑相同检查项目的类型,还需要考虑检查部位的包含关系,不同的部位的相似度相差较大,通过大量数据的算法训练后得出重复性和相似性提醒,从而可减少不必要的开单;所述相似关联度判断通过计算文本相似度来判断相似关联度,如文本检索、自动问答、文档分类聚类、文档查重、摘要;所述相似关联度的计算流程包括以下步骤:计算搜索词与每篇文档之间的相关性分数;Score(Q,d)=sum
in
W
i
.R(q
i
,d)其中,Q为用户输入的搜索关键字;q
i
表示用户输入的关键字解析之后的语素,其中关键词解析之后的语素为中文的时候,分词作为语素,每个分词为一个语素;d:表示其中一组被搜索的相关医疗数据;R(q
i
,d)表示语素q
i
与相关医疗数据d的相关性得分;W
i
表示语素与q
i
的权重;IDF(q
i
)=logfracN

n(q
i
)+0.5n(q
i
)+0.5其中,N表示录入的所有医疗数据中的全部医疗数据数;n(q
i
):表示为包含了q
i
的医疗数据数;R(q
i
,d)=fracf
i
.(k1+1)f
i
+K.fracf
i
.(k2+1)qf
i
+k2K=k1.(1

b+b.fracdlavg(dl))其中,k1、k2、b属于调节因子,设置为k1=2,b=0.75;f
i
:表示语素q
i
在每篇相应医疗数据中出现的频率;qf
i
:表示语素q
i
在搜索关键词中出现的频率;dl:表示医疗数据的长度;avg(dl):表示所有医疗数据集中所有医疗数据的平均长度A7:利用通过大数据分析技术和NLP医疗知识图谱对诊疗数据进行分析处理,进行检验项目相关性分析:利用多组医疗机构的各个科室的常检验项目族来确定各个科室和常检验项目族之间的关联关...

【专利技术属性】
技术研发人员:宋小波张晓莹吴建沪王振谢留贺许尧飞
申请(专利权)人:杭州半云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1