【技术实现步骤摘要】
一种基于多源数据的健康档案信息平台建立方法
[0001]本专利技术涉及医疗
,具体为一种基于多源数据的健康档案信息平台建立方法。
技术介绍
[0002]随着医疗信息技术的进步,医疗信息统新模式、新技术、新架构的出现,医院的信息化水平大幅提升。目前要求医院准确把握新一轮科技革命和产业变革趋势,主动适应新兴技术、服务业态和发展形态,创新思维模式、管理模式和服务模式,以信息化为支撑,充分运用云计算、大数据、物联网及移动互联等技术,助推医院医疗模式创新和管理模式创新,促进病人就医便捷化、临床医疗智能化与医院管理精细化,努力建设适应“互联网+”时代背景和精准医疗发展。
[0003]健康档案是以个人的身心为核心,贯穿全生命周期,通过多种途径收集和记录各种健康数据,及时更新、保持个人健康信息的连续性和有效性,通过标准规范、科学地记录一个人一生中各项与健康相关的档案。健康档案不仅记录病史、病程、诊疗情况,进行客观展示,还将结合患者/居民的健康习惯、健康管理等信息,再基于大数据分析能力,将使医生会诊的时间大大缩短,质量大大提高;同时,上下级医院的信息交流更可以提高基层医院医疗水平。
[0004]基于健康档案的区域卫生信息平台的建设时间整体较早,只覆盖了个人基本信息或基本健康资料的收集,而个人的各类健康评估资料、保健资料、医疗资料等依然分散在各个医疗卫生业务系统中,无法为个人用户提供连续性、标准化的健康档案服务,也无法为医护人员提供全面性的医疗数据参考,更不能在急救、远程会诊、“互联网+”医疗、家庭医生服务等医疗业 ...
【技术保护点】
【技术特征摘要】
1.一种基于多源数据的健康档案信息平台建立方法,其特征在于:所述健康档案信息平台建立方法包括以下步骤:A1:基于eHR应用设计前置机数据模型:首先将整块的医疗数据进行数据录入;A2:所述A1步骤中医疗数据上云分为结构化数据和非结构化数据,将结构化数据和非结构化数据生成数据视图作数据统计展示;A3:数据质量以A2步骤形成的数据集(DataSet)为监控对象,当离线数据发生变化时,数据质量会对数据集进行校验,并且阻塞生产链路,以避免数据污染扩散,并形成整体数据质量评判表格,从而来表示数据质量的优劣;A4:利用大数据分析技术和NLP医疗知识图谱,辅助医护人员能够从多组的辅助各类医疗数据集中对需要的数据等进行快速定位、获取各场景下的重点信息;A5:通过大数据分析技术和NLP医疗知识图谱对诊疗数据进行分析处理,形成算法模型;A6:对就医患者进行就医信息以及相应的医疗数据进行相似关联度判断,在判断过程中需要考虑相同检查项目的类型,还需要考虑检查部位的包含关系,不同的部位的相似度相差较大,通过大量数据的算法训练后得出重复性和相似性提醒,从而可减少不必要的开单;所述相似关联度判断通过计算文本相似度来判断相似关联度,如文本检索、自动问答、文档分类聚类、文档查重、摘要;所述相似关联度的计算流程包括以下步骤:计算搜索词与每篇文档之间的相关性分数;Score(Q,d)=sum
in
W
i
.R(q
i
,d)其中,Q为用户输入的搜索关键字;q
i
表示用户输入的关键字解析之后的语素,其中关键词解析之后的语素为中文的时候,分词作为语素,每个分词为一个语素;d:表示其中一组被搜索的相关医疗数据;R(q
i
,d)表示语素q
i
与相关医疗数据d的相关性得分;W
i
表示语素与q
i
的权重;IDF(q
i
)=logfracN
‑
n(q
i
)+0.5n(q
i
)+0.5其中,N表示录入的所有医疗数据中的全部医疗数据数;n(q
i
):表示为包含了q
i
的医疗数据数;R(q
i
,d)=fracf
i
.(k1+1)f
i
+K.fracf
i
.(k2+1)qf
i
+k2K=k1.(1
‑
b+b.fracdlavg(dl))其中,k1、k2、b属于调节因子,设置为k1=2,b=0.75;f
i
:表示语素q
i
在每篇相应医疗数据中出现的频率;qf
i
:表示语素q
i
在搜索关键词中出现的频率;dl:表示医疗数据的长度;avg(dl):表示所有医疗数据集中所有医疗数据的平均长度A7:利用通过大数据分析技术和NLP医疗知识图谱对诊疗数据进行分析处理,进行检验项目相关性分析:利用多组医疗机构的各个科室的常检验项目族来确定各个科室和常检验项目族之间的关联关...
【专利技术属性】
技术研发人员:宋小波,张晓莹,吴建沪,王振,谢留贺,许尧飞,
申请(专利权)人:杭州半云科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。