一种基于医疗知识图谱的智能医疗数据管理系统及方法技术方案

技术编号:36963260 阅读:50 留言:0更新日期:2023-03-22 19:23
本发明专利技术涉及医疗知识图谱领域,具体为一种基于医疗知识图谱的智能医疗数据管理系统及方法,所述系统包括数据获取模块、知识图谱构建模块、实体抽取模块以及辅助优化管理模块;所述辅助优化管理模块用于对医疗病例、医学知识进行智能管理,根据妇幼患者信息匹配最佳诊疗方案;本发明专利技术通过运用ML算法构建隐马尔科夫模型,基于隐马尔可夫模型对医疗知识进行实体抽取,基于RNN关系抽取模型实现关系抽取,最后将得到的数据进行知识融合,构建医疗知识图谱,实现对妇幼医疗病例、妇幼医学知识进行智能管理,达到辅助医生优化诊疗方案的效果。达到辅助医生优化诊疗方案的效果。达到辅助医生优化诊疗方案的效果。

【技术实现步骤摘要】
一种基于医疗知识图谱的智能医疗数据管理系统及方法


[0001]本专利技术涉及医疗知识图谱领域,具体为一种基于医疗知识图谱的智能医疗数据管理系统及方法。

技术介绍

[0002]目前医院中都普遍使用CDSS(ClinicalDecisionSupportSystem,临床决策支持系统)来进行病例、患者管理。CDSS中主要用于对所有的病例数据进行数据库字段的存储和管理;其对诊疗流程和各种风险的预测,主要是通过人工规则的方式进行设定,缺乏灵活性。医生只能单纯地查看、编辑这些数据。
[0003]但是由于不同医院之间使用的CDSS一般不通用,因此CDSS的使用只能对本医院的病人病例和数据进行管理,灵活性差。此外,目前的CDSS系统,普遍缺乏对电子数据的有效分析,因此其进行诊疗流程和风险预测的能力有限。
[0004]随着科学技术的发展。在进行诊疗优化、风险预测时,CDSS会应用知识图谱数据,通过知识图谱中的数据信息,进行最佳诊疗匹配,而鉴于知识图谱数据构建本身的要求较高,因此,现在CDSS经常会遇到很多问题,例如:知识图谱数据规模较小,在实际应用中应用场景受限;数据错误过多,无法真正用于实际的医疗工作;数据过于丰富,但是缺乏场景定制化(针对不同国家、不同地区,提供的数据完全相同),忽略了不同地域人群之间的患病概率、治疗水平等外部因素的差异,导致实际使用中指导性较差;
[0005]知识图谱涉及技术繁多,其中主要包括知识表示、图谱构建和图谱应用三个方面。知识表示是针对计算机内部表示和处理客观事件知识的方法研究;知识图谱侯建解决如何构建一个算法从客观世界或各种数据资源获取客观事件的互联网知识,知识图谱应用的主要任务是研究如何利用知识图谱去更好的解决现实生活中的实际问题;
[0006]知识图谱的构建需要基于特定的知识表示模型,利用几何学习和信息抽取等技术,从复杂的互联网信息中进行抽取出有利用价值的信息,并作为知识图谱的数据来源,从而为知识图谱的构建提供数据参照,其核心技术为信息抽取和语义集成;影响知识图谱构建的因素有很多,其中主要的三个因素为:第一,从何处进行学习知识,根据什么样的数据资源进行学习,其中原始网页数据包括结构化、半结构化和非结构化三种数据,第二,学习的知识包括哪些内容,其中主要包括概念层次、事实知识、事件知识等;第三,需要采用何种学习方式来进行知识的获取;
[0007]知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性值,实体间通过关系相互连接,构成网状的知识结构。
[0008]综上所述,目前并没有一种具有针对性、实用性强、效率高的系统来辅助医生进行诊疗优化;而知识图谱从图形上描述了现实世界中的概念和实体之间的复杂关系,让互联网通过一种让人类更容易接受的认知世界的方式去传达信息,去组织、管理信息,也让人们能够更好的理解知识;知识图谱还可以结合大数据、深度学习等为我国的智能科技的发展
做出巨大的贡献。

技术实现思路

[0009]本专利技术的目的在于提供一种基于医疗知识图谱的智能医疗数据管理系统及方法,以解决上述
技术介绍
中提出的问题。
[0010]为了解决上述技术问题,本专利技术提供如下技术方案:
[0011]一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述方法包括以下步骤:
[0012]S1、通过医疗大数据获取妇幼患者的信息;
[0013]S2、采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取;
[0014]S3、结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱;
[0015]S4、根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案。
[0016]进一步的,所述S1中通过医疗大数据获取妇幼患者的信息的方法包括以下步骤:
[0017]SA1、通过医疗大数据获取妇幼患者性别、年龄、疾病名称、诊断报告,并将获取的信息作为第一特征信息;
[0018]SA2、通过医疗大数据获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备,并将获取的信息作为第二特征信息。
[0019]进一步的,所述S2中采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取的方法包括以下步骤:
[0020]SB1、根据统计的方法对特征信息进行训练,通过训练样本得到隐马尔科夫模型参数,运用ML算法构建隐马尔科夫模型,并设定状态集合Q={妇幼患者性别、年龄、疾病名称、诊断报告}和观测事件集合V={妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备};
[0021]SB2、获取状态集合和观测事件集合中元素,并构建状态集合S对应的模型状态序列T,表达式为S={s1,s2,s3,...,s
T
},O={o1,o2,o3,...,o
T
},其中O表示对应训练序列的观测序列;
[0022]SB3、根据公式对训练序列的初始概率和转移概率进行分块,其中P
i
表示初始状态为i的概率,P
i

j
表示从状态i转移到状态j的概率,O
i
表示观测序列O中初始状态为i的序列个数,O
i

j
表示观测序列O中,从状态i转移到状态j的次数;
[0023]SB4、根据公式1≤j≤T,1≤S≤M得到输出释放概率,其中S
i
(V
j
)表示观测序列O中,状态为i对应释放单词V
j
的次数,M表示输出单词的值,即观测事件集合中的元素;
[0024]SB5、基于隐马尔科夫模型进行文本信息抽取,以观测序列O={o1,o2,o3,...,o
T
}
作为模型的输入,采用Viterbi算法,找出最大概率的状态标签序列,被标记为目标状态标签的观察文本即为妇幼医疗知识抽取的内容,其中Viterbi算法是一种动态规划算法,用于寻找最有可能产生观测事件序列的维特比路径,可利用python实现Viterbi算法;
[0025]SB6、基于RNN关系抽取模型,针对每一个状态集合中元素的输入,通过词嵌入处理转换成固定维度的向量;
[0026]SB7、采用双向RNN层进行特征抽取,通过双向RNN建模输入序列的语义特征;
[0027]SB8、基于RNN层特征抽取,得到一个输出序列,即{b1,b2,b3,...,b
t
};
[0028]SB9、根据公式m
i
=MAX(b
t
)
i
1<i<L
RNN
得到状态为i的集合中元素经过处理后转换成固定维度的向量值,记为m,并通过softmax进行处理即可得到输出分类的结果,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述方法包括以下步骤:S1、通过医疗大数据获取妇幼患者的信息;S2、采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取;S3、结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱;S4、根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案。2.根据权利要求1所述一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述S1中通过医疗大数据获取妇幼患者的信息的方法包括以下步骤:SA1、通过医疗大数据获取妇幼患者性别、年龄、疾病名称、诊断报告,并将获取的信息作为第一特征信息;SA2、通过医疗大数据获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备,并将获取的信息作为第二特征信息。3.根据权利要求2所述一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述S2中采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取的方法包括以下步骤:SB1、根据统计的方法对特征信息进行训练,通过训练样本得到隐马尔科夫模型参数,运用ML算法构建隐马尔科夫模型,并设定状态集合Q={妇幼患者性别、年龄、疾病名称、诊断报告}和观测事件集合V={妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备};SB2、获取状态集合和观测事件集合中元素,并构建状态集合S对应的模型状态序列T,表达式为S={s1,s2,s3,...,s
T
},O={o1,o2,o3,...,o
T
},其中O表示对应训练序列的观测序列;SB3、根据公式对训练序列的初始概率和转移概率进行分块,其中P
i
表示初始状态为i的概率,P
i

j
表示从状态i转移到状态j的概率,O
i
表示观测序列O中初始状态为i的序列个数,O
i

j
表示观测序列O中,从状态i转移到状态j的次数;SB4、根据公式得到输出释放概率,其中S
i
(V
j
)表示观测序列O中,状态为i对应释放单词V
j
的次数,M表示输出单词的值,即观测事件集合中的元素;SB5、基于隐马尔科夫模型进行文本信息抽取,以观测序列O={o1,o2,o3,...,o
T
}作为模型的输入,采用Viterbi算法,找出最大概率的状态标签序列,被标记为目标状态标签的观察文本即为妇幼医疗知识抽取的内容;SB6、基于RNN关系抽取模型,针对每一个状态集合中元素的输入,通过词嵌入处理转换成固定维度的向量;SB7、采用双向RNN层进行特征抽取,通过双向RNN建模输入序列的语义特征;SB8、基于RNN层特征抽取,得到一个输出序列,即{b1,b2,b3,...,b
t
};
SB9、根据公式m
i
=MAX(b
t
)
i
1<i<L
RNN
得到状态为i的集合中元素经过处理后转换成固定维度的向量值,记为m,并通过so...

【专利技术属性】
技术研发人员:刘尊亮吴芸王路路李云志吉昱行郝宁商超
申请(专利权)人:江苏雷奥生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1