一种基于医疗病案的知识库构建方法技术

技术编号:46360030 阅读:9 留言:0更新日期:2025-09-15 12:38
本发明专利技术涉及数据处理技术领域,尤其涉及一种基于医疗病案的知识库构建方法。该方法包括:首先收集多份病历文本,并进行分词预处理,接着计算各分词在多份病历的特异性;计算当前病历与剩余病历的语义关联性,通过分词贡献度及其权重修正语义关联性;再根据实际关联性计算当前病历的孤立性,依此修正对应病历的核函数参数值;然后利用修正参数的聚类算法处理病历,得到目标聚类簇;最后基于目标聚类簇构建知识库。本发明专利技术通过计算分词特异性剔除通用词、保留疾病关键术语,结合贡献度修正语义关联性,基于孤立性调整核函数参数优化聚类,形成结构化聚类簇构建知识库,提升病历分析精准度与医疗数据利用智能化水平。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于医疗病案的知识库构建方法


技术介绍

1、随着医疗信息化的深入发展,医疗数据呈现爆发式增长,其中大量医疗病历以非结构化形式存在。这些非结构化病历详细记录了临床诊疗过程、疾病发展轨迹以及医生决策依据,蕴含着极高的医学价值。然而,由于缺乏有效的语义理解和结构化处理技术,这些宝贵的数据资源难以被高效检索、分析和利用,导致数据价值未能充分释放。

2、传统的医疗病案知识库构建方式主要依赖人工归档和分类。这种方法不仅耗时耗力、效率低下,而且容易出现信息遗漏、误判等问题。在现代医疗对精准决策支持和大规模数据分析的迫切需求下,传统方式已难以满足实际应用要求,亟需探索新的知识库构建方法。

3、目前,密度峰值聚类算法在病历分类中得到了应用,该算法通过核函数参数计算病历的局部密度,进而确定聚类峰值完成分类。然而,在医疗场景下,该算法存在明显局限性。由于罕见疾病样本数量稀少,在算法设定的参数范围内,罕见病历难以找到足够多的相似病历,导致其局部密度计算值偏低。相较于常见疾病病历,罕见病历难以形成明显的密度峰值,在聚类过本文档来自技高网...

【技术保护点】

1.一种基于医疗病案的知识库构建方法,其特征在于,包括:

2.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述分词的贡献度;

3.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述实际关联性;

4.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述每个所述分词在所述多份病历的特异性满足关系式:;

5.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述根据所述实际关联性计算所述当前病历的孤立性,包括:

6.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于...

【技术特征摘要】

1.一种基于医疗病案的知识库构建方法,其特征在于,包括:

2.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述分词的贡献度;

3.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述实际关联性;

4.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述每个所述分词在所述多份病历的特异性满足关系式:;

5.根据权利要求1所述的基于医疗病案的知识库构建方法,其特征在于,所述根据所述实际关联性计算所述当前病历的孤立性,包括:

6.根据权利要求1所述的基于医疗...

【专利技术属性】
技术研发人员:李昂孟波马江泉
申请(专利权)人:江苏斯普德科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1