基于多模态文本摘要抽取的病人相似度分类方法技术

技术编号：41677885 阅读：18 留言：0更新日期：2024-06-14 15:32

本发明专利技术公开了基于多模态文本摘要抽取的病人相似度分类方法，包括：步骤1、对原始多源异构的多模态医疗文本数据进行预处理，构建数据集，其中包括结构化和非结构化的文本记录；步骤2、使用GPT大模型对步骤1得到的非结构化的文本记录进行摘要抽取，并对提取的文本摘要进行向量化取平均数，得到结构化的文本记录；步骤3、对步骤1得到的结构化的文本记录进行One‑Hot编码，形成离散数据；步骤4、将步骤2和步骤3得到的数据集进行合并，用SVM支持向量机方法对合并后的数据集进行分类，得到相似度分类结果。本发明专利技术方法可针对多源异构的多模态医疗记录进行病人相似度分类，并且分类准确率较高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于医疗数据处理方法，具体涉及一种基于多模态文本摘要抽取的病人相似度分类方法。

技术介绍

1、随着数字医疗系统的发展，电子健康记录(ehr)作为日常护理的一部分，其可用性不断增加，为病人相似度评估提供了前所未有的机会。电子健康记录(ehr)能够进行病人相似度学习辅助临床医疗决策，进而提高我们医疗保健系统的效率，可以进一步实现个性化医疗、疾病分类、轨迹预测、队列研究、医疗诊断等的自动化。

2、现有模型普遍的不足之处是忽略了学习过程中的多模态文本信息，如文本长短不一的重要医疗报告以及数据元素之间的潜在关系。当涉及到实际临床应用的技术细节时，这些多源异构的病人数据记录总是以多模态的方式存在。同时，许多重要的医疗记录也采用不同的模式，如文本报告、数字表格、医学图像等。病人相似度分析须基于这些多源异构的多模态数据来进行病人之间的相似度学习。

3、大规模生成模型如gpt的出现，为临床应用中多模态文本的摘要抽取进行零样本学习提供了前所未有的机遇。受大模型在自然语言处理中的成功启发，本专利技术提出一种适用于临床多模态医...

【技术保护点】

1.基于多模态文本摘要抽取的病人相似度分类方法，其特征在于，具体按照以下步骤实施：

2.根据权利要求1所述的基于多模态文本摘要抽取的病人相似度分类方法，其特征在于，步骤1具体按照以下步骤实施：

3.根据权利要求1所述的基于多模态文本摘要抽取的病人相似度分类方法，其特征在于，步骤2中，使用GPT3.5对步骤1得到的非结构化的文本记录进行摘要抽取，其中，主要参数的设置为：temperature＝1，max_tokens＝2000，top_p＝1，frequency_penalty＝0。

4.根据权利要求1所述的基于多模态文本摘要抽取的病人相似度分类方法，其...

【技术特征摘要】

1.基于多模态文本摘要抽取的病人相似度分类方法，其特征在于，具体按照以下步骤实施：

2.根据权利要求1所述的基于多模态文本摘要抽取的病人相似度分类方法，其特征在于，步骤1具体按照以下步骤实施：

3.根据权利要求1所述的基于多模态文本摘要抽取的病人相似度分类方法，其特征在于，步骤2中，使用gpt3.5对步骤1得到的非结构化的文本记录进行摘要抽取，其中，主要参数的设置为：temperature＝1，max_tokens＝2000，top_p＝1，frequency_penalty＝0。

4...

【专利技术属性】
技术研发人员：张杰，张鑫，康孟飞，张奇威，郭素伟，
申请(专利权)人：苏州慧医康数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人