一种类风湿性关节炎辅助分类模型训练方法及分类方法技术

技术编号:43333626 阅读:26 留言:0更新日期:2024-11-15 20:30
本发明专利技术公开一种类风湿性关节炎辅助分类模型训练方法及分类方法,对类风湿性关节炎患者数据中的结构化数据进行特征工程,得到其特征矩阵;非结构化数据使用BiLSTM+CRF方法完成命名实体识别,根据结果进行分词生成类风湿性关节炎领域分词词表并进行分词与编码,对得到的特征编码使用BERT+标签嵌入方法进行分类;将结构化数据的特征矩阵与非结构化数据的基于置信度分类结果进行融合得到融合特征矩阵;对融合特征矩阵使用支持向量机进行分类,得到分类结果;每次数据更新时,对非结构化数据进行命名实体识别并更新分词词表,基于融合特征样本计算边际损失,将边际损失大于阈值对应的样本纳入支持向量集合,更新支持向量集合和对应的标签,训练并更新支持向量机。

【技术实现步骤摘要】

本专利技术融合了医学、信息科学以及计算机应用等领域的知识,专利技术了一种基于多源异构数据融合的类风湿性性关节炎辅助分类模型训练方法及分类方法。


技术介绍

1、类风湿关节炎(rheumatoid arthritis,ra)是一种以手、足小关节的多关节、对称性、侵蚀性关节炎症为主要表现的全身性免疫风湿疾病.ra发病率高达0.3%~1%,是一种难治性疾病,病程反复、缠绵不愈、致残率高,可累及全身多个系统,严重危害人类健康。随着信息技术的进步,利用数据科学来加强医疗保健和疾病管理的需求正在迅速增加。在风湿免疫疾病的诊断中,计算机辅助诊断也面临很多问题,如:类风湿性关节炎疾病的数据通常包含不同来源不同结构的数据,这使得数据分析和模型构建变得复杂。


技术实现思路

1、本专利技术提出一种类风湿性关节炎辅助分类模型训练方法及分类方法,将类风湿性关节炎数据分为结构化数据与非结构化数据,分别对两部分数据进行处理,并进行特征级的融合,基于融合特征进行分类与诊断,辅助医生识别,提高准确率。

2、为了实现上述目的,本专利技本文档来自技高网...

【技术保护点】

1.一种类风湿性关节炎辅助分类模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的类风湿关节炎辅助分类模型训练方法,其特征在于,类风湿性关节炎疾病的多源异构数据包括电子病历、实验室值、医学测试结果。

3.根据权利要求1所述的类风湿关节炎辅助分类模型训练方法,其特征在于,提取类风湿性关节炎疾病的多源异构数据中非结构化数据,对命名实体进行标注,采用用BiLSTM+CRF进行命名实体识别,并拼接得到与类风湿性关节炎症状匹配的命名实体短语包括:

4.根据权利要求1所述的类风湿关节炎辅助分类模型训练方法,其特征在于,基于所得命名实体短语,对文本数据...

【技术特征摘要】

1.一种类风湿性关节炎辅助分类模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的类风湿关节炎辅助分类模型训练方法,其特征在于,类风湿性关节炎疾病的多源异构数据包括电子病历、实验室值、医学测试结果。

3.根据权利要求1所述的类风湿关节炎辅助分类模型训练方法,其特征在于,提取类风湿性关节炎疾病的多源异构数据中非结构化数据,对命名实体进行标注,采用用bilstm+crf进行命名实体识别,并拼接得到与类风湿性关节炎症状匹配的命名实体短语包括:

4.根据权利要求1所述的类风湿关节炎辅助分类模型训练方法,其特征在于,基于所得命名实体短语,对文本数据进行分词,生成类风湿性关节炎的领域词表;使用类风湿性关节炎的领域词表对原始文本数据进行分词与编码,构建文本数据的编码表示包括:

5.根据权利要求4所述的类风湿关节炎辅助分类模型训练方法,其特征在于,对非结构化文本原始数据进行命名实体识别,命名实体识别得到的实体内容重新拼接成实体短语时,按设定规则entity=(b+i)or n,n={1,2,3,4,5}拼接,具体地,对应生成词表时规则,拼接时数字位置信息按规则单独进行处理;生成词表时规则为:

6.根据权利要求1所...

【专利技术属性】
技术研发人员:黃昭曾庆美
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1