一种基于基学习器和元学习器的医疗文本分类方法技术

技术编号:42576837 阅读:31 留言:0更新日期:2024-08-29 00:40
本发明专利技术公开了一种基于基学习器和元学习器的医疗文本分类方法,包括以下:S1:构建数据集,数据集包括若干医疗文本和对应的标签;S2:步骤S2:构建医疗文本分类模型,医疗文本分类模型包括基学习器和元学习器,异构模型从医疗文本中提取不同层次的语义信息并输出基学习器预测结果;S3:使用S2的元特征来训练元学习器;S4:通过元学习器计算给定样本预测为类别k的概率估计。本发明专利技术提升了医疗文本分类的整体准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及文本分类领域,更具体地说,本专利技术涉及基于一种基于基学习器和元学习器的医疗文本分类方法


技术介绍

1、医疗文本分类是nlp在医疗领域的重要任务之一。早期的文本分类主要依赖基于规则的方法,严重依赖领域专家设计相关规则,导致灵活性和泛化程度有限。

2、然而,随着机器学习的不断进步,包括决策树(dt)和支持向量机(svm)的出现,让文本分类变得更加可行。例如,garla等人提出了一种laplaciansvms用于癌症文本分类。然而,这些方法往往忽略了单词的顺序信息,导致无法充分捕捉文本中的语义细节。随着深度学习的发展,rnn及其变体lstm和bilstm在文本分类中表现出了卓越的性能,这些模型可以更有效地处理文本中地长期依赖关系和局部特征。kimetal首次提出了将cnn用于文本分类,通过多个卷积和池化层提取文本的关键特征使其具有较好的并行处理能力和平移不变性,在此基础上johnson等人提出了dpcnn模型,该模型增加了卷积神经网络(cnn)的深度。每一层的计算时间呈“金字塔"状指数递减,通过残余连接保留了基本信息,从而提高了准确本文档来自技高网...

【技术保护点】

1.一种基于基学习器和元学习器的医疗文本分类方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于基学习器和元学习器的医疗文本分类方法,其特征在于,步骤S2中的导入步骤S1中的数据集中的训练集的医疗文本至基学习器,基学习器的每组异构模型输出基学习器预测结果,具体为:

3.如权利要求1所述的基于基学习器和元学习器的医疗文本分类方法,其特征在于,对步骤S2中的基学习器进行训练,具体为:

4.如权利要求1所述的基于基学习器和元学习器的医疗文本分类方法,其特征在于,步骤S3中的元学习器通过损失函数进行训练以优化参数具体为:

【技术特征摘要】

1.一种基于基学习器和元学习器的医疗文本分类方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于基学习器和元学习器的医疗文本分类方法,其特征在于,步骤s2中的导入步骤s1中的数据集中的训练集的医疗文本至基学习器,基学习器的每组异构模型输出基学习器预测结果,具体为...

【专利技术属性】
技术研发人员:陈华金怀雨姚晨张文康
申请(专利权)人:江西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1