System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习模型融合的问诊意图识别方法技术_技高网

一种基于深度学习模型融合的问诊意图识别方法技术

技术编号:40397464 阅读:5 留言:0更新日期:2024-02-20 22:25
本发明专利技术属于人工智能技术领域,一种基于深度学习模型融合的问诊意图识别方法,其特征在于,意图识别在线模块及意图识别离线模块,意图识别在线模块内设置有在线Query模块,在线Query模块的输出端口分别信号连接有症状部位抽取模块、Query表征模块和分类模型模块。本发明专利技术通过意图识别在线模块及意图识别离线模块的设计,通过在线和离线双线运行,能够缓解医院门诊前台问诊压力,同时,通过问诊意图判断技术可以有效提高问诊效率和分诊准确率,捕获患者真实有效的病情症状等问诊信息,用于下一步智能分诊系统准确给出分诊科室推荐,为智能分诊等系统获取具有问诊意图的病情症状阐述。

【技术实现步骤摘要】

本专利技术属于人工智能,具体涉及一种基于深度学习模型融合的问诊意图识别方法


技术介绍

1、随着科技的发展,ai技术在健康智能问诊领域得到了许多应用,已经出现了在线问诊平台以及一些针对中医问诊的app,当看病不方便的时候,可以在线上完成问诊;

2、中国专利技术专利:申请号cn202210512464.5,公开号cn114817547a公开了一种基于多维表征的问诊意图识别方法、装置、设备及介质,包括:获取目标患者的病况信息,抽取所述病况信息的文本特征;将所述文本特征利用预设的表征向量投影至预设的意图识别任务模型内的意图表征层和轮次片段信息表征层得到第一表征和第二表征;利用预设的命名实体预测模型提取所述病况信息内的命名实体,将所述命名实体利用所述表征向量投影至症状抽取任务模型内的症状表征层得到第三表征;将所述三个表征进行均值化处理,根据均值化处理的结果确定问诊意图;

3、该问诊意图识别方法在实际使用的过程中,患者的提问一般较短,大约在2-5个中文字符,对意图识别能力要求极高,此时仅利用简单分类方法训练得到的模型泛化能力较差,或采用深度学习方法,通过bert编码得到的表征较弱,会出现一些提问的意图被识别错误,为此我们设计出了一种基于深度学习模型融合的问诊意图识别方法来解决上述的问题。


技术实现思路

1、针对现有技术的不足,本专利技术的目的在于提供一种基于深度学习模型融合的问诊意图识别方法,它可以解决现有问诊意图识别方法泛化能力较差,表征较弱,提问的意图识别容易错误的问题,本专利技术采用如下的技术方案。

2、一种基于深度学习模型融合的问诊意图识别方法,其特征在于:意图识别在线模块及意图识别离线模块;

3、意图识别在线模块内设置有在线query模块,在线query模块的输出端口分别信号连接有症状部位抽取模块、query表征模块和分类模型模块,症状部位抽取模块、query表征模块和分类模型模块的输出端口共同信号连接有预测结果融合模块;

4、意图识别离线模块内设置有query集合模块,query集合模块的输出端口信号连接有弱分类器模块,弱分类器模块包括基于检索的弱分类器、基于规则的弱分类器及基于模型的弱分类器,弱分类器模块的输出端口分别信号连接有正样本模块和负样本模块,正样本模块和负样本模块的输出端口共同信号连接有强分类模型模块;

5、强分类模型模块的输出端口与弱分类器模块信号连接,强分类模型模块的输出端口与分类模型模块信号连接。

6、优选地,基于检索的弱分类器将已有的query集合模块进行意图识别分类,通过kg-bert进行编码,编码维度为768,对待标注数据进行编码预测,以余弦相似度做为其一指标来计算,同时采用编辑距离、jaccard算法共三个维度进行融合计算输出最终预测结果。

7、优选地,基于规则的弱分类器采用一种细粒度各场景通用的医疗文本结构化信息抽取方法,该方法从schema设计上囊括了所有医疗文书可能涉及到的医疗实体,文本标注与模型训练上采用最细粒度信息单元进行数据标注与模型训练,并且提供了除了实体识别、关系抽取之外的通用属性识别以及特殊属性识别的能力,保证以最细粒度抽取出非结构化文本信息中包含的全部信息;

8、也可采用公开比赛数据集来构建医疗实体识别模型。

9、优选地,构建基于模型的弱分类器需要做基于医疗知识图谱的知识融合增强预训练模型准备工作,构建基于知识图谱的graph embedding,将现有医疗领域知识图谱进行全量导出并清洗,其中实体类型包含药品、基因、诊断等61类,关系包含适应症、科室、子类等124类,采用transe算法进行graph embedding训练,最终得到关于entity、relation的graph embedding词嵌入;

10、构建基于知识图谱的知识融合增强预训练模型:

11、s1.利用公开无监督电子病历数据合并整理构建无监督数据;

12、s2.对s1结果进行分句处理,分句策略为出现句号切分即可;

13、s3.利用知识图谱实体表构建actree实体;

14、s4.将s2中有效无监督数据进行实体扫描并链接至知识图谱得到已链接知识图谱的医疗无监督数据集;

15、s5.对知识图谱实体表进行处理得到entity2id和entity2anchor词典;

16、s6.采用thu-ernie算法来训练得到基于知识图谱的知识融合增强预训练模型,thu-ernie相比于bert的mlm和nsp增加了mep;

17、s7.通过加入部分意图识别数据集进行训练可得到基于模型的弱分类器。

18、优选地,基于规则的弱分类器可识别出query集合模块中的疾病、药品、手术、异常发现、检查、检验等实体,通过分析,若query集合模块中含有医疗问诊实体,即可对query集合模块进行意图识别预测。

19、优选地,基于规则的弱分类器中的通用属性识别包括否定的、既往的等,特殊属性识别包括限定、剂量、单位等。

20、优选地,通过基于检索的弱分类器、基于规则的弱分类器和基于模型的弱分类器对query集合模块进行预测,对结果进行模型融合得到意图识别数据集,并且优化文本分类的结果,采用知识增强的预训练语言模型+softmax训练得到强分类模型,结合基于医疗细粒度实体识别+检索+强分类模型,通过模型预测融合能力,最终产出强分类模型模块。

21、优选地,在线query模块通过对线上患者query的持续收集,合理运用数据挖掘和回流等技术来扩充数据集,尽可能覆盖到真实场景的query分布,可通过对单模型的训练优化;

22、最后对基于检索的弱分类器、基于规则的弱分类器和基于模型的弱分类器进行调优,得到更好的弱分类器模块。

23、与现有技术相比,本专利技术的有益效果是:

24、一、本专利技术基于深度学习模型融合的问诊意图识别方法,通过意图识别在线模块及意图识别离线模块的设计,通过在线和离线双线运行,能够缓解医院门诊前台问诊压力,同时,通过问诊意图判断技术可以有效提高问诊效率和分诊准确率,捕获患者真实有效的病情症状等问诊信息,用于下一步智能分诊系统准确给出分诊科室推荐,为智能分诊等系统获取具有问诊意图的病情症状阐述,进而可以提升分诊准确率。

25、二、本专利技术基于深度学习模型融合的问诊意图识别方法,通过弱分类器模块的设计,可以通过弱分类器模块内三个已构建好的弱分类器对已有query集合模块进行预测,对结果进行模型融合得到意图识别数据集,此阶段可减少大量人工标注工作以及解决了医疗领域数据集稀缺的问题,同时提高了文本信息处理的灵活性和能力,进而提升了意图识别模型构建到上线效率,大大缩短工期。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习模型融合的问诊意图识别方法,其特征在于:意图识别在线模块(1)及意图识别离线模块(2);

2.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:基于检索的弱分类器(2021)将已有的Query集合模块(201)进行意图识别分类,通过KG-BERT进行编码,编码维度为768,对待标注数据进行编码预测,以余弦相似度做为其一指标来计算,同时采用编辑距离、jaccard算法共三个维度进行融合计算输出最终预测结果。

3.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:基于规则的弱分类器(2022)采用一种细粒度各场景通用的医疗文本结构化信息抽取方法,该方法从schema设计上囊括了所有医疗文书可能涉及到的医疗实体,文本标注与模型训练上采用最细粒度信息单元进行数据标注与模型训练,并且提供了除了实体识别、关系抽取之外的通用属性识别以及特殊属性识别的能力,保证以最细粒度抽取出非结构化文本信息中包含的全部信息;

4.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:构建基于模型的弱分类器(2023)需要做基于医疗知识图谱的知识融合增强预训练模型准备工作,构建基于知识图谱的Graph Embedding,将现有医疗领域知识图谱进行全量导出并清洗,其中实体类型包含药品、基因、诊断等61类,关系包含适应症、科室、子类等124类,采用TransE算法进行graph embedding训练,最终得到关于Entity、Relation的GraphEmbedding词嵌入;

5.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:基于规则的弱分类器(2022)可识别出Query集合模块(201)中的疾病、药品、手术、异常发现、检查、检验等实体,通过分析,若Query集合模块(201)中含有医疗问诊实体,即可对Query集合模块(201)进行意图识别预测。

6.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:基于规则的弱分类器(2022)中的通用属性识别包括否定的、既往的等,特殊属性识别包括限定、剂量、单位等。

7.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:通过基于检索的弱分类器(2021)、基于规则的弱分类器(2022)和基于模型的弱分类器(2023)对Query集合模块(201)进行预测,对结果进行模型融合得到意图识别数据集,并且优化文本分类的结果,采用知识增强的预训练语言模型+Softmax训练得到强分类模型,结合基于医疗细粒度实体识别+检索+强分类模型,通过模型预测融合能力,最终产出强分类模型模块(205)。

8.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:在线Query模块(101)通过对线上患者query的持续收集,合理运用数据挖掘和回流等技术来扩充数据集,尽可能覆盖到真实场景的query分布,可通过对单模型的训练优化;

...

【技术特征摘要】

1.一种基于深度学习模型融合的问诊意图识别方法,其特征在于:意图识别在线模块(1)及意图识别离线模块(2);

2.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:基于检索的弱分类器(2021)将已有的query集合模块(201)进行意图识别分类,通过kg-bert进行编码,编码维度为768,对待标注数据进行编码预测,以余弦相似度做为其一指标来计算,同时采用编辑距离、jaccard算法共三个维度进行融合计算输出最终预测结果。

3.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:基于规则的弱分类器(2022)采用一种细粒度各场景通用的医疗文本结构化信息抽取方法,该方法从schema设计上囊括了所有医疗文书可能涉及到的医疗实体,文本标注与模型训练上采用最细粒度信息单元进行数据标注与模型训练,并且提供了除了实体识别、关系抽取之外的通用属性识别以及特殊属性识别的能力,保证以最细粒度抽取出非结构化文本信息中包含的全部信息;

4.根据权利要求1所述的一种基于深度学习模型融合的问诊意图识别方法,其特征在于:构建基于模型的弱分类器(2023)需要做基于医疗知识图谱的知识融合增强预训练模型准备工作,构建基于知识图谱的graph embedding,将现有医疗领域知识图谱进行全量导出并清洗,其中实体类型包含药品、基因、诊断等61类,关系包含适应症、科室、子类等124类,采用transe算法进行graph embedding训练,最终...

【专利技术属性】
技术研发人员:吴思萌刘研张伟杨春钱琨周宸彬于佳婕耿妍郭立超顾建英樊嘉
申请(专利权)人:复旦大学附属中山医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1