System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 医疗文本意图识别方法、装置、电子设备和存储介质制造方法及图纸_技高网

医疗文本意图识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:40829673 阅读:2 留言:0更新日期:2024-04-01 14:52
本发明专利技术公开了一种医疗文本意图识别方法、装置、电子设备和存储介质,包括:将待识别医疗文本输入语言模型中,在语言模型输出当前时间步的多个候选词元时,通过调用接口调用集束搜索算法搜索出在医疗字典树中的候选词元构成当前时间步的、概率排序在前的N个候选词元序列,从最后一个时间步的N个候选词元序列中确定出概率最高的候选词元序列,将概率最高的候选词元序列所构成的语句确定为待识别医疗文本的意图语句,实现了通过医疗字典树指导语言模型输出符合医疗领域的意图语句,且通过集束搜索算法从多个候选词元序列中筛选出概率最高的序列生成意图语句,提高了意图语句所表达意图的准确性和专业性,通过意图可以准确响应医疗场景的咨询业务。

【技术实现步骤摘要】

本专利技术涉及健康信息处理,尤其涉及一种医疗文本意图识别方法、装置、电子设备和存储介质


技术介绍

1、随着互联网技术和人工智能的发展,在线智慧健康医疗已成为医疗行业解决医疗资源分配不均问题的重要方向。

2、目前,为了解决人工在线医疗服务对服务人员专业素质要求高的问题,主要通过基于专家规则和深度学习的方法实现机器应对在线医疗健康咨询,基于专家规则库需要制定准确的规则逻辑定义,覆盖范围有限且容易出现逻辑矛盾,基于深度学习算法中为了避免标注大量医疗领域的数据样本,通常采用现有的语言模型识别用户对话的意图,现有的语言模型缺乏医疗领域专业知识,无法高效准确识别用户的医疗咨询意图,导致难以根据用户咨询意图给出准确的咨询结果。


技术实现思路

1、本专利技术提供了一种医疗文本意图识别方法、装置、电子设备和存储介质,以解决现有技术中的语言模型缺乏医疗领域专业知识,无法高效准确识别用户的医疗咨询意图的问题。

2、第一方面,本专利技术提供了一种医疗文本意图识别方法,包括:

3、加载预置的语言模型;

4、获取待识别医疗文本;

5、将所述待识别医疗文本输入所述语言模型中,在所述语言模型输出当前时间步的多个候选词元时,通过预置的调用接口调用集束搜索算法搜索出在医疗字典树中的候选词元构成当前时间步的、概率排序在前的n个候选词元序列;

6、在所述语言模型输出最后一个时间步的候选词元后,从最后一个时间步的n个候选词元序列中确定出概率最高的候选词元序列;

7、将所述概率最高的候选词元序列所构成的语句确定为所述待识别医疗文本的意图语句。

8、第二方面,本专利技术提供了一种医疗文本意图识别装置,包括:

9、语言模型加载模块,用于加载语言模型;

10、待识别医疗文本获取模块,用于获取待识别医疗文本;

11、候选词元序列筛选模块,用于将所述待识别医疗文本输入所述语言模型中,在所述语言模型输出当前时间步的多个候选词元时,通过预置的调用接口调用集束搜索算法搜索出在医疗字典树中的候选词元构成当前时间步的、概率排序在前的n个候选词元序列;

12、候选词元序列确定模块,用于在所述语言模型输出最后一个时间步的候选词元后,从最后一个时间步的n个候选词元序列中确定出概率最高的候选词元序列;

13、意图语句确定模块,用于将所述概率最高的候选词元序列所构成的语句确定为所述待识别医疗文本的意图语句。

14、第三方面,本专利技术提供了一种电子设备,所述电子设备包括:

15、至少一个处理器;以及

16、与所述至少一个处理器通信连接的存储器;其中,

17、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术第一方面所述的医疗文本意图识别方法。

18、第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术第一方面所述的医疗文本意图识别方法。

19、本专利技术实施例的语言模型可以通过调用接口调用预置的集束搜索算法和医疗字典树,以从语言模型每个时间步输出的多个候选词元中搜索出在医疗字典树中的候选词元构成n个候选词元序列,并采用概率最高的候选词元序列确定待识别医疗文本的意图语句,在语言模型为现有已训练的语言模型时,通过医疗字典树可以指导语言模型,使得语言模型的输出更符合医疗领域的专业特性,并且通过集束搜索算法对语言模型的输出序列筛选,可以从多个组合的输出序列中筛选出概率最高的序列生成意图语句,所生成的意图语句既高效准确,又有具有医疗领域的专业知识,保证了意图语句所表达的意图的准确性和专业性,以通过意图搜索出准确的医疗知识响应医疗场景下用户的咨询业务。

20、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种医疗文本意图识别方法,其特征在于,包括:

2.如权利要求1所述的医疗文本意图识别方法,其特征在于,在加载语言模型之前,还包括:

3.如权利要求2所述的医疗文本意图识别方法,其特征在于,所述采用所述医疗文本数据集训练语言模型,包括:

4.如权利要求1所述的医疗文本意图识别方法,其特征在于,所述在所述语言模型输出当前时间步的多个候选词元时,通过预置的调用接口调用集束搜索算法搜索出在医疗字典树中的候选词元构成当前时间步的、概率最高的N个候选词元序列,包括:

5.如权利要求4所述的医疗文本意图识别方法,其特征在于,所述采用所述条件概率计算所述候选词元序列St的概率,包括:

6.如权利要求1所述的医疗文本意图识别方法,其特征在于,在将所述概率最高的候选词元序列所构成的语句确定为所述待识别医疗文本的意图语句之后,还包括:

7.如权利要求1-6任一项所述的医疗文本意图识别方法,其特征在于,所述待识别医疗文本为用户请求医疗业务时所述输入的文本,在将所述概率最高的候选词元序列所构成的语句确定为所述待识别医疗文本的意图语句之后,还包括:

8.一种医疗文本意图识别装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的医疗文本意图识别方法。

...

【技术特征摘要】

1.一种医疗文本意图识别方法,其特征在于,包括:

2.如权利要求1所述的医疗文本意图识别方法,其特征在于,在加载语言模型之前,还包括:

3.如权利要求2所述的医疗文本意图识别方法,其特征在于,所述采用所述医疗文本数据集训练语言模型,包括:

4.如权利要求1所述的医疗文本意图识别方法,其特征在于,所述在所述语言模型输出当前时间步的多个候选词元时,通过预置的调用接口调用集束搜索算法搜索出在医疗字典树中的候选词元构成当前时间步的、概率最高的n个候选词元序列,包括:

5.如权利要求4所述的医疗文本意图识别方法,其特征在于,所述采用所述条件概率计算所述候选词元序列st的概率,包括:

6.如权利要求1所...

【专利技术属性】
技术研发人员:李响董哲张仁杰龚江波章宇超
申请(专利权)人:汤臣倍健股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1