【技术实现步骤摘要】
医学领域意图识别方法、装置、设备及存储介质
本专利技术涉及医疗数据领域,尤其涉及一种医学领域意图识别方法、装置、设备及存储介质。
技术介绍
意图识别是智能问答的重要组成部分,即通过分类的方法将用户的问题分到相应的医学意图种类。简单来说意图就是用户的意愿,即用户想要做什么,根据用户表达所涉及的领域和意图将其分类到先前定义好的意图类别中。意图识别的精准性关系到语义槽填充的性能并且有助于后续智能问答的研究。现有方案主要是通过分法算法进行特征提取,需要对预料文本进行关键特征抽取,提取得到字符、词语等意图特征,常用的算法有朴素贝叶斯、支持向量机和逻辑回归等。但是,在医疗问答中医学领域用户的表达不规范、描述较短,且具有一定的歧义性,很难获取较丰富的意图特征,导致对用户的医疗意图识别结果不准确。
技术实现思路
本专利技术提供了一种医学领域意图识别方法、装置、设备及存储介质,用于精准识别用户咨询的医学领域意图,提高了医学领域意图识别结果的准确度。本专利技术实施例的第一方面提供一种医学领域意图识别方 ...
【技术保护点】
1.一种医学领域意图识别方法,其特征在于,包括:/n获取初始文本数据,所述初始文本数据包括目标用户输入的问题句子和/或问题词语;/n调用预置的联合模型对所述初始文本数据进行改写,生成目标问题语句,所述目标问题语句为语义明确且无冗余的句子;/n基于预置的医学专有特征词库对所述目标问题语句进行特征提取,得到多个目标特征、多个目标特征权重和多个目标结构化信息;/n调用预置的深度学习模型、所述多个目标特征权重和所述多个目标结构化信息对所述多个目标特征进行分类,得到分类结果,并根据所述分类结果确定所述目标用户的医学领域意图。/n
【技术特征摘要】
1.一种医学领域意图识别方法,其特征在于,包括:
获取初始文本数据,所述初始文本数据包括目标用户输入的问题句子和/或问题词语;
调用预置的联合模型对所述初始文本数据进行改写,生成目标问题语句,所述目标问题语句为语义明确且无冗余的句子;
基于预置的医学专有特征词库对所述目标问题语句进行特征提取,得到多个目标特征、多个目标特征权重和多个目标结构化信息;
调用预置的深度学习模型、所述多个目标特征权重和所述多个目标结构化信息对所述多个目标特征进行分类,得到分类结果,并根据所述分类结果确定所述目标用户的医学领域意图。
2.根据权利要求1所述的医学领域意图识别方法,其特征在于,所述调用预置的联合模型对所述初始文本数据进行改写,生成目标问题语句,所述目标问题语句为语义明确且无冗余的句子,包括:
调用预置的联合模型对所述初始文本数据进行实体抽取并进行归一化处理,得到多个标准实体;
在预置的医学领域知识图谱中查找每个标准实体对应的属性信息,得到多个标准属性信息,每个标准属性信息对应一个不同的标准实体;
根据所述多个标准属性信息和所述多个标准实体对所述初始文本数据进行信息补全,生成多个候选问题语句,并将所述多个候选问题语句发送至终端;
根据所述终端反馈的指令确定目标问题语句,所述目标问题语句为语义明确且无冗余的句子。
3.根据权利要求2所述的医学领域意图识别方法,其特征在于,所述调用预置的联合模型对所述初始文本数据进行实体抽取并进行归一化处理,得到多个标准实体,包括:
调用预置的联合模型对所述初始文本数据进行实体抽取,得到多个初始实体;
调用预置的归一知识库对所述多个初始实体进行归一化处理,得到多个标准实体。
4.根据权利要求3所述的医学领域意图识别方法,其特征在于,所述根据所述多个标准属性信息和所述多个标准实体对所述初始文本数据进行信息补全,生成多个候选问题语句,并将所述多个候选问题语句发送至终端,包括:
将所述初始文本数据与预置句式模板进行匹配,得到目标句式模板;
按照所述目标句式模板对所述初始文本数据的句式进行调整,得到初始语句;
将所述初始语句中的多个初始实体替换为对应的多个标准实体,生成中间语句;
根据所述多个标准属性信息对所述中间语句进行补全,生成多个候选问题语句;
将所述多个候选问题语句发送至终端。
5.根据权利要求1所述的医学领域意图识别方法,其特征在于,所述基于预置的医学专有特征词库对所述目标问题语句进行特征提取,得到多个目标特征、多...
【专利技术属性】
技术研发人员:贾声声,
申请(专利权)人:康键信息技术深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。