智能问答方法、智能问答装置、设备及存储介质制造方法及图纸

技术编号:39004641 阅读:11 留言:0更新日期:2023-10-07 10:36
本发明专利技术实施例提供一种智能问答方法、装置、设备及存储介质。方法包括:获取目标文档以及目标问题;基于目标文档确定若干目标句子,并分别对每一目标句子以及目标问题进行特征提取操作,得到对应的若干第一特征向量以及第二特征向量;通过预设工具确定每一第一特征向量与第二特征向量的目标匹配度,并将目标匹配度大于预设阈值的第一特征向量确定为第三特征向量;将第三特征向量以及第二特征向量输入至目标深度学习模型,输出得到目标问题对应的目标答案。本申请实施例旨在通过预设工具以及目标深度学习模型对医疗文档进行处理,以实现基于医疗文档得到较为准确的问题的答案。基于医疗文档得到较为准确的问题的答案。基于医疗文档得到较为准确的问题的答案。

【技术实现步骤摘要】
智能问答方法、智能问答装置、设备及存储介质


[0001]本申请涉及数字医疗领域,尤其涉及一种智能问答方法、智能问答装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]在医疗领域中,对于医生而言,当遇到问题时可能需要从医疗文档中获得准确的答案,因此,研究如何让医生快速的从复杂的医疗文档中获得准确的知识或问题的答案具有重要的实际价值。
[0003]当前实现该目标的技术主要是通过问答系统来实现:一是基于知识库的问答,知识库即知识图谱,是以知识为主要单位,实体为主要载体,包含着现实生活中人们对万千事物的认知与各类事实的庞大数据库。然而其存在以下缺点:医疗文档需要转化成结构化的知识库或知识图谱的形式,因此严重依赖逻辑形式和解析算法的设计,进而导致医疗文档转换成本高昂、通用性差。
[0004]二是基于开放领域的问答,开放领域的问答技术可以减少将非结构化文档结构化为知识库的成本,但仍有一定局限性:一方面对于文档的格式上要求纯文本输入,而实际应用中,有大量的非纯文本的文档;另一方面,需要对领域知识进行微调,也即领域知识有增删,则需要对模型进行重新训练。

技术实现思路

[0005]本申请提供了一种智能问答方法、智能问答装置、计算机设备及计算机可读存储介质,旨在通过预设工具以及目标深度学习模型对医疗文档进行处理,以实现基于医疗文档得到较为准确的问题的答案。
[0006]为实现上述目的,本申请提供一种智能问答方法,所述方法包括:
[0007]获取目标文档以及目标问题;
[0008]基于所述目标文档确定若干目标句子,并分别对每一所述目标句子以及所述目标问题进行特征提取操作,得到对应的若干第一特征向量以及第二特征向量;
[0009]通过预设工具确定每一所述第一特征向量与所述第二特征向量的目标匹配度,并将所述目标匹配度大于预设阈值的第一特征向量确定为第三特征向量;
[0010]将所述第三特征向量以及所述第二特征向量输入至目标深度学习模型,输出得到所述目标问题对应的目标答案。
[0011]为实现上述目的,本申请还提供一种智能问答装置,包括:
[0012]获取模块,所述获取模块用于获取目标文档以及目标问题;
[0013]特征提取模块,所述特征提取模块用于基于所述目标文档确定若干目标句子,并分别对每一所述目标句子以及所述目标问题进行特征提取操作,得到对应的若干第一特征向量以及第二特征向量;
[0014]确定模块,所述确定模块用于通过预设工具确定每一所述第一特征向量与所述第
二特征向量的目标匹配度,并将所述目标匹配度大于预设阈值的第一特征向量确定为第三特征向量;
[0015]输出模块,所述输出模块用于将所述第三特征向量以及所述第二特征向量输入至目标深度学习模型,输出得到所述目标问题对应的目标答案。
[0016]此外,为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的智能问答方法的步骤。
[0017]此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的智能问答方法的步骤。
[0018]本申请实施例公开的智能问答方法、智能问答装置、计算机设备及计算机可读存储介质,能够获取目标文档以及目标问题,进而基于目标文档确定对应的若干目标句子,并对目标句子以及目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量。进一步的,可通过预设工具确定每一第一特征向量与第二特征向量的目标匹配度,并将目标匹配度大于预设阈值的第一特征向量确定为第三特征向量。如此,可将第三特征向量以及第二特征向量输入至目标深度学习模型,输出得到目标问题对应的目标答案。本申请提出的方法能够通过目标深度学习模型对目标文档以及目标问题进行分析,进而得到对应的目标答案,由于无需提前将目标文档进行大规模结构化,因此节省了相关的成本。此外,目标文档的增减对目标深度学习模型的影响较小,因此无需重新对模型进行训练,也即本申请提出的方法泛化性更强,提升了智能问答的效率。尤其是对于医疗文档相关的问答,能够实现基于医疗文档得到较为准确的问题的答案。
附图说明
[0019]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请实施例提供的一种智能问答方法的场景示意图;
[0021]图2是本申请实施例提供的一种智能问答方法的流程示意图;
[0022]图3是本申请实施例提供的一种得到目标答案的流程示意图;
[0023]图4是本申请实施例提供的一种得到目标深度学习模型的流程示意图;
[0024]图5是本申请实施例提供的一种得到迭代后的大语言模型的流程示意图;
[0025]图6是本申请实施例提供的一种智能问答装置的示意性框图;
[0026]图7是本申请实施例提供的一种计算机设备的示意性框图。
具体实施方式
[0027]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施
例,都属于本申请保护的范围。
[0028]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
[0029]在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0030]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0031]如图1所示,本申请实施例提供的智能问答方法,可以应用于如图1所示的应用环境中。该应用环境中包含有终端设备110和服务器120,其中,终端设备110可以通过网络与服务器120进行通信。具体地,服务器120能够获取目标文档以及目标问题;并基于所述目标文档确定若干目标句子,并分别对每一所述目标句子以及所述目标问题进行特征提取操作,得到对应的若干第一特征向量以及第二特征向量;进而通过预设工具确定每一所述第一特征向量与所述第二特征向量的目标匹配度,并将所述目标匹配度大于预设阈值的第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能问答方法,其特征在于,所述方法包括:获取目标文档以及目标问题;基于所述目标文档确定若干目标句子,并分别对每一所述目标句子以及所述目标问题进行特征提取操作,得到对应的若干第一特征向量以及第二特征向量;通过预设工具确定每一所述第一特征向量与所述第二特征向量的目标匹配度,并将所述目标匹配度大于预设阈值的第一特征向量确定为第三特征向量;将所述第三特征向量以及所述第二特征向量输入至目标深度学习模型,输出得到所述目标问题对应的目标答案。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标文档确定若干目标句子包括:对所述目标文档进行数据清洗操作,得到数据清洗后的目标文档;对数据清洗后的所述目标文档进行分词操作,得到若干所述目标句子,其中,所述数据清洗操作包括去除停用词操作、去除标点符号操作、去除特殊字符操作中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述分别对每一所述目标句子以及所述目标问题进行特征提取操作,得到对应的若干第一特征向量以及第二特征向量,包括:基于词频

逆文档频率模型或word2vec模型,对每一所述目标句子以及所述目标问题进行特征提取操作,得到若干所述第一特征向量以及所述第二特征向量。4.根据权利要求1所述的方法,其特征在于,所述预设工具包括Lang Chain,所述通过预设工具确定每一所述第一特征向量与所述第二特征向量的目标匹配度,包括:将每一所述第一特征向量与所述第二特征向量输入至所述Lang Chain进行分析,输出得到每一所述第一特征向量与所述第二特征向量的目标匹配度。5.根据权利要求1所述的方法,其特征在于,所述将所述第三特征向量以及所述第二特征向量输入至目标深度学习模型,输出得到所述目标问题对应的目标答案,包括:将所述第三特征向量以及所述第二特征向量输入至所述目标深度学习模型,得到若干初始答案;计算每一所述初始答案与所述目标问题的匹配度,得到若干匹配值;将所述匹配值最大的初始答案确定为所述目标答案。6.根据权利要求1所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:林桂
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1