基于数据处理的答案确定方法、装置、终端及存储介质制造方法及图纸

技术编号:20622531 阅读:29 留言:0更新日期:2019-03-20 14:24
本发明专利技术实施例公开了一种基于数据处理的答案确定方法、装置、终端及存储介质。其中,方法包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合;调用预设的生成模型确定出所述初始问题对应的生成答案集合;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。本发明专利技术实施例可以更好地确定目标答案,避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。

Answer determination method, device, terminal and storage medium based on data processing

The embodiment of the present invention discloses an answer determination method, device, terminal and storage medium based on data processing. Among them, the method includes: obtaining the initial question input by the user, and calling the presupposed retrieval model to determine the set of candidate answers corresponding to the initial question from the presupposed knowledge base; calling the presupposed generation model to determine the set of generated answers corresponding to the initial question; calculating the candidate answers in the set of candidate answers according to the presupposed calculation rules and the initial answer set respectively. The candidate matching degree between the initial questions is used to obtain at least one candidate matching degree and obtain the first average value of the at least one candidate matching degree. According to the preset determination rule, the target answer to be output is determined from the set of candidate answers or the set of generated answers according to the first average value. The embodiment of the invention can better determine the target answer, avoid the long tail problem of the target answer and ensure the consistency and rationality of the target answer.

【技术实现步骤摘要】
基于数据处理的答案确定方法、装置、终端及存储介质
本专利技术涉及计算机
,尤其涉及基于数据处理的答案确定方法、装置、终端及存储介质。
技术介绍
人机交互(Human–ComputerInteraction,HCI)是指人与计算机之间使用某种对话语言,以一定的交互方式确定人与计算机之间的信息交换过程。随着人机交互技术的发展,越来越多的基于人机交互技术的智能产品应运而生,例如聊天机器人等。这些智能产品可以和用户进行聊天交流,并根据用户的问题生成相应的回答信息。但是,目前智能产品根据用户的问题所检索到的回答信息通常存在长尾问题(即小众问题),或者难以保证回答信息的一致性和合理性。因此,如何更好地根据用户的问题确定目标答案成为了研究热点。
技术实现思路
本专利技术实施例提供了一种基于数据处理的答案确定方法、装置、终端及计算机可读存储介质,可以更好地确定目标答案,避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。一方面,本专利技术实施例提供了一种基于数据处理的答案确定方法,该基于数据处理的答案确定方法包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。另一方面,本专利技术实施例提供了一种基于数据处理的答案确定装置,该基于数据处理的答案确定装置包括:获取单元,用于获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;所述获取单元,用于调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;计算单元,用于按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;确定单元,用于按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。再一方面,本专利技术实施例提供了一种终端,该终端包括输入设备、输出设备、存储器以及处理器,所述处理器、所述输入设备、所述输出设备和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如下步骤:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。再一方面,本专利技术实施例提供了一种计算机可读存储介质,该计算机存储介质存储有计算机程序。该计算机程序包括至少一条程序指令,该至少一条程序指令可由一处理器加载,并用于执行如下步骤:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。在本专利技术实施例中,在获取到用户输入的初始问题之后,可以调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合,以及调用预设的生成模型确定出初始问题对应的生成答案集合。然后分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取至少一个候选匹配度的第一平均值。最后可以根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。本专利技术实施例调用检索模型和生成模型来确定目标答案,可以避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。并且根据第一平均值来确定是从候选答案集合还是从生成答案集合中确定目标答案,可以规避检索模型误检索的情况,从而提高准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍。图1是本专利技术实施例提供的一种基于数据处理的答案确定方法的流程示意图;图2是本专利技术另一实施例提供的一种基于数据处理的答案确定方法的流程示意图;图3a是本专利技术实施例提供的一种基于数据处理的答案确定方法的应用场景图;图3b是本专利技术实施例提供的一种基于数据处理的答案确定方法的应用场景图;图4是本专利技术实施例提供的一种基于数据处理的答案确定装置的结构示意图;图5是本专利技术实施例提供的一种终端的结构示意图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。本专利技术实施例提出了一种基于数据处理的答案确定方法,该基于数据处理的答案确定方法可以运用在终端与用户的聊天对话中,此处的终端可以包括但不限于:智能手机、膝上计算机、平板电脑、台式计算机等智能设备,以及基于聊天对话的聊天设备,例如聊天机器人等等。具体的,终端在和用户进行聊天对话的过程中,可以在用户界面获取用户输入的初始问题,然后调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合,以及调用预设的生成模型确定出初始问题对应的生成答案集合。并按照预设的计算规则分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取至少一个候选匹配度的第一平均值。最后可以按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。在确定出目标答案之后,可以在用户界面中输出该目标答案,以实现和用户的聊天对话。请参见图1,是本专利技术实施例提供的一种基于数据处理的答案本文档来自技高网...

【技术保护点】
1.一种基于数据处理的答案确定方法,其特征在于,包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。

【技术特征摘要】
1.一种基于数据处理的答案确定方法,其特征在于,包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。2.如权利要求1所述的方法,其特征在于,所述按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案,包括:判断所述第一平均值是否大于预设阈值;若所述第一平均值大于所述预设阈值,则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案;若所述第一平均值不大于所述预设阈值,则从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案,所述生成匹配度为所述生成答案集合中的生成答案与所述初始问题之间的匹配度。3.如权利要求1所述的方法,其特征在于,所述按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案,包括:分别计算所述生成答案集合中的各生成答案与所述初始问题之间的生成匹配度,以得到至少一个生成匹配度,并求取所述至少一个生成匹配度的第二平均值;若所述第一平均值大于所述第二平均值,则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案;若所述第一平均值小于所述第二平均值,则从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案;若所述第一平均值等于所述第二平均值,则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案,或者从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案。4.如权利要求1-3任一项所述的方法,其特征在于,所述调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,包括:针对所述初始问题,调用预设的检索模型在所述预设知识库中进行查询处理,以确定至少一个目标问题,所述目标问题中的至少一个目标单词与所述初始问题中的至少一个初始单词相匹配;分别计算所述至少一个目标问题与所述初始问题之间的相似度,并确定相似度最高的目标问题;从所述预设知识库中获取所述相似度最高的目标问题所对应的至少一个答案,并根据所述至少一个答案确定出候选答案集合。5.如权利要求1-3任一项所述的方法,其特...

【专利技术属性】
技术研发人员:毕野黄博吴振宇王建明肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1