The embodiment of the present invention discloses an answer determination method, device, terminal and storage medium based on data processing. Among them, the method includes: obtaining the initial question input by the user, and calling the presupposed retrieval model to determine the set of candidate answers corresponding to the initial question from the presupposed knowledge base; calling the presupposed generation model to determine the set of generated answers corresponding to the initial question; calculating the candidate answers in the set of candidate answers according to the presupposed calculation rules and the initial answer set respectively. The candidate matching degree between the initial questions is used to obtain at least one candidate matching degree and obtain the first average value of the at least one candidate matching degree. According to the preset determination rule, the target answer to be output is determined from the set of candidate answers or the set of generated answers according to the first average value. The embodiment of the invention can better determine the target answer, avoid the long tail problem of the target answer and ensure the consistency and rationality of the target answer.
【技术实现步骤摘要】
基于数据处理的答案确定方法、装置、终端及存储介质
本专利技术涉及计算机
,尤其涉及基于数据处理的答案确定方法、装置、终端及存储介质。
技术介绍
人机交互(Human–ComputerInteraction,HCI)是指人与计算机之间使用某种对话语言,以一定的交互方式确定人与计算机之间的信息交换过程。随着人机交互技术的发展,越来越多的基于人机交互技术的智能产品应运而生,例如聊天机器人等。这些智能产品可以和用户进行聊天交流,并根据用户的问题生成相应的回答信息。但是,目前智能产品根据用户的问题所检索到的回答信息通常存在长尾问题(即小众问题),或者难以保证回答信息的一致性和合理性。因此,如何更好地根据用户的问题确定目标答案成为了研究热点。
技术实现思路
本专利技术实施例提供了一种基于数据处理的答案确定方法、装置、终端及计算机可读存储介质,可以更好地确定目标答案,避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。一方面,本专利技术实施例提供了一种基于数据处理的答案确定方法,该基于数据处理的答案确定方法包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以 ...
【技术保护点】
1.一种基于数据处理的答案确定方法,其特征在于,包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。
【技术特征摘要】
1.一种基于数据处理的答案确定方法,其特征在于,包括:获取用户输入的初始问题,并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案,所述候选答案集合中包括至少一个候选答案;调用预设的生成模型确定出所述初始问题对应的生成答案集合,所述生成答案集合中包括至少一个生成答案,所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的;按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度,以得到至少一个候选匹配度,并求取所述至少一个候选匹配度的第一平均值;按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。2.如权利要求1所述的方法,其特征在于,所述按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案,包括:判断所述第一平均值是否大于预设阈值;若所述第一平均值大于所述预设阈值,则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案;若所述第一平均值不大于所述预设阈值,则从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案,所述生成匹配度为所述生成答案集合中的生成答案与所述初始问题之间的匹配度。3.如权利要求1所述的方法,其特征在于,所述按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案,包括:分别计算所述生成答案集合中的各生成答案与所述初始问题之间的生成匹配度,以得到至少一个生成匹配度,并求取所述至少一个生成匹配度的第二平均值;若所述第一平均值大于所述第二平均值,则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案;若所述第一平均值小于所述第二平均值,则从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案;若所述第一平均值等于所述第二平均值,则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案,或者从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案。4.如权利要求1-3任一项所述的方法,其特征在于,所述调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合,包括:针对所述初始问题,调用预设的检索模型在所述预设知识库中进行查询处理,以确定至少一个目标问题,所述目标问题中的至少一个目标单词与所述初始问题中的至少一个初始单词相匹配;分别计算所述至少一个目标问题与所述初始问题之间的相似度,并确定相似度最高的目标问题;从所述预设知识库中获取所述相似度最高的目标问题所对应的至少一个答案,并根据所述至少一个答案确定出候选答案集合。5.如权利要求1-3任一项所述的方法,其特...
【专利技术属性】
技术研发人员:毕野,黄博,吴振宇,王建明,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。