一种基于问答库的信息检索方法、问答系统及计算设备技术方案

技术编号：35473721 阅读：23 留言：0更新日期：2022-11-05 16:20

本公开公开了一种基于问答库的信息检索方法、问答系统及计算设备，其中，问答库包含至少一个问题及各问题对应的至少一个答案，作为各问题的答案集合，基于问答库的信息检索方法包括：响应于用户查询，从问答库中确定召回的问题及召回问题对应的候选答案子集，作为召回的至少一个问答对，其中候选答案子集来自答案集合；将用户查询及至少一个问答对，输入预设匹配模型进行处理，以得到用户查询与各问答对的匹配度；以及按照匹配度对问答对进行排序，以作为检索结果。根据本公开的方案，能够显著提高问答的准确性和相关性，提高问答质量。提高问答质量。提高问答质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于问答库的信息检索方法、问答系统及计算设备

[0001]本公开涉及计算机网络
，尤其涉及基于问答库的信息检索方案。

技术介绍

[0002]为了克服传统搜索引擎的缺点，问答系统技术应运而生。问答系统能够准确地识别出用户自然语言所表达的查询语义意图，并为其匹配到最相关的答案，作为查询结果。以社区问答为例，越来越多的社区问答平台，为互联网用户提供了一个在线提问和解答的平台，来帮助人们快速获得日常或专业问题的高质量回答。
[0003]随着社区问答变得越来越受欢迎，平台当中存在的问题也逐渐浮现出来，其中一个就是回答的质量参差不齐，并且低质量的回答会极大地影响用户在平台上的体验；另外，自然语言问句表述的多样性，会造成相似问句难以匹配，相似问题下的最佳答案无法快速获取。
[0004]因此，如何快速有效地从问答资源中匹配出最接近且高质量的回答，是社区问答平台的关键问题。

技术实现思路

[0005]本公开提供了一种基于问答库的信息检索方法、问答系统及计算设备，以力图解决或者至少缓解上面存在的至少一个问题。
[0本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于问答库的信息检索方法，所述问答库包含至少一个问题及各问题对应的至少一个答案，作为各问题的答案集合，所述方法包括：响应于用户查询，从所述问答库中确定召回的问题及召回问题对应的候选答案子集，作为召回的至少一个问答对，其中所述候选答案子集来自所述答案集合；将所述用户查询及所述至少一个问答对，输入预设匹配模型进行处理，以得到所述用户查询与各所述问答对的匹配度；以及按照所述匹配度对所述问答对进行排序，以作为检索结果。2.如权利要求1所述的方法，还包括生成所述预设匹配模型的步骤：将用户查询、问题和答案作为训练数据，并基于预设任务，分别对训练数据进行标注，得到标注数据；构建用于生成预设匹配模型的训练模型，并设置模型的初始参数；将所述训练数据拼接后输入训练模型进行处理，以得到预测匹配度和预测类别；以及利用所述预测匹配度、预测类别和标注数据，计算损失值，并基于损失值调整所述训练模型的模型参数，直到训练结束，得到预设匹配模型。3.如权利要求2所述的方法，其中，所述训练模型包括语言表示模型、文本匹配组件和实体识别组件；以及当训练结束时，将训练好的语言表示模型和训练好的文本匹配组件，作为预设匹配模型。4.如权利要求3所述的方法，其中，所述将训练数据拼接后输入训练模型进行处理，以得到预测匹配度和预测类别的步骤包括：将所述训练数据输入语言表示模型进行处理，得到第一语义向量和第二语义向量；将所述第一语义向量输入文本匹配组件中进行处理，以输出预测匹配度；将所述第二语义向量输入实体识别组件中进行处理，以输出预测类别。5.如权利要求1
‑
4中任一项所述的方法，还包括步骤：针对所述问答库中的各问题，分别选取出与所述问题的匹配度高的至少一个答案，作为所述问题的候选答案子集。6.如权利要求5所述的方法，其中...

【专利技术属性】
技术研发人员：吴锡坤，战立涛，杨雷，
申请(专利权)人：车智互联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人