【技术实现步骤摘要】
文档处理方法及装置
[0001]本申请涉及计算机
,特别涉及文档处理方法及装置、计算设备和计算机可读存储介质。
技术介绍
[0002]问答系统(Question Answering System,QA)是信息检索系统的一种高级形式,能准确地用自然语言回答用户用自然语言提出的问题,可以满足人们对快速、准确地获取信息的需求。
[0003]目前,问答系统会根据用户提出的问题检索出一定数量的文档,并对每篇文档都选出预测出的概率最高的答案,但这些文档中哪个文档中的答案更准确却无法很好的辨别,因为,每篇文档都是独立进行答案预测的,并且文档之间没有交互,所以文档之间答案的概率也没有可比性。
[0004]因此,如何解决上述问题,如何让更准确的答案对应的文档排在更靠前的位置就成为技术人员亟待解决的问题。
技术实现思路
[0005]有鉴于此,本申请实施例提供了文档处理方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0006]根据本申请实施例的第一方面,提供了一种文档处理
【技术保护点】
【技术特征摘要】
1.一种文档处理方法,其特征在于,包括:接收用户提交的目标问题;基于所述目标问题进行检索,获得所述目标问题对应的至少两篇第一文档;将所述至少两篇第一文档中的第一答案信息进行拼接,生成第二文档;针对所述目标问题对所述第二文档进行答案预测,确定所述目标问题对应的至少两个目标答案以及所述至少两个目标答案对应的目标答案概率;根据所述目标答案概率对所述至少两个目标答案所属的至少两篇目标文档进行排序。2.根据权利要求1所述的文档处理方法,其特征在于,所述将所述至少两篇第一文档中的第一答案信息进行拼接之前,还包括:基于所述目标问题分别对所述至少两篇第一文档进行答案预测,获得每篇第一文档中第一预设数量的第一答案以及所述第一答案对应的第一答案概率;根据所述第一答案概率,在所述每篇第一文档中确定所述第一答案信息。3.根据权利要求1所述的文档处理方法,其特征在于,所述将所述至少两篇第一文档中的第一答案信息进行拼接之前,还包括:将所述目标问题以及每篇第一文档组成问题文档对;将所述问题文档对输入问答模型进行答案预测,获得每篇第一文档中第一预设数量的第一答案以及所述第一答案对应的第一答案概率;根据所述第一答案概率,确定所述每篇第一文档中的目标第一答案;基于所述目标第一答案以及所述目标第一答案所属的第一文档,在所述每篇第一文档中确定所述第一答案信息。4.根据权利要求3所述的文档处理方法,其特征在于,所述基于所述目标第一答案以及所述目标第一答案所属的第一文档,在所述每篇第一文档中确定所述第一答案信息,包括:在所述每篇第一文档中抽取所述目标第一答案所属的第一语句,以及所述第一语句之前的第二语句、以及所述第一语句之后的第三语句;将所述第一语句、所述第二语句以及所述第三语句,确定为所述每篇第一文档中的所述第一答案信息。5.根据权利要求1所述的文档处理方法,其特征在于,根据所述目标答案概率对所述至少两个目标答案所属的至少两篇目标文档进行排序,包括:将所述至少两个目标答案按照所述目标答案概率从大到小的顺序进行排序;按照排序结果依次确定每个目标答案所属的目标文档,并记录所述所属的目标文档的文档标识;将所述至少两篇目标文档按照所述文档标识的先后顺序进行排序。6.根据权利要求5所述的文档处理方法,其特征在于,所述根据所述目标答案概率对所述至少两个目标答案所属的至少两篇目标文档进行排序之后,...
【专利技术属性】
技术研发人员:姬子明,李长亮,李小龙,
申请(专利权)人:北京金山数字娱乐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。