用于长文本的语义检索及问答处理方法、装置及电子设备制造方法及图纸

技术编号：36425803 阅读：16 留言：0更新日期：2023-01-20 22:35

本发明专利技术公开了一种用于长文本的语义检索及问答处理方法、装置及电子设备，提出结合文本分割、语义检索、重排序、问答推理多个环节的长文本检索综合处理方案，各个环节适配小样本场景，将对比学习的训练思想应用到语义检索与重排序任务中，获得符合期待的语义检索效果，且进一步将微调策略与分类机制相融合完成问答推理任务，从而可基于在先的语义检索及重排序给出的关键文本进行推理解答并输出该佐证线索。本发明专利技术无需依赖大批量标注数据，通过前述多环节能够提升搜索引擎对于篇章级长文本的检索性能，并在小样本条件下充分发挥预训练模型的泛化推理效果，进而有效解决了目前长文本检索的语义理解及推理能力不足的问题。本检索的语义理解及推理能力不足的问题。本检索的语义理解及推理能力不足的问题。

全部详细技术资料下载

【技术实现步骤摘要】
用于长文本的语义检索及问答处理方法、装置及电子设备

[0001]本专利技术涉及自然语言处理
，尤其涉及一种用于长文本的语义检索及问答处理方法、装置及电子设备。

技术介绍

[0002]目前在处理长文本，尤其是针对篇章级长文本(例如但不限于新闻、工作报告、学术论文、书籍等)的检索任务时，搜索引擎的核心技术路线是通过输入的查询文本(query)，从长文本(document)中返回与查询条件高度相关的目标文档。
[0003]当前，主流的搜索引擎大多会使用如下检索策略：
[0004](1)基于关键词匹配的检索策略，通过计算query与document之间的词语重叠情况来获得检索结果，然而，基于关键词的检索方法无法解决词语语义一致但表述不一致的问题(即，难以处理不存在词语重叠的检索任务)。
[0005](2)基于语义关联的检索策略，为克服上述关键词匹配的弊端，继而实现有效检索，业界普遍认为检索引擎应理解query和document的语义，由此形成有如下语义检索算法：基于语言模型的语义检索、基于语义向量的快速语义检索、基于对比学习的语义检索。
[0006]本专利技术针对后者策略，也即是基于语义关联的检索策略在篇章级长文本中进行检索的实际应用情况进行了分析，发现其中至少存在如下缺陷：
[0007]在实际操作中，现有策略并不能充分发挥上述算法框架的性能，进而产生语义理解能力不足的情况；再者，由于训练集、测试集规模很大，且无法直接对查询问题进行推理，导致对查询结果的推力能力产生局限；此外，现...

【技术保护点】

【技术特征摘要】
1.一种用于长文本的语义检索及问答处理方法，其特征在于，包括：按不同的粒度对长文本进行分割，且对应于分割文本的粒度，结合查询文本进行分阶段检索；其中，所述分阶段检索采用基于对比学习的检索模型；利用重排序模型将分阶段检索的最终输出结果进行排序，得到对应于查询文本的关键文本；将所述查询文本与所述关键文本结合，并利用问答推理模型得到对应所述查询文本所提问题的最终答案。2.根据权利要求1所述的用于长文本的语义检索及问答处理方法，其特征在于，所述检索模型的训练方式包括以预设的语言模型为基础，在长文本数据库上重新进行预训练。3.根据权利要求2所述的用于长文本的语义检索及问答处理方法，其特征在于，所述检索模型的训练方式还包括：在每一轮针对检索模型训练进行负样本构造的过程中，挖掘排名靠前的语义相关的负样本作为下一轮优化所用的样本。4.根据权利要求3所述的用于长文本的语义检索及问答处理方法，其特征在于，所述挖掘排名靠前的语义相关的负样本作为下一轮优化所用的样本包括：利用由简单负样本数据训练出的检索模型为每个查询文本重新检索困难负样本，并基于困难负样本数据重新训练并得到最终的检索模型。5.根据权利要求1所述的用于长文本的语义检索及问答处理方法，其特征在于，所述重排序模型的训练方式包括：基于预设的局部对比损失函数，将一组查询文本在训练数据上进行局部对比增强处理。6.根据权利要求1所述的用于长文本的语义检索及问答处理方法，其特征在于，所述分阶段检索包括：将长文本分割为多...

【专利技术属性】
技术研发人员：刁永祥，张浩宇，洪帅，吴飞，方四安，
申请(专利权)人：合肥讯飞数码科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人