问答模型检索优化方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：41217168 阅读：3 留言：0更新日期：2024-05-09 23:38

本发明专利技术实施例公开了问答模型检索优化方法、装置、计算机设备及存储介质。所述方法包括：确定大语言模型；构建行业基础语料库；对所述行业基础语料库进行数据调整，以得到微调训练数据集；利用所述微调训练数据集对所述大语言模型进行微调，以得到优化后的模型；利用优化后的模型更换已有的问答模型中的关键词提取结构，以优化问答模型。通过实施本发明专利技术实施例的方法可实现对问答模型的优化，以提升问答模型的检索效果，提高关键词提取的准确性和效率，减少传统行业检索引擎维护庞大语料库的成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及问答检索方法，更具体地说是指问答模型检索优化方法、装置、计算机设备及存储介质。

技术介绍

1、在电力行业领域中，一般设有问答机器人进行电力行业的行业知识的检索等，目前的问答模型的检索技术，如短语匹配、语义分析等技术，均以关键词的匹配特征、统计特征等为基础，通过关键词对用户的查询意图进行理解，提供符合需求的搜索结果。为保证检索效果，构建和维护了庞大的语料库，通过关键词技术进行意图理解与检索，这对于行业检索引擎即问答模型的开发和维护来说是一项昂贵且耗时的工作。而且，关键词技术本身在提取关键信息方面的准确度和效率也有限，简单的统计特征难以实现语言的精准理解。

2、近年来，问答模型从统计语言模型发展到神经语言模型，通过在大规模语料库上预训练transformer模型构建的大语言模型，在解决各种自然语言处理任务方面显示出了强大的能力，尤其是在语义理解、文本生成等方面，因此，使用大语言模型进行搜索引擎的改造变成了当前下的热点研究方向。综上所述，现有的问答模型直接使用大语言模型作为检索中枢，直接对用户的提问进行理解和回答，这种方式需要海量的数据、大量的算力供大语言模型进行微调学习，且需要对原有的业务流程和交互进行重新设计，改造难度较高成本巨大，另外，可能由于行业知识学习不充分等问题，产生模型幻想现象，给出虚假的回答，检索结果的可用性难以把控。

3、因此，有必要设计一种新的方法，实现对问答模型的优化，以提升问答模型的检索效果，提高关键词提取的准确性和效率，减少传统行业检索引擎维护庞大语料库的成本。

<...

【技术保护点】

1.问答模型检索优化方法，其特征在于，包括：

2.根据权利要求1所述的问答模型检索优化方法，其特征在于，所述确定大语言模型，包括：

3.根据权利要求1所述的问答模型检索优化方法，其特征在于，所述构建行业基础语料库，包括：

4.根据权利要求所1述的问答模型检索优化方法，其特征在于，所述对所述行业基础语料库进行数据调整，以得到微调训练数据集，包括：

5.根据权利要求4所述的问答模型检索优化方法，其特征在于，所述利用所述大语言模型对所述行业基础数据库生成语料，以得到第一生成结果，包括：

6.根据权利要求4所述的问答模型检索优化方法，其特征在于，所述对所述行业基础数据库中的第二构建结果生成语料，以得到第二生成结果，包括：

7.根据权利要求1所述的问答模型检索优化方法，其特征在于，所述利用所述微调训练数据集对所述大语言模型进行微调，以得到优化后的模型，包括：

8.问答模型检索优化装置，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程

10.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。

...

【技术特征摘要】

1.问答模型检索优化方法，其特征在于，包括：

2.根据权利要求1所述的问答模型检索优化方法，其特征在于，所述确定大语言模型，包括：

3.根据权利要求1所述的问答模型检索优化方法，其特征在于，所述构建行业基础语料库，包括：

4.根据权利要求所1述的问答模型检索优化方法，其特征在于，所述对所述行业基础语料库进行数据调整，以得到微调训练数据集，包括：

5.根据权利要求4所述的问答模型检索优化方法，其特征在于，所述利用所述大语言模型对所述行业基础数据库生成语料，以得到第一生成结果，包括：

6.根据权利要求4所述的问答模型检索优化方法，其特征在于，所...

【专利技术属性】
技术研发人员：周颖婕，豆泽阳，庞磊，蒋阳，
申请(专利权)人：传申弘安智能深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人