一种生成式认知模型阅读理解能力提升方法和优化系统技术方案

技术编号：40502150 阅读：8 留言：0更新日期：2024-02-26 19:30

本发明专利技术公开了一种生成式认知模型阅读理解能力提升方法和优化系统，主要包括如下步骤：选择生成式认知模型；构建指令微调数据；基于指令微调数据对生成式认知模型进行微调；对微调完成的所述生成式认知模型进行评估并迭代优化。经本申请提升优化后的生成式认知模型在处理阅读理解任务时，具备强大的自然语言处理能力，能够有效提高阅读理解能力，更准确地理解自然语言中的文本含义、结构化上下文、推断隐含信息以及作出准确的回答，以及处理各种复杂的自然语言任务。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模型优化，更具体的说是涉及一种生成式认知模型阅读理解能力提升方法和优化系统。

技术介绍

1、阅读理解能力在很多场景中都有广泛的应用。比如，问答系统和智能客服系统需要处理用户的提问，并进行准确的回答。

2、目前，gpt类模型因能处理更加复杂的问题，以及更自然、更灵活的进行回答而得到广泛应用。

3、但是，当前认知模型在阅读理解方面仍存在一些问题，如答非所问或依赖上下文的情况不明确，使得实际应用效果大大降低，同时也限制了其在不同领域的应用范围。

4、另外，在在处理结构化上下文时，认知模型也存在一些困难，如无法识别关键数据、理解过程不清晰等问题。

5、因此，如何克服上述缺点，提升认知模型阅读理解能力是本领域技术人员亟需解决的问题。

技术实现思路

1、有鉴于此，本专利技术提供了一种生成式认知模型阅读理解能力提升方法和优化系统，目的在于提升生成式认知模型的阅读理解能力，更好地理解自然语言中的文本含义、推断隐含信息以及作出准确的回答。

2、为了实现上述目的，本专利技术采用如下技术方案：

3、一方面，本专利技术公开了一种生成式认知模型阅读理解能力提升方法，包括以下步骤：

4、选择生成式认知模型；

5、构建指令微调数据；

6、基于指令微调数据对生成式认知模型进行微调；

7、对微调完成的所述生成式认知模型进行评估并迭代优化。

8、作为优选，根据目标任务特点、

9、作为优选，通过增加输入数据的多样化，增加难例，引入常见语言错误，以及没有正确答案的样本，构建所述指令微调数据。

10、作为优选，微调过程包括基于多任务学习和渐进式学习对所述生成式认知模型的特定层和超参数进行调整。

11、作为优选，通过文档集合、对话数据集合、表格和各自对应的问题集合对训练完成的所述生成式认知模型进行评估，根据评估结果对微调完成的所述生成式认知模型进行调整再训练。

12、作为优选，通过扩充训练集，引入新的数据集和任务，以及收集用户反馈和评价，对所述生成式认知模型进行迭代优化。

13、另一方面，本专利技术公开了一种生成式认知模型阅读理解能力提升优化系统，包括，

14、指令微调数据库，存储有指令微调数据，并实时/定期进行更新；

15、模型微调模块，用于基于所述指令微调数据库对生成式认知模型进行微调；

16、模型评估模块，用于通过文档集合、对话数据集合、表格和各自对应的问题集合对训练完成的所述生成式认知模型进行评估，并根据评估结果对所述生成式认知模型进行调整再训练。

17、作为优选，还包括迭代优化模块，用于通过扩充训练集，引入新的数据集和任务，以及收集用户反馈和评价，对训练完成的所述生成式认知模型进行迭代优化。

18、经由上述的技术方案可知，本专利技术公开提供了一种生成式认知模型阅读理解能力提升方法和优化系统，与现有技术相比，

19、经本申请提升优化后的生成式认知模型在处理阅读理解任务时，具备强大的自然语言处理能力，能够有效提高阅读理解能力，更准确地理解自然语言中的文本含义、结构化上下文、推断隐含信息以及作出准确的回答，以及处理各种复杂的自然语言任务，如文本分类、语言生成、情感分析、文档问答等。

20、同时，本专利技术可通过个性化设定指令微调数据和评估迭代过程，进一步扩展认知模型的应用范围，使其能够更好地应用在不同的领域。

21、本专利技术的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

22、下面通过附图和实施例，对本专利技术的技术方案做进一步的详细描述。

本文档来自技高网...

【技术保护点】

1.一种生成式认知模型阅读理解能力提升方法，其特征在于，包括，

2.根据权利要求1所述的一种生成式认知模型阅读理解能力提升方法，其特征在于，根据目标任务特点、模型规模、性能特点以及预训练因素选择生成式认知模型。

3.根据权利要求1所述的一种生成式认知模型阅读理解能力提升方法，其特征在于，通过增加输入数据的多样化，增加难例，引入常见语言错误，以及没有正确答案的样本，构建所述指令微调数据。

4.根据权利要求1所述的一种生成式认知模型阅读理解能力提升方法，其特征在于，微调过程包括基于多任务学习和渐进式学习对所述生成式认知模型的特定层和超参数进行调整。

5.根据权利要求1所述的一种生成式认知模型阅读理解能力提升方法，其特征在于，通过文档集合、对话数据集合、表格和各自对应的问题集合对训练完成的所述生成式认知模型进行评估，根据评估结果对微调完成的所述生成式认知模型进行调整再训练。

6.根据权利要求1所述的一种生成式认知模型阅读理解能力提升方法，其特征在于，通过扩充训练集，引入新的数据集和任务，以及收集用户反馈和评价，对所述生成式认知模型进行迭代优化。

7.一种生成式认知模型阅读理解能力提升优化系统，其特征在于，包括，

8.根据权利要求7所述的一种生成式认知模型阅读理解能力提升优化系统，其特征在于，还包括迭代优化模块，用于通过扩充训练集，引入新的数据集和任务，以及收集用户反馈和评价，对训练完成的所述生成式认知模型进行迭代优化。

...

【技术特征摘要】

1.一种生成式认知模型阅读理解能力提升方法，其特征在于，包括，

5.根据权利要求1所述的一种生成式认知模型阅读理解能力提升...

【专利技术属性】
技术研发人员：李健，苏江，
申请(专利权)人：暗物质北京智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人