一种基于对齐思维链的理科解答方法及系统技术方案

技术编号:44034773 阅读:34 留言:0更新日期:2025-01-15 01:14
本发明专利技术公开了一种基于对齐思维链的理科解答方法及系统,包括如下步骤:向已知LLM输入理科问题,在零样本训练条件下,生成自然语言推理步骤,以识别其自然语言推理步骤原生风格作为本地样式;根据本地样式编写少样本提示示例,少样本提示示例包括问题,推理步骤和答案;根据本地样式修改少样本提示示例的格式和推理步骤,使其与本地样式对齐;基于少样本提示示例对提示示例检索器进行优化,获得优化后的提示示例检索器;将新的理科问题输入至优化后的提示示例检索器,结合LLM推理路径进行解答,生成答案。本发明专利技术通过对齐语言模型的原生风格,统一推理步骤格式,增强检索方法,减少了人工工作量,显著改进了现有理科题目解答系统的性能和可靠性。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,特别涉及一种基于对齐思维链的理科解答方法及系统


技术介绍

1、随着语言模型中的计算量和数据量的不断增长,一个问题是当模型变得很大时,独特的能力就会出现。例如上下文学习(icl)的能力,即根据给定的少数例子来解决相应的任务,是语言模型在扩展到一定规模时特别擅长的东西。一些研究人员发现,大型模型在多步推理任务(这被认为是突发能力的表现)中明显优于小型模型,而大型模型在情绪分类等任务上表现出的表现收益非常有限。此外,在多步骤推理中,少量提示方法开始优于全训练集微调,即使在相同的大型模型上。这些特征使得多步骤的推理任务,如数学问题解决和常识性推理吸引了研究人员的大量关注。这项工作通过展示cot文本风格在大型语言模型中的关键作用,向多步骤推理迈出了重要的一步。

2、现有理科题目解答系统通常依赖于大规模语言模型(llms),使用链式思维(chain-of-thought,cot)技术来增强推理能力。这些系统主要通过以下方法实现:

3、链式思维(chain-of-thought,cot)提示:这种方法通过在提示中加入本文档来自技高网...

【技术保护点】

1.一种基于对齐思维链的理科解答方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于对齐思维链的理科解答方法,其特征在于,所述优化后的提示示例检索器用于选择与所述新的理科问题相似度最高的提示示例进行提示。

3.根据权利要求1所述的基于对齐思维链的理科解答方法,其特征在于,所述LLM推理路径的获取步骤包括:

4.根据权利要求1所述的基于对齐思维链的理科解答方法,其特征在于,所述S3中对齐步骤包括:

5.一种基于对齐思维链的理科解答系统,其特征在于,包括:零样本原生风格探测模块、少样本提示示例生成模块、推理步骤格式统一模块、检索增强模...

【技术特征摘要】

1.一种基于对齐思维链的理科解答方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于对齐思维链的理科解答方法,其特征在于,所述优化后的提示示例检索器用于选择与所述新的理科问题相似度最高的提示示例进行提示。

3.根据权利要求1所述的基于对齐思维链的理科解答方法,其特征在于,所述llm推理路径的获取步骤包括:

4.根据权利要求1所述的基于对齐思维链的理科解答方法,其特征在于,所述s3中对齐步骤包括:

5.一种基于对齐思维链的理科解答系统,其特征在于,包括:零样本原生风格探测模块、少样本提示示例生成模块、推理步骤格式统一模块、检索增强模块和系统集成模块;其中,

6.根据权利要求5所述的基于对齐思维链的理科解答系统,其特征在于,所述优化后的提示示例检索器用于选择与所述新的理科问...

【专利技术属性】
技术研发人员:柴佳睿杨志成梁小丹任鹏真陈崇雨
申请(专利权)人:立心通智科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1