【技术实现步骤摘要】
本专利技术属于人工智能,涉及一种基于动态rag与多语言llm协作的评测数据自动生成方法。
技术介绍
1、传统的大模型评测数据生成依赖人工编写,耗时耗力,难以满足大规模、个性化的需求。随着大语言模型的发展,自动生成评测数据成为可能。然而,单纯依赖llm生成的题目可能存在准确性不足、缺乏上下文关联等问题。
2、传统的评测题目生成主要依赖人工方式或基于规则的自动化方法,主要存在以下缺点:
3、人工生成效率低、成本高,评测专家需要花费大量时间精力撰写题目、设计选项并校验答案的准确性,这在大规模业务场景中显得尤为低效,难以持续。
4、基于模板或规则的系统缺乏智能性,早期的自动出题系统通常采用关键词匹配、模板填充或预设逻辑生成题目,缺乏语义理解和推理能力,生成的内容缺乏深度和多样性。
5、大语言模型(llm)直接生成内容存在准确性问题,尽管llm具有强大的语言生成能力,但在知识密集型任务中,若缺乏相关上下文,容易生成事实错误、逻辑不清或与预期知识点无关的题目。
6、缺乏与知识库联动机制,当
...【技术保护点】
1.一种基于动态RAG与多语言LLM协作的评测数据自动生成方法,其特征在于,含有以下步骤,从结构化或非结构化文档中提取知识片段,通过嵌入模型进行向量化后构建语义检索索引,在评测数据生成阶段,系统根据用户输入的主题,调用向量搜索引擎检索相关内容,将结果作为上下文输入至大语言模型,自动生成题目、标准答案、干扰项及对应解释,支持结构化校验与结果存储。
2.根据权利要求1所述的一种基于动态RAG与多语言LLM协作的评测数据自动生成方法,其特征在于,含有以下步骤,
3.根据权利要求2所述的一种基于动态RAG与多语言LLM协作的评测数据自动生成方法,其特征
...【技术特征摘要】
1.一种基于动态rag与多语言llm协作的评测数据自动生成方法,其特征在于,含有以下步骤,从结构化或非结构化文档中提取知识片段,通过嵌入模型进行向量化后构建语义检索索引,在评测数据生成阶段,系统根据用户输入的主题,调用向量搜索引擎检索相关内容,将结果作为上下文输入至大语言模型,自动生成题目、标准答案、干扰项及对应解释,支持结构化校验与结果存储。
2.根据权利要求1所述的一种基于动态rag与多语言llm协作的评测数据自动生成方法,其特征在于,含有以下步骤,
3.根据权利要求2所述的一种基于动态rag与多语言llm协作的评测数据自动生成方法,其特征在于,通过rag结构结合向量检索技术,从原始文档中动态检索出与当前主题最相关的内容,提供给llm参考,确保生成题目的依据清晰、内容准确,有效缓解“幻觉”问题。
4.根据权利要求2所述的一种基于动态rag与多语言llm协作的评测数据自动生成方法,其特征在于,根据不同子主题生成内容多样的题目,并使用多轮提示链设计迷惑性强、但不违背逻辑的错误选项包括干扰项,提升题目的区分度和评估有效性。
5.根据权利要求2所述的一种基于动态rag与多语言llm协作的评测数据自动生成方法,其特征在于,通过数据结...
【专利技术属性】
技术研发人员:李世勇,
申请(专利权)人:北京零一万物信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。