启发式束搜索的大模型结构化输出方法技术

技术编号:46587486 阅读:2 留言:0更新日期:2025-10-10 21:23
本发明专利技术涉及一种启发式束搜索的大模型结构化输出方法,包括:S1、设计结构化数据表示模板;S2、基于结构化数据表示模板对大模型输出的真实数据结构进行定义;S3、将真实数据结构作为额外参数传递,通过大模型对输入的数据进行编码和KV‑cache计算;S4、通过大模型进行一轮解码,利用启发式函数设置束搜索的宽度,并进行采样获得候选集;S5、通过大模型遍历候选集,通过相似度度量函数计算匹配度并筛选;S6、通过大模型持续进行迭代,若遇到输出结束符号,则通过综合相似计算保留最优路径,并结束,否则回到S3。本发明专利技术结合了启发式搜索策略和束搜索技术,旨在提高大模型在结构化输出任务中的效率与准确性,广泛应用于自动化翻译、文本生成、分类等领域。

【技术实现步骤摘要】

本专利技术涉及机器学习和自然语言处理领域,尤其涉及一种启发式束搜索的大模型结构化输出方法


技术介绍

1、随着深度学习技术的快速发展,基于神经网络的生成模型在自然语言处理、图像生成、语音识别等领域取得了显著的成果。尤其是大型语言模型(如gpt、bert等)在各个任务中取得的优异表现,基于大模型的结构化数据生成成为研究热点。然而,尽管大模型在生成能力上表现出色,但它们在生成结构化数据时也面临着一些独特的挑战。

2、在结构化输出任务中,生成结果不仅需要满足语法和语义的合理性,还必须遵循严格的格式要求,例如键值对的匹配、嵌套结构的准确生成等。这种格式约束使得结构化输出的生成难度大大增加,尤其是在面对复杂的、多层次的结构化数据时,传统的输出采样方法(如最大似然估计)容易导致输出格式错误,无法保证数据结构的完整性和正确性。而大模型的输出稳定性差,容易受到输入扰动的影响,导致生成的结构化数据时更容易出现格式错误或不一致的问题。其次,大模型相较于传统模型在推理过程消耗计算资源更加庞大,且推理速度较慢,这在需要实时生成大规模结构化数据的应用场景中,可能成为瓶颈本文档来自技高网...

【技术保护点】

1.一种启发式束搜索的大模型结构化输出方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的启发式束搜索的大模型结构化输出方法,其特征在于,在所述步骤S1中,所述结构化数据表示模板至少包括:

3.根据权利要求2所述的启发式束搜索的大模型结构化输出方法,其特征在于,所述类属性字段采用Key-Value键值对的形式,所述类属性字段的键值为属性名,所述类属性字段的Value值用于定义属性的结构;所述类属性字段的Value值包括若干个属性关键词,所述属性关键词包括必要关键词和可选关键词,所述必要关键词包括属性名和属性类型,属性类型用于定义属性关键词的类型;所述可选关键...

【技术特征摘要】

1.一种启发式束搜索的大模型结构化输出方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的启发式束搜索的大模型结构化输出方法,其特征在于,在所述步骤s1中,所述结构化数据表示模板至少包括:

3.根据权利要求2所述的启发式束搜索的大模型结构化输出方法,其特征在于,所述类属性字段采用key-value键值对的形式,所述类属性字段的键值为属性名,所述类属性字段的value值用于定义属性的结构;所述类属性字段的value值包括若干个属性关键词,所述属性关键词包括必要关键词和可选关键词,所述必要关键词包括属性名和属性类型,属性类型用于定义属性关键词的类型;所述可选关键词用于进行数据结构的约束,包括描述类属性字段、举例类属性字段、数值约束字段、字符串长度约束字段中的一种或多种。

4.根据权利要求3所述的启发式束搜索的大模型结构化输出方法,其特征在于,所述结构化数据表示模板采用json结构进行表示...

【专利技术属性】
技术研发人员:张扬眉王帅李翀何真李博冼茂源
申请(专利权)人:北京空间科技信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1