【技术实现步骤摘要】
本专利技术涉及机器学习和自然语言处理领域,尤其涉及一种启发式束搜索的大模型结构化输出方法。
技术介绍
1、随着深度学习技术的快速发展,基于神经网络的生成模型在自然语言处理、图像生成、语音识别等领域取得了显著的成果。尤其是大型语言模型(如gpt、bert等)在各个任务中取得的优异表现,基于大模型的结构化数据生成成为研究热点。然而,尽管大模型在生成能力上表现出色,但它们在生成结构化数据时也面临着一些独特的挑战。
2、在结构化输出任务中,生成结果不仅需要满足语法和语义的合理性,还必须遵循严格的格式要求,例如键值对的匹配、嵌套结构的准确生成等。这种格式约束使得结构化输出的生成难度大大增加,尤其是在面对复杂的、多层次的结构化数据时,传统的输出采样方法(如最大似然估计)容易导致输出格式错误,无法保证数据结构的完整性和正确性。而大模型的输出稳定性差,容易受到输入扰动的影响,导致生成的结构化数据时更容易出现格式错误或不一致的问题。其次,大模型相较于传统模型在推理过程消耗计算资源更加庞大,且推理速度较慢,这在需要实时生成大规模结构化数据的应用
...【技术保护点】
1.一种启发式束搜索的大模型结构化输出方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的启发式束搜索的大模型结构化输出方法,其特征在于,在所述步骤S1中,所述结构化数据表示模板至少包括:
3.根据权利要求2所述的启发式束搜索的大模型结构化输出方法,其特征在于,所述类属性字段采用Key-Value键值对的形式,所述类属性字段的键值为属性名,所述类属性字段的Value值用于定义属性的结构;所述类属性字段的Value值包括若干个属性关键词,所述属性关键词包括必要关键词和可选关键词,所述必要关键词包括属性名和属性类型,属性类型用于定义属性关键词
...【技术特征摘要】
1.一种启发式束搜索的大模型结构化输出方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的启发式束搜索的大模型结构化输出方法,其特征在于,在所述步骤s1中,所述结构化数据表示模板至少包括:
3.根据权利要求2所述的启发式束搜索的大模型结构化输出方法,其特征在于,所述类属性字段采用key-value键值对的形式,所述类属性字段的键值为属性名,所述类属性字段的value值用于定义属性的结构;所述类属性字段的value值包括若干个属性关键词,所述属性关键词包括必要关键词和可选关键词,所述必要关键词包括属性名和属性类型,属性类型用于定义属性关键词的类型;所述可选关键词用于进行数据结构的约束,包括描述类属性字段、举例类属性字段、数值约束字段、字符串长度约束字段中的一种或多种。
4.根据权利要求3所述的启发式束搜索的大模型结构化输出方法,其特征在于,所述结构化数据表示模板采用json结构进行表示...
【专利技术属性】
技术研发人员:张扬眉,王帅,李翀,何真,李博,冼茂源,
申请(专利权)人:北京空间科技信息研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。