【技术实现步骤摘要】
本专利技术涉及人工智能,特别地涉及一种大语言模型结构化生成系统及方法。
技术介绍
1、在自然语言处理领域,大模型结构化生成技术对于提升内容生成的规范性和准确性至关重要,目前,大模型结构化生成原理主要包括在序列生成过程中,算法需要维持词元状态机来跟踪当前时刻所对应的非法词元列表等,以及单步生成时,算法通过某种数据结构及词元状态机确定当前时刻的非法词元列表等,之后将非法词元对应的打分降低到足够小的数,以保证该步生成不会出现非法词元。
2、常见的大语言模型结构化生成框架如outlines和xgrammar;outline采用确定性有限状态机作为词元状态机,单步生成使用列表、张量等数据结构;
3、然而,outlines获取确定性有限状态机的过程极为复杂,需历经多次转换,时间复杂度高达o(n2v),其中n约为用户输入的正则表达式的字符数量,v为分词器词表大小,实践中v往往远大于n;且outlines基于正则语言的底层描述方式,结构化需求描述能力不足,无法满足如上下文无关文法类的通用结构化需求。
4、xgramm
...【技术保护点】
1.一种大语言模型结构化生成系统,其特征在于,包括:
2.根据权利要求1所述的大语言模型结构化生成系统,其特征在于,所述前端在将领域特定语言转换为后端可识别语言时,将编译算法的时间复杂度限定为O(n),其中,n为领域特定语言的字符数量。
3.根据权利要求1所述的大语言模型结构化生成系统,其特征在于,
4.根据权利要求1所述的大语言模型结构化生成系统,其特征在于,所述大语言模型结构化生成系统还包括词表掩码,所述词表掩码与所述推理框架相互作用,在大模型生成过程中对词表进行筛选或约束。
5.根据权利要求4所述的大语言模型结构化
...【技术特征摘要】
1.一种大语言模型结构化生成系统,其特征在于,包括:
2.根据权利要求1所述的大语言模型结构化生成系统,其特征在于,所述前端在将领域特定语言转换为后端可识别语言时,将编译算法的时间复杂度限定为o(n),其中,n为领域特定语言的字符数量。
3.根据权利要求1所述的大语言模型结构化生成系统,其特征在于,
4.根据权利要求1所述的大语言模型结构化生成系统,其特征在于,所述大语言模型结构化生成系统还包括词表掩码,所述词表掩码与所述推理框架相互作用,在大模型生成过程中对词表进行筛选或约束。
5.根据权利要求4所述的大语言模型结构化生成系统,其特征在于,所述wait算子和所述write算子基于所述词表掩码更新当前合法的...
【专利技术属性】
技术研发人员:汪然,任浩,陈刚,
申请(专利权)人:北京深言科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。