System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能领域,具体提供一种可控的长文本生成方法及系统。
技术介绍
1、自然语言处理(nlp)领域中的一项重要任务是利用大模型进行长文本生成。长文本生成是指根据给定的输入信息,自动地生成一段具有逻辑清晰、内容丰富的文本输出。现有的技术主要依赖于深度学习模型,尤其是大模型,如gpt-4、llama等,这些模型通过分析大量的语料库,学习语言的结构和语义关系,进而生成高质量文本。
2、然而,尽管这些方法在生成文本方面取得了一定成果,但仍然存在一些挑战和问题,包括如何确保生成的文本与预期目标的一致性、如何提高生成文本的多样性和可控性等。
3、具体地,现有的长文本生成方法主要关注于模型的训练和优化,以使得模型能够根据给定的输入信息自动地生成一段高质量的文本。但是,这些方法往往忽视了生产过程中的控制因素,使得生成的文本可能与预期目标不一致,或者无法满足特定的需求。
技术实现思路
1、本专利技术是针对上述现有技术的不足,提供一种实用性强的可控的长文本生成方法。
2、本专利技术进一步的技术任务是提供一种设计合理,安全适用的可控的长文本生成系统。
3、本专利技术解决其技术问题所采用的技术方案是:
4、一种可控的长文本生成方法,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;
5、所述内容生成模块借助大模型进行内容生成
6、所述控制校验模块为生成的文本校验过程,是生成过程的控制逻辑实现。
7、进一步的,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。
8、进一步的,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。
9、进一步的,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。
10、进一步的,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。
11、一种可控的长文本生成系统,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;
12、所述内容生成模块借助大模型进行内容生成,负责接受原始输入或矫正后的输入,生成段落或句子粒度文本,供控制校验模块进行校验;
13、所述控制校验模块为生成的文本校验过程,是生成过程的控制逻辑实现。
14、进一步的,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。
15、进一步的,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。
16、进一步的,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。
17、进一步的,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。
18、本专利技术的一种可控的长文本生成方法及系统和现有技术相比,具有以下突出的有益效果:
19、本专利技术能够对大模型的生成过程进行控制,保证大模型输出的文本的可控性、可靠性,减少大模型输出错误信息的概率,能够满足特定场景下内容质量要求,与用户输入诉求保证一致。同时,能够根据场景、任务进行动态调整校验逻辑,而无需进行大模型的重新训练,减少模型对数据、算力的依赖,使其更符合真实场景,降低模型的使用门槛。
本文档来自技高网...【技术保护点】
1.一种可控的长文本生成方法,其特征在于,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;
2.根据权利要求1所述的一种可控的长文本生成方法,其特征在于,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。
3.根据权利要求2所述的一种可控的长文本生成方法,其特征在于,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。
4.根据权利要求3所述的一种可控的长文本生成方法,其特征在于,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。
5.根据权利要求4所述的一种可控的长文本生成方法,其特征在于,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修
6.一种可控的长文本生成系统,其特征在于,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;
7.根据权利要求6所述的一种可控的长文本生成系统,其特征在于,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。
8.根据权利要求7所述的一种可控的长文本生成系统,其特征在于,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。
9.根据权利要求8所述的一种可控的长文本生成系统,其特征在于,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。
10.根据权利要求9所述的一种可控的长文本生成系统,其特征在于,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。
...【技术特征摘要】
1.一种可控的长文本生成方法,其特征在于,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;
2.根据权利要求1所述的一种可控的长文本生成方法,其特征在于,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。
3.根据权利要求2所述的一种可控的长文本生成方法,其特征在于,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。
4.根据权利要求3所述的一种可控的长文本生成方法,其特征在于,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。
5.根据权利要求4所述的一种可控的长文本生成方法,其特征在于,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。
...【专利技术属性】
技术研发人员:张其来,郭冬升,姜凯,张连超,宁方刚,陈兆亮,
申请(专利权)人:山东浪潮科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。