System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种可控的长文本生成方法及系统技术方案_技高网

一种可控的长文本生成方法及系统技术方案

技术编号:41291865 阅读:3 留言:0更新日期:2024-05-13 14:42
本发明专利技术涉及人工智能领域,具体提供了一种可控的长文本生成方法及系统,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;所述内容生成模块借助大模型进行内容生成,负责接受原始输入或矫正后的输入,生成段落或句子粒度文本,供控制校验模块进行校验;控制校验模块为生成的文本校验过程,是生成过程的控制逻辑实现。与现有技术相比,本发明专利技术无需进行大模型的重新训练,减少模型对数据、算力的依赖,使其更符合真实场景,降低模型的使用门槛。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,具体提供一种可控的长文本生成方法及系统


技术介绍

1、自然语言处理(nlp)领域中的一项重要任务是利用大模型进行长文本生成。长文本生成是指根据给定的输入信息,自动地生成一段具有逻辑清晰、内容丰富的文本输出。现有的技术主要依赖于深度学习模型,尤其是大模型,如gpt-4、llama等,这些模型通过分析大量的语料库,学习语言的结构和语义关系,进而生成高质量文本。

2、然而,尽管这些方法在生成文本方面取得了一定成果,但仍然存在一些挑战和问题,包括如何确保生成的文本与预期目标的一致性、如何提高生成文本的多样性和可控性等。

3、具体地,现有的长文本生成方法主要关注于模型的训练和优化,以使得模型能够根据给定的输入信息自动地生成一段高质量的文本。但是,这些方法往往忽视了生产过程中的控制因素,使得生成的文本可能与预期目标不一致,或者无法满足特定的需求。


技术实现思路

1、本专利技术是针对上述现有技术的不足,提供一种实用性强的可控的长文本生成方法。

2、本专利技术进一步的技术任务是提供一种设计合理,安全适用的可控的长文本生成系统。

3、本专利技术解决其技术问题所采用的技术方案是:

4、一种可控的长文本生成方法,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;

5、所述内容生成模块借助大模型进行内容生成,负责接受原始输入或矫正后的输入,生成段落或句子粒度文本,供控制校验模块进行校验;

6、所述控制校验模块为生成的文本校验过程,是生成过程的控制逻辑实现。

7、进一步的,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。

8、进一步的,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。

9、进一步的,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。

10、进一步的,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。

11、一种可控的长文本生成系统,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;

12、所述内容生成模块借助大模型进行内容生成,负责接受原始输入或矫正后的输入,生成段落或句子粒度文本,供控制校验模块进行校验;

13、所述控制校验模块为生成的文本校验过程,是生成过程的控制逻辑实现。

14、进一步的,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。

15、进一步的,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。

16、进一步的,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。

17、进一步的,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。

18、本专利技术的一种可控的长文本生成方法及系统和现有技术相比,具有以下突出的有益效果:

19、本专利技术能够对大模型的生成过程进行控制,保证大模型输出的文本的可控性、可靠性,减少大模型输出错误信息的概率,能够满足特定场景下内容质量要求,与用户输入诉求保证一致。同时,能够根据场景、任务进行动态调整校验逻辑,而无需进行大模型的重新训练,减少模型对数据、算力的依赖,使其更符合真实场景,降低模型的使用门槛。

本文档来自技高网...

【技术保护点】

1.一种可控的长文本生成方法,其特征在于,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;

2.根据权利要求1所述的一种可控的长文本生成方法,其特征在于,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。

3.根据权利要求2所述的一种可控的长文本生成方法,其特征在于,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。

4.根据权利要求3所述的一种可控的长文本生成方法,其特征在于,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。

5.根据权利要求4所述的一种可控的长文本生成方法,其特征在于,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。

6.一种可控的长文本生成系统,其特征在于,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;

7.根据权利要求6所述的一种可控的长文本生成系统,其特征在于,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。

8.根据权利要求7所述的一种可控的长文本生成系统,其特征在于,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。

9.根据权利要求8所述的一种可控的长文本生成系统,其特征在于,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。

10.根据权利要求9所述的一种可控的长文本生成系统,其特征在于,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。

...

【技术特征摘要】

1.一种可控的长文本生成方法,其特征在于,包括检索和结构化模块、内容生成模块和控制校验模块,所述检索和结构化模块进行输入控制,对用户的诉求进行拆解和补充,生成内容的大体框架,指导模型生成方向;

2.根据权利要求1所述的一种可控的长文本生成方法,其特征在于,所述检索和结构化模块接受用户的原始输入,利用意图分析和结构化分析,理解用户的意图,然后借助相关性检索功能,实现用户信息的补充完善,填充场景内容生成的模板框架。

3.根据权利要求2所述的一种可控的长文本生成方法,其特征在于,检索和结构化模块实现对输入的控制,制定模型生成内容的整体框架,提供模型内容生成的方向和指导。

4.根据权利要求3所述的一种可控的长文本生成方法,其特征在于,所述内容生成模块接受用户的输入或控制校验模块的输出,初始状态,接受检索和结构化模块的输出,生成开始的句子,生成一个句子或段落后,进入控制校验模块,利用校验后的结果进行后续的内容生成。

5.根据权利要求4所述的一种可控的长文本生成方法,其特征在于,所述控制校验模块实现生成过程的可控,对生成的句子或段落进行校验、修正,通过结构化信息,实现大模型逐句、逐段内容的控制和校验。

...

【专利技术属性】
技术研发人员:张其来郭冬升姜凯张连超宁方刚陈兆亮
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1