System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种基于大语言模型的剧本内容生成方法及装置。
技术介绍
1、大语言模型(large language model,llm)是一种基于深度学习的人工智能模型,它可以理解和生成自然语言文本。这些模型通常使用大规模的文本数据进行训练,以便能够理解语言的语法、语义和上下文,并生成类似人类的文本回复。大语言模型可以用于各种任务,包括对话系统、文本生成、翻译、摘要等。
2、aigc(artificial intelligence generated content/ai-generated content)中文译为人工智能生成内容,ai生成内容的统称,一般认为是相对于pcg(专业生成内容)、ucg(用户生成内容)而提出的概念。aigc狭义概念是利用ai自动生成内容的生产方式。广义的aigc可以看作是像人类一样具备生成创造能力的ai技术,即生成式ai,它可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频、3d交互内容等各种形式的内容和数据,以及包括开启科学新发现、创造新的价值和意义等。
3、随着大语言模型(llm)的不断发展,人工智能生成内容(aigc)技术也得到了广泛应用。在目前百亿参数级别的大语言模型中,压缩了海量的人类知识。且可以通过小样本学习和推理,完成新的任务。
4、虽然利用大语言模型来生成文字内容,目前已经较为常见。但尚未有较好的方法,让大模型完成特定的编剧内容创作,也没有相关的系统来将整个方法和流程进行完善的结束,来快速辅助编辑进行创作。
1、本专利技术要解决的技术问题是为了克服现有技术中大语言模型无法完成编剧内容创作的缺陷,提供一种利用大语言模型的快速内容生成能力,辅助编剧从业者在编写剧本,利用最新的aigc技术生成有效且实用的场景情节描述及对白,辅助编剧从业者快速完成剧本创作,提高从业人员的工作效率的基于大语言模型的剧本内容生成方法及装置。
2、本专利技术是通过下述技术方案来解决上述技术问题:
3、一种基于大语言模型的剧本内容生成方法,其特点在于,所述剧本内容生成方法包括:
4、获取用于生成剧本内容的大语言模型;
5、获取剧本大纲及场景并根据剧本大纲及场景构建样例集;
6、按照大语言模型的提示工程构建基于所述样例集的提示词;
7、将所述提示词输入所述大语言模型以获取剧本内容。
8、较佳地,所述获取剧本大纲及场景并根据剧本大纲及场景构建样例集,包括:
9、获取并拆解剧本大纲的语句以得到大纲语句集;
10、按照编号将场景拆分获取场景文本集;
11、匹配大纲语句集与场景文本集中的元素以构建所述样例集;
12、基于提示工程进行格式化的样例集。
13、较佳地,所述按照大语言模型的提示工程构建基于所述样例集的提示词,包括:
14、选取样例集中的若干样例,生成一训练示例;
15、输入待生成剧本内容的场景及内容需求;
16、按照大语言模型的提示工程构建所述训练示例和场景及内容需求的提示词。
17、较佳地,所述训练示例的token计数小于l/2,所述内容需求的token计数小于l/4,其中l为所述大语言模型的长度限制。
18、较佳地,所述提示词中包括内容要求和基础要求,所述基础要求包括要求所述大语言模型根据样例集总结剧本大纲中人物性格特征的指令。
19、较佳地,所述剧本内容生成方法包括:
20、调节大语言模型的生成参数后将所述提示词输入所述大语言模型以获取多个剧本内容;
21、选取所述多个剧本内容中的一个作为剧本内容。
22、较佳地,所述大语言模型中包括表示人物性格特征的特征数值以及表示剧本内容冲突程度的程度数值,所述剧本内容生成方法包括:
23、将选取的剧本内容通知大语言模型;
24、所述大语言模型根据选取的剧本内容修改所述特征数值;
25、所述大语言模型判断特征数值是否达到特征阈值,若是则在下一次程度数值满足程度阈值时切换到达特征阈值的特征数值为目标数值。
26、较佳地,所述剧本内容生成方法包括:
27、获取一用于审核剧本内容的大语言审核模型,所述大语言审核模型接收与大语言模型相同的提示词;
28、将选取的剧本内容通知大语言模型,将选取的剧本内容以及根据选取的剧本内容生成的正式剧本格式化后通知所述大语言审核模型;
29、利用大语言审核模型获取两个版本的剧本内容的优缺点;
30、将选取的优缺点通知所述大语言审核模型;
31、利用大语言审核模型审核大语言模型输出的多个剧本内容以获取目标剧本内容并生成目标剧本内容的优缺点。
32、较佳地,所述剧本内容生成方法包括:
33、以目标语句训练所述大语言模型,所述目标语句包括诗词、歌赋或名人名言;
34、对于一目标样例集,利用所述大语言模型获取与剧本大纲及目标样例集匹配的目标语句;
35、生成目标样例集的剧本内容,在剧本内容中标记用于插入目标语句的台词位置。
36、本专利技术还提供一种基于大语言模型剧本内容生成装置,其特点在于,所述剧本内容生成装置用于实现如上所述的剧本内容生成方法。
37、在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本专利技术各较佳实例。
38、本专利技术的积极进步效果在于:
39、本专利技术利用大语言模型的快速内容生成能力,能辅助编剧从业者在编写剧本时,可利用最新的aigc技术生成有效且实用的场景情节描述及对白,以辅助编剧从业者快速完成剧本创作,提高从业人员的工作效率。
本文档来自技高网...【技术保护点】
1.一种基于大语言模型的剧本内容生成方法,其特征在于,所述剧本内容生成方法包括:
2.如权利要求1所述的基于大语言模型的剧本内容生成方法,其特征在于,所述获取剧本大纲及场景并根据剧本大纲及场景构建样例集,包括:
3.如权利要求2所述的基于大语言模型的剧本内容生成方法,其特征在于,所述按照大语言模型的提示工程构建基于所述样例集的提示词,包括:
4.如权利要求3所述的基于大语言模型的剧本内容生成方法,其特征在于,所述训练示例的token计数小于L/2,所述内容需求的token计数小于L/4,其中L为所述大语言模型的长度限制。
5.如权利要求3所述的基于大语言模型的剧本内容生成方法,其特征在于,所述提示词中包括内容要求和基础要求,所述基础要求包括要求所述大语言模型根据样例集总结剧本大纲中人物性格特征的指令。
6.如权利要求3所述的基于大语言模型的剧本内容生成方法,其特征在于,所述剧本内容生成方法包括:
7.如权利要求6所述的基于大语言模型的剧本内容生成方法,其特征在于,所述大语言模型中包括表示人物性格特征的特征数值
8.如权利要求6所述的基于大语言模型的剧本内容生成方法,其特征在于,所述剧本内容生成方法包括:
9.如权利要求3所述的基于大语言模型的剧本内容生成方法,其特征在于,所述剧本内容生成方法包括:
10.一种基于大语言模型的剧本内容生成装置,其特征在于,所述剧本内容生成装置用于实现如权利要求1至9中任意一项所述的剧本内容生成方法。
...【技术特征摘要】
1.一种基于大语言模型的剧本内容生成方法,其特征在于,所述剧本内容生成方法包括:
2.如权利要求1所述的基于大语言模型的剧本内容生成方法,其特征在于,所述获取剧本大纲及场景并根据剧本大纲及场景构建样例集,包括:
3.如权利要求2所述的基于大语言模型的剧本内容生成方法,其特征在于,所述按照大语言模型的提示工程构建基于所述样例集的提示词,包括:
4.如权利要求3所述的基于大语言模型的剧本内容生成方法,其特征在于,所述训练示例的token计数小于l/2,所述内容需求的token计数小于l/4,其中l为所述大语言模型的长度限制。
5.如权利要求3所述的基于大语言模型的剧本内容生成方法,其特征在于,所述提示词中包括内容要求和基础要求,所述基础要求包括要求所述大语言...
【专利技术属性】
技术研发人员:陈志永,唐柯,李鹏,
申请(专利权)人:上海森宇文化传媒股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。