System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 活动文本模型的训练方法、文本生成方法、装置、设备制造方法及图纸_技高网

活动文本模型的训练方法、文本生成方法、装置、设备制造方法及图纸

技术编号:39987710 阅读:5 留言:0更新日期:2024-01-09 02:01
本公开提供了一种活动文本模型的训练方法、文本生成方法、装置、设备及存储介质,可以从目标活动的活动数据中确定出语句内容包括有效关系的特征语句,通过关系判断筛选出特征语句,减少后续关系提取的数据处理量,基于特征语句和关系提取策略来构建特征关系知识图谱,通过特征关系知识图谱对信息提示模板进行增强补充得到活动文本需求新信息,通过活动文本需求新信息来对预训练好的预设文本模型进行提示学习,有助于提升文本生成的准确性和适用性,在得到预设文本生成模型根据活动文本需求信息输出的初步生成文本后,根据对初步生成文本的校验结果,调整针对预设文本模型增加的目标模型参数得到活动文本模型,有效提升文本生成的精确性和合规性。

【技术实现步骤摘要】

本公开涉及计算机网络,具体而言,涉及一种活动文本模型的训练方法、文本生成方法、装置、设备及存储介质。


技术介绍

1、随着互联网技术的高速发展,以及通过智能终端交流和分享的便捷性的提高,互联网产品成为近年来较为热门的运营内容之一,用户可以通过终端设备随时随地查看互联网产品。为了便于用户更好的了解产品、满足用户的信息获取需求,常常会通过各类活动的展开来辅助互联网产品的传播,通过活动文案来为用户展示互联网产品。

2、随着大语言模型的流行,可以使用大语言模型的内容生成能力辅助活动文案的撰写,与传统的人工撰写方式相比可以大幅减少人力成本,然而针对不同类型的活动大多使用通用的提示模板进行文案生成,导致文案生成效果较为单一,针对不同类型的活动得到的文案内容相似度较高,存在精细化运作的空间。


技术实现思路

1、本公开实施例至少提供一种活动文本模型的训练方法、文本生成方法、装置、设备及存储介质。

2、本公开实施例提供了一种活动文本模型的训练方法,所述方法包括:

3、从目标活动的活动数据中,确定出语句内容中包括有效关系的各特征语句;

4、通过各特征语句和预设的关系提取策略,生成在各活动特征维度下的至少一个特征关系知识图谱;

5、将得到的各个特征关系知识图谱和与所述目标活动匹配的信息提示模板进行融合,得到针对所述目标活动的活动文本需求信息;

6、将所述活动文本需求信息输入至预训练好的预设文本模型,得到所述预设文本生成模型根据所述活动文本需求信息输出的多个初步生成文本;

7、使用对各个所述初步生成文本的校验结果,对得到的活动文本模型中的目标模型参数进行调整,得到训练好的、针对所述目标活动的活动文本模型,所述活动文本模型是在所述预设文本模型的基础上增加预设的目标模型参数得到的。

8、一种可选的实施方式中,所述通过各特征语句和预设的关系提取策略,生成在各活动特征维度下的至少一个特征关系知识图谱,包括:

9、针对每个所述特征语句,按照预设的关系提取策略从所述特征语句中提取得到至少一个第一特征关系组,所述第一特征关系组包括第一特征词、第二特征词以及所述第一特征词和所述第二特征词之间的第一组内关系;

10、基于多个所述第一特征关系组以及各个所述第一特征关系组之间的组外特征关系,生成在各活动特征维度下的至少一个特征关系知识图谱。

11、一种可选的实施方式中,在所述预设的关系提取策略包括多种关系提取策略的情况下,所述按照预设的关系提取策略从所述特征语句中提取得到至少一个第一特征关系组,包括:

12、分别按照多种关系提取策略,从所述特征语句中提取得到在每种关系提取策略下的至少一个第一候选特征关系组,所述多种关系提取策略包括正向关系提取策略、反向关系提取策略以及平行关系提取策略中的至少两种;

13、基于每种关系提取策略对应的预设权重以及在每种关系提取策略下提取得到的至少一个第一候选特征关系组,得到至少一个第一特征关系组。

14、一种可选的实施方式中,在所述关系提取策略为所述正向关系提取策略的情况下,通过以下步骤从所述特征语句中提取得到在所述正向关系提取策略下的至少一个第一候选特征关系组:

15、对所述特征语句的语句内容进行主语识别,得到所述特征语句中指示主语的第一候选特征词;

16、对所述特征语句中除指示所述第一候选特征词以外的语句内容进行谓语识别和宾语识别,得到所述特征语句中的特征关系和指示宾语的第二候选特征词。

17、一种可选的实施方式中,在所述关系提取策略为所述反向关系提取策略的情况下,通过以下步骤从所述特征语句中提取得到在所述反向关系提取策略下的至少一个第一候选特征关系组:

18、对所述特征语句的语句内容进行宾语识别,得到所述特征语句中指示宾语的第二候选特征词;

19、对所述特征语句中除指示所述第二候选特征词以外的语句内容进行谓语识别和主语识别,得到所述特征语句中的特征关系和指示主语的第一候选特征词。

20、一种可选的实施方式中,在所述关系提取策略为所述平行关系提取策略的情况下,通过以下步骤从所述特征语句中提取得到在所述平行关系提取策略下的至少一个第一候选特征关系组:

21、对所述特征语句进行谓语识别,得到所述特征语句中的特征关系;

22、对所述特征语句中除指示所述特征关系以外的语句内容进行主语识别和宾语识别,确定所述目标语句中指示主语的第一候选特征词和指示宾语的第二候选特征词。

23、一种可选的实施方式中,所述将得到的各个特征关系知识图谱和与所述目标活动匹配的信息提示模板进行融合,得到针对所述目标活动的活动文本需求信息,包括:

24、获取与所述目标活动匹配的信息提示模板;

25、确定所述信息提示模板指示的、待填充数据的多个预设维度和与每个所述预设维度对应的预设数量;

26、针对不同活动特征维度下的任意两个所述特征关系知识图谱,确定任一特征关系知识图谱中的每个数据与另一特征关系知识图谱中的每个数据之间的数据关联度;

27、基于各个数据关联度从大到小的排列顺序、所述预设维度和所述预设数量,在每个所述预设维度下,从多个所述特征关系知识图谱中确定出在所述排列顺序中排列在前的、符合对应所述预设数量的目标数据;

28、将所述目标数据加入至所述信息提示模板中,得到针对所述目标活动的活动文本需求信息。

29、一种可选的实施方式中,所述特征关系知识图谱中的数据包括实体数据和在所述实体数据下的属性数据;所述针对不同活动特征维度下的任意两个所述特征关系知识图谱,确定任一特征关系知识图谱中的每个数据与另一特征关系知识图谱中的每个数据之间的数据关联度,包括:

30、将各个特征关系知识图谱按照特征关系知识图谱之间的图谱关系进行连接处理,得到特征关系网;

31、针对不同活动特征维度下的第一特征关系知识图谱和第二特征关系知识图谱,基于所述特征关系网,确定所述第一特征关系知识图谱中的每个实体数据与所述第二特征关系知识图谱中的每个实体数据之间的属性相似度、所述第一特征关系知识图谱中的每个实体数据与所述第二特征关系知识图谱中的每个属性数据之间的第一关系可达度、以及所述第一特征关系知识图谱中的每个属性数据与所述第二特征关系知识图谱中的每个实体数据之间的第二关系可达度;

32、基于所述属性相似度、所述第一关系可达度和所述第二关系可达度,确定所述第一特征关系知识图谱中的每个数据与所述第二特征关系知识图谱中的每个数据之间的数据关联度。

33、一种可选的实施方式中,通过以下步骤确定所述第一特征关系知识图谱中的每个实体数据与所述第二特征关系知识图谱中的每个属性数据之间的第一关系可达度:

34、针对所述第一特征关系知识图谱中的每个实体数据,检测该实体数据与所述第二特征关系知识图谱中的属性数据本文档来自技高网...

【技术保护点】

1.一种活动文本模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过各特征语句和预设的关系提取策略,生成在各活动特征维度下的至少一个特征关系知识图谱,包括:

3.根据权利要求1所述的方法,其特征在于,所述将得到的各个特征关系知识图谱和与所述目标活动匹配的信息提示模板进行融合,得到针对所述目标活动的活动文本需求信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述使用对各个所述初步生成文本的校验结果,对得到的活动文本模型中的目标模型参数进行调整,得到训练好的、针对所述目标活动的活动文本模型,包括:

5.一种文本生成方法,其特征在于,所述方法包括:

6.根据权利要求5所述的方法,其特征在于,所述基于与所述目标活动匹配的多个特征关系知识图谱和预设知识图谱,对各个所述候选文本进行校验,得到通过校验的目标文本,包括:

7.一种活动文本模型的训练装置,其特征在于,所述装置包括:

8.一种文本生成装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4中任一项所述的活动文本模型的训练方法或者如权利要求5至6中任一项所述的文本生成方法的步骤。

10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至4中任一项所述的活动文本模型的训练方法或者如权利要求5至6中任一项所述的文本生成方法的步骤。

...

【技术特征摘要】

1.一种活动文本模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过各特征语句和预设的关系提取策略,生成在各活动特征维度下的至少一个特征关系知识图谱,包括:

3.根据权利要求1所述的方法,其特征在于,所述将得到的各个特征关系知识图谱和与所述目标活动匹配的信息提示模板进行融合,得到针对所述目标活动的活动文本需求信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述使用对各个所述初步生成文本的校验结果,对得到的活动文本模型中的目标模型参数进行调整,得到训练好的、针对所述目标活动的活动文本模型,包括:

5.一种文本生成方法,其特征在于,所述方法包括:

6.根据权利要求5所述的方法,其特征在于,所述基于与所述目标活动匹配的多个特征关系知识图谱和预设...

【专利技术属性】
技术研发人员:朱臻顾冬梅朱墨晗朱鋆晗林怀远铁治欣刘海霞
申请(专利权)人:浙江理工大学科技与艺术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1