System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种声明生成方法、装置及电子设备制造方法及图纸_技高网

一种声明生成方法、装置及电子设备制造方法及图纸

技术编号:40794675 阅读:4 留言:0更新日期:2024-03-28 19:23
本申请实施例提供一种声明生成方法、装置及电子设备。该方法中,向语言模型发送第一指令后,基于语言模型的输出确定第一指令对应的响应结果。其中,第一指令包括用户输入的问题。向语言模型发送第二指令后,基于语言模型的输出确定第二指令对应的多个声明。其中,多个文本块对应相同的提示词。按照预设的清洗规则清洗多个声明得到声明集合。其中,声明集合中的多个声明互不相同。上述方案,可以保证语言模型基于每个文本块生成的多个声明完全描述响应结果,覆盖响应结果的全部内容。快速高效地满足业务的需求,提升后续事实核查检测的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种声明生成方法、装置及电子设备


技术介绍

1、近年来,语言模型在人工智能
引起了广泛的关注和研究,如chatgpt,其参数规模已达到千亿级别,已广泛应用于各行各业。然而,由于语言模型在不同领域如医学、法律、电力等的垂直数据是有限的。这导致语言模型不具备垂直领域的专业知识,使得响应结果存在着一定的幻觉错误。

2、针对这种情况,常常通过语言模型对响应结果进行提炼获取用于描述响应结果的多个声明进行事实核查检测,从而确定响应结果是否存在幻觉错误。但由于上述多个声明也是语言模型生成的,因此会出现声明无法完全描述响应结果的问题,这使得后续的事实核查检测效果下降,无法准确地进行事实核查检测。


技术实现思路

1、本申请实施例提供一种声明生成方法、装置及电子设备,用于提高基于物联数据确定指标的时效性以及准确性。

2、第一方面,本申请实施例提供一种声明生成方法,包括:

3、向语言模型发送第一指令后,基于语言模型的输出确定第一指令对应的响应结果,第一指令包括用户输入的问题;

4、将响应结果按照预设的第一字符数划分成多个文本块,每个文本块的尾部字符串在每个文本块的下一文本块的头部重复出现;

5、向语言模型发送第二指令后,基于语言模型的输出确定第二指令对应的多个声明,第二指令包括多个文本块以及预设的提示词,提示词用于指导语言模型基于每个文本块生成多个声明,声明是用于描述响应结果的完整语句,多个文本块对应相同的提示词;

6、按照预设的清洗规则清洗多个声明得到声明集合,声明集合中的多个声明互不相同。

7、上述方法中,由于每个文本块的尾部字符串在每个文本块的下一文本块的头部重复出现,可以保证语言模型基于每个文本块生成的多个声明完全描述响应结果,覆盖响应结果的全部内容。快速高效地满足业务的需求,提升后续事实核查检测的准确性。

8、可选的,将响应结果按照预设的第一字符数划分成多个文本块,具体包括:

9、将响应结果中第一个字符作为初始字符,按照预设的第一字符数划分响应结果得到文本块;

10、将文本块中非末尾的任一字符作为新的初始字符,返回执行按照预设的第一字符数划分响应结果得到新的文本块,直至响应结果中所有字符都存在对应的文本块。

11、上述方法中,通过将文本块中非末尾的任一字符作为新的初始字符,重复在响应结果中划分文本块的方式,可以使得每个文本块的尾部字符串在下一文本块的头部重复出现。同时,也可以确保语言模型基于文本块生成的多个声明可以完全描述响应结果的内容,提升多个声明描述响应结果的完整性。

12、可选的,将响应结果按照预设的字符数划分成多个文本块,还包括:

13、将响应结果按照预设的第二字符数划分成多个子文本块,第二字符数小于等于第一字符数;

14、按照预设规则合并预设数量的多个连续子文本块得到多个文本块,子文本块包括多个字符。

15、上述方法中,通过将响应结果划分为子文本块,再通过合并子文本块得到文本块的方式,可以大大提升后续基于文本块生成的多个声明描述响应结果的完整性。

16、可选的,将响应结果按照预设的第二字符数划分成多个子文本块,第二字符数小于等于第一字符数,具体包括:

17、将响应结果中第一个字符作为子初始字符,按照预设的第二字符数划分响应结果得到子文本块;

18、按照响应结果中的字符顺序,将子文本块末尾字符的下一个字符作为新的子初始字符,返回执行按照预设的第二字符数划分响应结果得到新的子文本块,直至响应结果中所有字符都存在对应的子文本块。

19、上述方法中,通过将子文本块末尾字符的下一个字符作为新的子初始字符,重复在响应结果中划分文本块的方式,可以确保后续基于合并子文本块得到的文本块能更加完全的描述响应结果的内容,使得语言模型基于文本块生成的多个声明可以完全描述响应结果的内容,提升多个声明描述响应结果的完整性。可选的,按照预设规则合并预设数量的多个连续子文本块得到多个文本块,具体包括:

20、将多个子文本块按照被划分顺序依次编号;

21、将第一个子文本块作为初始文本,按照编号顺序将预设数量的子文本块合并得到文本块。

22、将文本块中任一子文本块作为新的初始文本,返回执行按照编号顺序将预设数量的子文本块合并得到新的文本块,直至所有子文本块都被合并在文本块中。

23、上述方法中,通过将文本块中任一子文本块作为新的初始文本,返回执行按照编号顺序合并预设数量的子文本块的方式,实现了每个文本块的尾部字符串在下一文本块的头部重复出现,可以保证语言模型基于每个文本块生成的多个声明完全描述响应结果,覆盖响应结果的全部内容。

24、可选的,按照预设的清洗规则清洗多个声明得到声明集合,具体包括:

25、计算多个声明中任意两个声明之间的相似度;

26、若存在相似度大于等于预设的相似度阈值的两个声明,删除相似度大于等于相似度阈值的两个声明中任一声明。

27、上述方法中,通过比较任意两个声明之间的相似度,删除相似度大于等于相似度阈值的两个声明中任一声明的方式,可以实现对多个声明的去重,节约后续采用多个声明进行事实核查检测的计算资源。

28、可选的,按照预设的清洗规则清洗多个声明得到声明集合,还包括:

29、确定多个声明中任意两个声明的字符是否完全相同;

30、若存在字符完全相同的两个声明,删除字符完全相同的两个声明中任一声明。

31、上述方法中,通过删除字符完全相同的两个声明中任一声明的方式,可以实现对多个声明的去重,节约后续采用多个声明进行事实核查检测的计算资源。

32、第二方面,本申请实施例提供一种声明生成装置,包括:

33、收发模块,用于向语言模型发送第一指令后,基于语言模型的输出确定第一指令对应的响应结果,第一指令包括用户输入的问题;

34、处理模块,用于将响应结果按照预设的第一字符数划分成多个文本块,每个文本块的尾部字符串在每个文本块的下一文本块的头部重复出现;

35、收发模块,还用于向语言模型发送第二指令后,基于语言模型的输出确定第二指令对应的多个声明,第二指令包括多个文本块以及预设的提示词,提示词用于指导语言模型基于每个文本块生成多个声明,声明是用于描述响应结果的完整语句,多个文本块对应相同的提示词;

36、处理模块,还用于按照预设的清洗规则清洗多个声明得到声明集合,声明集合中的多个声明互不相同。

37、第三方面,本申请实施例还提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,当计算机程序被处理器执行时,使得处理器实现上述第一方面中的任一种声明生成方法。

38、第四方面,本申请实施例还提供了一种计算机可读存储介质,计算机可本文档来自技高网...

【技术保护点】

1.一种声明生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述响应结果按照预设的第一字符数划分成多个文本块,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述响应结果按照预设的字符数划分成多个文本块,还包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述响应结果按照预设的第二字符数划分成多个子文本块,所述第二字符数小于等于所述第一字符数,具体包括:

5.根据权利要求2所述的方法,其特征在于,所述按照预设规则合并预设数量的多个连续子文本块得到所述多个文本块,具体包括:

6.根据权利要求1所述的方法,其特征在于,所述按照预设的清洗规则清洗所述多个声明得到声明集合,具体包括:

7.根据权利要求1所述的方法,其特征在于,所述按照预设的清洗规则清洗所述多个声明得到声明集合,还包括:

8.一种声明生成装置,其特征在于,包括:

9.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~7中任一所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~7中任一所述方法的步骤。

11.一种计算机程序产品,其特征在于,所述计算机程序产品在被计算机调用时,使得所述计算机执行如权利要求1~7中任一所述方法的步骤。

...

【技术特征摘要】

1.一种声明生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述响应结果按照预设的第一字符数划分成多个文本块,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述响应结果按照预设的字符数划分成多个文本块,还包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述响应结果按照预设的第二字符数划分成多个子文本块,所述第二字符数小于等于所述第一字符数,具体包括:

5.根据权利要求2所述的方法,其特征在于,所述按照预设规则合并预设数量的多个连续子文本块得到所述多个文本块,具体包括:

6.根据权利要求1所述的方法,其特征在于,所述按照预设的清洗规则清洗所述多个...

【专利技术属性】
技术研发人员:何博睿
申请(专利权)人:新奥新智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1