System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,其特别涉及一种文章大纲生成方法、装置和存储介质。
技术介绍
1、传统的大纲生成技术大多为基于模版的大纲,针对一种类型的文档,采用统一的一种或几种大纲逻辑。如公司研究报告中,通常以“公司概况”、“财务情况”、“行业分析”作为大纲中的标题,这使得大纲内容过于泛化,无法根据实际文章素材生成具体化、细节化的标题内容,从而阅读者无法从标题中获取有效信息;同时也会造成写作者难以根据大纲的关键信息进行素材的有效归纳总结。
技术实现思路
1、为了解决上述问题,本专利技术提供一种文章大纲生成方法、装置和存储介质。
2、本专利技术为解决上述技术问题,提供如下的技术方案:一种文章大纲生成方法,包括以下步骤:
3、步骤s1,获取文章并分段为多个段落;
4、步骤s2,基于llm根据预设提示信息生成通用大纲,所述通用大纲包括多个标题;
5、步骤s3,获取所述段落和标题,针对每个段落从标题中基于语义相似度选出预设数目的初选标题;
6、步骤s4,基于llm根据初选标题与段落的语义概括关系构建标题-段落集合;
7、步骤s5,判断标题-段落集合中的标题是否为空,若否,基于llm更新标题得到更新标题集合;若是,基于llm根据更新标题集合生成得到新生成标题集合;
8、步骤s6,基于llm根据更新标题集合和新生成标题集合更新通用大纲得到个性化大纲。
9、优选地,所述步骤s1具体包括以下步骤:
1
11、步骤s12,对文本内容进行噪声过滤;
12、步骤s13,根据分隔符将文本内容拆分为多个段落并存储。
13、优选地,所述步骤s2中预设提示信息包括用户大纲需求信息、生成通用大纲的提示信息和通用大纲示例中的至少一种。
14、优选地,所述步骤s3具体包括以下步骤:
15、步骤s31,获取所述段落和标题;
16、步骤s32,基于bert对所述段落和标题进行向量化处理;
17、步骤s33,计算向量化后的段落与标题两两之间的余弦相似度并作为相似度分数;
18、步骤s34,针对每个段落将标题按照相似度分数从大到小排序,以预设数目选取排序在前的标题作为初选标题。
19、优选地,所述步骤s4具体包括以下步骤:
20、步骤s41,获取段落及其对应的预设数目的初选标题;
21、步骤s42,构造判断初选标题是否包含段落表达的含义的提示信息并基于llm判断初选标题是否包含段落表达的含义,若是,将段落添加至预设该初选标题对应的标题-段落集合;
22、步骤s43,判断是否所有段落及其对应的预设数目的初选标题均完成步骤s42,若是,执行步骤s44;若否,重复步骤s41-s42;
23、步骤s44,判断是否存在段落未添加至其初选标题对应的标题-段落集合,若是,将该段落添加至预设标题为空的标题-段落集合。
24、优选地,所述步骤s5中基于llm更新标题得到更新标题集合具体包括以下步骤:
25、步骤s51,构造更新标题的提示信息;
26、步骤s52,基于llm根据标题-段落集合中标题对应所有的段落内容,在标题的基础上更新标题,得到更新标题集合。
27、优选地,所述步骤s5中基于llm根据更新标题集合生成得到新生成标题集合具体包括以下步骤:
28、步骤s51`,构造生成标题的提示信息;
29、步骤s52`,标题-段落集合中的标题为空的对应段落基于llm,根据更新标题集合生成得到新生成标题集合。
30、优选地,所述步骤s6具体包括以下步骤:
31、步骤s61,将更新标题集合和新生成标题集合融入到通用大纲;
32、步骤s62,构造更新大纲的提示信息并基于llm进行大纲更新,得到个性化大纲。
33、本专利技术为解决上述技术问题,提供又一技术方案如下:一种文章大纲生成装置,用于实施上述任意一项文章大纲生成方法,文章大纲生成装置包括以下模块:
34、文档解析模块,用于获取文章并分段为多个段落;
35、大纲生成模块,用于基于llm根据预设提示信息生成通用大纲,所述通用大纲包括多个标题;
36、标题-段落匹配模块,用于获取所述段落和标题,针对每个段落从标题中基于语义相似度选出预设数目的初选标题;基于llm根据初选标题与段落的语义概括关系构建标题-段落集合;
37、标题更新模块,用于判断标题-段落集合中的标题是否为空,若否,基于llm更新标题得到更新标题集合;若是,基于llm根据更新标题集合生成得到新生成标题集合;
38、大纲更新模块,用于基于llm根据更新标题集合和新生成标题集合更新通用大纲得到个性化大纲。
39、本专利技术为解决上述技术问题,提供又一技术方案如下:一种计算机可读存储介质,计算机程序被执行时实现上述任意一项所述的文章大纲生成方法。
40、与现有技术相比,本专利技术所提供的一种文章大纲生成方法、装置和存储介质,具有如下的有益效果:
41、1、本专利技术实施例中提供的一种文章大纲生成方法,通过获取文章分段为多个段落,同时基于llm生成包括多个标题的通用大纲,针对每个段落从标题中基于语义相似度选出预设数目的初选标题;基于llm构建标题-段落集合;根据标题-段落集合中的标题是否为空分别进行标题更新和标题生成,得到更新标题集合和新生成标题集合;基于llm根据更新标题集合和新生成标题集合更新通用大纲得到个性化大纲。上述设置使得所生成的大纲能够根据用户提供的素材文章及用户要求,动态生成不同的大纲,满足不同写作者的个性化需求;并且根据所提供的段落以及通用大纲的标题选出段落对应的初选标题,利用llm根据语义概括关系进行二次验证,使得大纲和素材内容相关,更有针对性和关联性,使大纲本身具备更重要丰富的信息量;引入提示信息利用llm进行标题生成和更新,使得该文章大纲生成方法具备大纲生成补充功能,可根据素材文章完善通用大纲中所包含的信息,全面反映素材文章内容;在得到更新标题集合和新生成标题集合之后,大纲将会进行全局更新,使标题之间具有更强的逻辑性。为写作人员提供完整的写作逻辑框架,扩展写作思路;从而有效解决了大纲内容泛化导致无法根据实际文章素材生成具体个性化标题内容,阅读者无法从标题中获取有效信息的技术问题,有力提升了帮助写作者根据大纲的关键信息进行素材归纳总结的技术效果。
42、2、本专利技术实施例中提供的获取文章进行解析,识别文章的文本内容;对文本内容进行噪声过滤;根据分隔符将文本内容拆分为多个段落并存储。上述设置使得文章的文本内容在进行分段时既能够实现高效分段,同时降噪处理使得容易影响文章拆分为段落的干扰因素能够被有效去除,保证了文章拆分为段落的操作能够精准高效完成。
4本文档来自技高网...
【技术保护点】
1.一种文章大纲生成方法,其特征在于,包括以下步骤:
2.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S1具体包括以下步骤:
3.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S2中预设提示信息包括用户大纲需求信息、生成通用大纲的提示信息和通用大纲示例中的至少一种。
4.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S3具体包括以下步骤:
5.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S4具体包括以下步骤:
6.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S5中基于LLM更新标题得到更新标题集合具体包括以下步骤:
7.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S5中基于LLM根据更新标题集合生成得到新生成标题集合具体包括以下步骤:
8.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤S6具体包括以下步骤:
9.一种文档大纲生成装置,用于实施权利要求1~8任意一项所述的文档大纲生成方法,其特征在于,所述文档大
10.一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其特征在于:计算机程序被执行时实现如权利要求1-8任一项所述的文章大纲生成方法。
...【技术特征摘要】
1.一种文章大纲生成方法,其特征在于,包括以下步骤:
2.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤s1具体包括以下步骤:
3.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤s2中预设提示信息包括用户大纲需求信息、生成通用大纲的提示信息和通用大纲示例中的至少一种。
4.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤s3具体包括以下步骤:
5.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤s4具体包括以下步骤:
6.如权利要求1所述的文章大纲生成方法,其特征在于:所述步骤s5中基于l...
【专利技术属性】
技术研发人员:张顺,马永亮,周明,
申请(专利权)人:北京澜舟科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。