System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种长篇工程设计报告中综合说明自动生成方法及系统技术方案_技高网

一种长篇工程设计报告中综合说明自动生成方法及系统技术方案

技术编号:40088051 阅读:9 留言:0更新日期:2024-01-23 15:46
本发明专利技术公开了一种长篇工程设计报告中综合说明自动生成方法及系统,涉及专业技术报告编制领域。本发明专利技术通过将待检测原文本拆分成各个专业文本,对每个专业的专业文本进行句子拆分,对每个句子进行泛读和精读,输出深度理解的句子和句子的Rouge值,再通过多头注意力集中模型和Rouge值预测模型获取深度理解的句子和每个深度理解的句子的Rouge值,进而确定每个专业的专业摘要终稿;将每个专业摘要终稿按照原文本中的专业顺序进行排列,获取综合说明终稿,最终实现了长篇工程设计报告中综合说明自动生成,提高了长篇工程报告中综合说明生成效率与质量。

【技术实现步骤摘要】

本专利技术涉及专业技术报告编制领域,尤其涉及一种长篇工程设计报告中综合说明自动生成方法及系统


技术介绍

1、在设计型企业中,工程设计报告是其核心产品,涉及项目从规划、勘测、设计到建设的各个阶段以及多个专业。设计报告篇幅长,涉及专业众多,文档编制、生成花费公司大量的人力、物力,成为所有设计人员日常主要的工作内容。特别是摘要和综合说明的编写中,既要求编辑人员对专业技术十分熟悉,又要求对整个报告的布局、重点、技术方向等有充分的把控。

2、现有技术中,已有短篇文档的摘要生成技术,但仅仅是基于词频实现摘要的合成,而长篇设计报告中,篇幅多、内容多、设计的技术、关键点也多,单纯的依靠词频,会导致生成的摘要准确性低,因此亟需长篇工程设计报告中综合说明自动生成方法。

3、因此,需要借助数字化技术研究长篇工程设计报告中综合说明自动生成方法,提高长篇工程报告中摘要和综合说明生成效率与质量,实现生产方式的创新。


技术实现思路

1、针对现有技术存在的缺陷,本专利技术提出一种长篇工程设计报告中综合说明自动生成方法,具体包括如下步骤:

2、步骤s1,获取待检测的原文本,并将所述原文本按照专业进行拆分,获得每个专业的专业文本;

3、步骤s2,对每个专业的专业文本进行句子拆分,对每个句子进行泛读和精读,输出深度理解的句子,根据所述深度理解的句子获取每个深度理解的句子的rouge值;

4、步骤s3,根据深度理解的句子和所述rouge值,获取每个专业的专业摘要终稿;

5、步骤s4,将每个所述专业摘要终稿按照原文本中的专业顺序进行排列,获取综合说明终稿;

6、步骤s5,将生成的综合说明终稿收录至训练素材库。

7、进一步的,所述步骤s2具体为:

8、步骤s21,对专业文本进行句子拆分,将拆分后的句子输入泛读模型,输出包含所述专业文本的全局信息的句子;

9、步骤s22,将包含全局信息的句子输入精读模型,输出对所述专业文本中每个句子深度理解的句子;

10、步骤s23,将所述深度理解的句子输入多头注意力集中模型,输出每个深度理解的句子与所述专业文本的相关性结果;

11、步骤s24,将所述每个深度理解的句子和所述相关性结果输入rouge值预测模型,输出每个深度理解的句子的rouge值。

12、进一步的,所述步骤s3中,根据深度理解的句子和所述rouge值,获取每个专业的专业摘要终稿,具体为:

13、步骤s31,将所述rouge值进行降序排列,获取排在前k个的rouge值及k个所述rouge值对应的深度理解的句子,k为摘要长度参数;

14、步骤s32,将k个所述深度理解的句子按照在专业文本中的顺序进行排列,获取专业摘要初稿;

15、步骤s33,对所述专业摘要初稿进行平滑处理,获取专业摘要终稿。

16、进一步的,所述泛读模型采用nlp模型,用于获取包含专业文本的全局信息的句子,具体为:

17、步骤s211,将专业文本的第1个句子放入隐空间,获得句子1的隐空间;

18、步骤s212,根据第2个句子和句子1的隐空间,获得句子2的隐空间,所述句子2的隐空间同时带有第1、第2个句子的信息;

19、步骤s213,以此类推,直至根据第n个句子和句子n-1的隐空间,获得句子n的隐空间,所述句子n的隐空间中包含专业文本的全局信息的句子,n为专业文本的句子数量。

20、进一步的,所述精读模型采用nlp模型,用于获取每个深度理解的句子,具体为:

21、步骤s221,根据专业文本的第1个句子及泛读阶段获取的包含专业文本的全局信息的句子,获得深度理解的第1个句子;

22、步骤s222,根据专业文本的第2个句子及泛读阶段获取的包含专业文本的全局信息的句子,输出深度理解的第2个句子;

23、步骤s223,以此类推,直至获取深度理解的所有的n个句子。

24、进一步的,所述多头注意力集中模型采用mlp模型,用于采用多头注意力集中机制计算每个深度理解的句子与专业文本的相关性结果;所述相关性结果为每个深度理解的句子的数值和权重。

25、进一步的,所述rouge值预测模型采用mlp模型,用于根据所述每个深度理解的句子及相关性结果获取每个句子的rouge值。

26、进一步的,所述rouge值预测模型的损失函数l为:

27、 ;

28、其中,n为句子的数量,pi为多头注意力集中模型输出的第i个句子的权重,yi为多头注意力集中模型输出的第i个句子的数值,ri为rouge值预测模型输出的第i个句子的rouge值。

29、进一步的,所述步骤s33中,所述平滑处理的算法为ernie算法。

30、一种长篇工程设计报告中综合说明自动生成系统,使用如上任一项所述的长篇工程设计报告中综合说明自动生成方法,包括如下模块:

31、数据获取模块:用于获取待检测的原文本,并将所述原文本按照专业进行拆分,获得每个专业的专业文本;

32、rouge值计算模块:与所述数据获取模块连接,用于对每个专业的专业文本进行句子拆分,对每个句子进行泛读和精读,输出深度理解的句子,根据所述深度理解的句子获取每个深度理解的句子的rouge值;

33、专业摘要生成模块:与所述rouge值计算模块连接,用于根据深度理解的句子和所述rouge值,获取每个专业的专业摘要终稿;

34、综合说明生成模块,与所述专业摘要生成模块连接,用于将每个所述专业摘要终稿按照原文本中的专业顺序进行排列,获取综合说明终稿;

35、数据收录模块,与所述综合说明生成模块连接,用于将生成的综合说明终稿收录至训练素材库。

36、与现有技术相比较,本专利技术的有益效果在于:

37、其一,本专利技术通过将待检测的原文本拆分成各个专业文本,对每个专业的专业文本处理,获取每个专业的专业摘要终稿;再根据原文本中的顺序进行排序,进而获取综合说明终稿,最终实现了长篇工程设计报告中综合说明自动生成,相较于现有技术以词频为依据的摘要生成方法,本专利技术通过获取含有全局信息的句子,再计算句子的rouge值,根据rouge值获取与原文相关性最高的句子,提高了长篇工程报告中综合说明生成结果的准确率,实现了生产方式的创新;

38、其二,本专利技术采用四个模型依次连接,泛读模型和精读模型采用nlp模型,相较于采用单个的模型,可以使句子分析模型更加充分、准确的理解所有句子的含义;多头注意力集中模型采用mlp模型,对所述n个深度理解的句子进行处理,获取句子的相关性结果;rouge值预测模型采用mlp模型,根据所述n个深度理解的句子及句子的相关性结果计算每个句子的rouge值,最终使得句子分析模型充分结合了每个模型的特点,为综合说明的生成提供准确的数据基础,提升模型输出结果的准确本文档来自技高网...

【技术保护点】

1.一种长篇工程设计报告中综合说明自动生成方法,其特征在于,具体包括如下步骤:

2.根据权利要求1所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述步骤S2具体为:

3.根据权利要求1所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述步骤S3中,根据深度理解的句子和所述Rouge值,获取每个专业的专业摘要终稿,具体为:

4.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述泛读模型采用NLP模型,用于获取包含专业文本的全局信息的句子,具体为:

5.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述精读模型采用NLP模型,用于获取每个深度理解的句子,具体为:

6.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述多头注意力集中模型采用MLP模型,用于采用多头注意力集中机制计算每个深度理解的句子与专业文本的相关性结果;所述相关性结果为每个深度理解的句子的数值和权重。

7.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述Rouge值预测模型采用MLP模型,用于根据所述每个深度理解的句子及相关性结果获取每个句子的Rouge值。

8.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述Rouge值预测模型的损失函数L为:

9.根据权利要求3所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述步骤S33中,所述平滑处理的算法为Ernie算法。

10.一种长篇工程设计报告中综合说明自动生成系统,使用如权利要求1-9任一项所述的长篇工程设计报告中综合说明自动生成方法,其特征在于,包括如下模块:

...

【技术特征摘要】

1.一种长篇工程设计报告中综合说明自动生成方法,其特征在于,具体包括如下步骤:

2.根据权利要求1所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述步骤s2具体为:

3.根据权利要求1所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述步骤s3中,根据深度理解的句子和所述rouge值,获取每个专业的专业摘要终稿,具体为:

4.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述泛读模型采用nlp模型,用于获取包含专业文本的全局信息的句子,具体为:

5.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述精读模型采用nlp模型,用于获取每个深度理解的句子,具体为:

6.根据权利要求2所述的一种长篇工程设计报告中综合说明自动生成方法,其特征在于,所述多...

【专利技术属性】
技术研发人员:汤慧卿张军杨光卢晓彤郑泽蒋冠侯兴旺王颖周学武栗宝娟孙建华周欣娜耿梓涵王业强王彤
申请(专利权)人:中水北方勘测设计研究有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1