System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 报表摘要生成方法及装置制造方法及图纸_技高网

报表摘要生成方法及装置制造方法及图纸

技术编号:40150759 阅读:4 留言:0更新日期:2024-01-26 22:59
本发明专利技术公开了一种报表摘要生成方法及装置,应用于人工智能技术领域,其中该方法包括:通过从数据报表中提取文本数据,根据文本数据生成对应的词向量;对生成的词向量进行求和平均,得到词向量求和平均的结果;将词向量求和平均的结果输入到LightGBM模型中进行文本分类,得到分类结果;将分类结果和词向量输入到Transformer网络模型中,提取出对应的语义特征;根据语义特征,建立报表摘要生成模型;将待生成摘要文本的数据报表输入到建立的报表摘要生成模型中,生成对应的摘要文本,从摘要文本中获取数据的关键信息,从而提高数据分析效率,降低生成的摘要文本的错误率,节省人工成本。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及报表摘要生成方法及装置


技术介绍

1、本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、随着金融业数据分析需求的扩大,在精准营销场景下需要大量的数据统计与分析工作为营销提供数据支撑和决策建议,现有的bi(business intelligence,商业智能)报表系统可以实现对数据的可视化展示,但不能简单高效的凸显数据重点,大部分情况都需要专业数据分析师根据报表整理总结报告。另外,现有的自动生成bi报表摘要方法一般基于规则和决策树,生成的文本经常伴随着语法错误、重复啰嗦等问题且多为简单短句难以在金融行业投入应用。为此迫切需要一种智能化报表摘要生成方法来解决上述问题。


技术实现思路

1、本专利技术实施例提供一种报表摘要生成方法,用以提高数据分析效率,降低生成的摘要文本的错误率,节省人工成本,该方法包括:

2、从历史数据报表中提取文本数据,根据文本数据生成对应的词向量;

3、对生成的词向量进行求和平均,得到词向量求和平均的结果;

4、将词向量求和平均的结果输入到lightgbm模型中进行文本分类,得到分类结果;

5、将分类结果和词向量输入到transformer网络模型中,提取出对应的语义特征;

6、根据语义特征,建立报表摘要生成模型,其中报表摘要生成模型是根据语义特征对全连接神经网络模型训练得到的;

7、将待生成摘要文本的数据报表输入到建立的报表摘要生成模型中,生成对应的摘要文本。

8、本专利技术实施例还提供一种报表摘要生成装置,用以提高数据分析效率,降低生成的摘要文本的错误率,节省人工成本,该装置包括:

9、词向量生成模块,用于从历史数据报表中提取文本数据,根据文本数据生成对应的词向量;

10、词向量求和平均模块,用于对生成的词向量进行求和平均,得到词向量求和平均的结果;

11、文本分类模块,用于将词向量求和平均的结果输入到lightgbm模型中进行文本分类,得到分类结果;

12、语义特征提取模块,用于将分类结果和词向量输入到transformer网络模型中,提取出对应的语义特征;

13、报表摘要生成模型训练模块,用于根据语义特征,建立报表摘要生成模型,其中报表摘要生成模型是根据语义特征对全连接神经网络模型训练得到的;

14、摘要文本生成模块,用于将待生成摘要文本的数据报表输入到建立的报表摘要生成模型中,生成对应的摘要文本。

15、本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述报表摘要生成方法。

16、本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述报表摘要生成方法。

17、本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述报表摘要生成方法。

18、本专利技术实施例中,通过从数据报表中提取文本数据,根据文本数据生成对应的词向量;对生成的词向量进行求和平均,得到词向量求和平均的结果;将词向量求和平均的结果输入到lightgbm模型中进行文本分类,得到分类结果;将分类结果和词向量输入到transformer网络模型中,提取出对应的语义特征;根据语义特征,建立报表摘要生成模型;将待生成摘要文本的数据报表输入到建立的报表摘要生成模型中,生成对应的摘要文本,从摘要文本中获取数据的关键信息,从而提高数据分析效率,降低生成的摘要文本的错误率,节省人工成本。

本文档来自技高网...

【技术保护点】

1.一种报表摘要生成方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,在根据文本数据生成对应的词向量之前,包括:

3.如权利要求1所述的方法,其特征在于,将词向量求和平均的结果输入到LightGBM模型中进行文本分类,得到分类结果,包括:

4.如权利要求3所述的方法,其特征在于,还包括:

5.如权利要求1所述的方法,其特征在于,根据语义特征,建立报表摘要生成模型,包括:

6.如权利要求5所述的方法,其特征在于,根据交叉熵损失函数,建立报表摘要生成模型,包括:

7.如权利要求1所述的方法,其特征在于,所述词向量求和平均的结果为文本数据在向量空间的嵌入表达。

8.如权利要求7所述的方法,其特征在于,按照以下公式对词向量进行求和平均:

9.一种报表摘要生成装置,其特征在于,包括:

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一所述方法。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。

...

【技术特征摘要】

1.一种报表摘要生成方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,在根据文本数据生成对应的词向量之前,包括:

3.如权利要求1所述的方法,其特征在于,将词向量求和平均的结果输入到lightgbm模型中进行文本分类,得到分类结果,包括:

4.如权利要求3所述的方法,其特征在于,还包括:

5.如权利要求1所述的方法,其特征在于,根据语义特征,建立报表摘要生成模型,包括:

6.如权利要求5所述的方法,其特征在于,根据交叉熵损失函数,建立报表摘要生成模型,包括:

7.如权利要...

【专利技术属性】
技术研发人员:王佶盛梁杰宋瑞
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1