一种文本报告自动生成方法及系统技术方案

技术编号:36217536 阅读:18 留言:0更新日期:2023-01-04 12:15
一种文本报告自动生成方法及系统,包括如下步骤:获取报告模板和原始数据;根据报告模板所需内容从原始数据当中提取有效内容;将有效内容补充到报告模板当中形成报告。本申请以报告模板作为提取的模板和要求,采用原始数据作为基础,将需要的数据提取之后放入到报告模板当中,最终快速形成一个符合要求的报告。最终快速形成一个符合要求的报告。最终快速形成一个符合要求的报告。

【技术实现步骤摘要】
一种文本报告自动生成方法及系统


[0001]本申请涉及一种文本报告自动生成方法及系统。

技术介绍

[0002]在数据处理过程中,报告是最常见的展示形式。现在的报告多是采用模板类型的设置模式。但是现在的自动化报告的信息获取的精准度比较差,在生成报告时,容易发生数据获取上的错误,另外则是在数据发生错误时,现有的模板无法起到预检测作用,而且现有的模板是一种固定模板,在出现额外的有效数据时,也无法体现在报告当中,这实际上缩减了模板自身的有效性和可拓展性。

技术实现思路

[0003]为了解决上述问题,本申请一方面公开了一种文本报告自动生成方法,包括如下步骤:获取报告模板和原始数据;根据报告模板所需内容从原始数据当中提取有效内容;将有效内容补充到报告模板当中形成报告。本申请以报告模板作为提取的模板和要求,采用原始数据作为基础,将需要的数据提取之后放入到报告模板当中,最终快速形成一个符合要求的报告。
[0004]优选的,对于原始数据进行有效内容的提取时,若无法得到有效内容,则对于原始数据的整体进行检索分析,得到与报告模板当中所需内容接近的内容作为次有效内容,对次有效内容进行解构得到解构内容,并将解构内容作为有效替代内容。本申请在进行原始内容提取时,若无法得到有效内容,还会自动进行拓展,从而保证最终报告内容在内容本身的提取对象和被提取内容具有可靠性的基础上,也具有一定的实质内容。
[0005]优选的,所述次有效内容按照如下方式进行分析得到:
[0006]获取报告模板对于所需内容的要求;
>[0007]提取报告模板对于所需内容的要求中的关键词;
[0008]拓展关键词得到关键词组;
[0009]以该关键词组作为匹配要素,在原始数据当中进行匹配检索,得到匹配度超过匹配阈值的检索对象,将检索对象综合得到次有效内容;
[0010]所述检索对象以段落为提取起止点。
[0011]优选的,所述解构内容按照如下方式得到:
[0012]将检索对象按照匹配度从高到低进行排序;
[0013]将检索对象中有效信息按照匹配度的排序进行汇总,若从次级的检索对象得到的有效信息低于有效阈值,则停止进行解构内容的汇总;
[0014]按照匹配度最高的检索对象作为解构内容进行拓展描述,作为在不存在有效内容情况下的有效替代内容。优选的,在得到有效替代内容之后,将有效替代内容的构成形式作为备用模板写入到报告模板当中;
[0015]备用模板用于在原有报告模板无法得到对应的有效内容时,采用备用模板的要求
再次进行有效内容的获取,若能够得到有效内容,则进入到下一部分有效内容的获取,若无法得到有效内容,则再进行有效替代内容的获取。
[0016]优选的,所述报告模板包括Api参数和SQL参数;所述Api参数包括参数类型、参数名称、参数描述、访问地址;所述SQL参数包括数据库信息、数据库地址、用户名、密码及查询语句。
[0017]优选的,所述Api参数采用占位符的方式在报告模板中形成可变参数;所述SQL参数用于与Api参数配合,根据Api参数从原始数据当中得到有效内容
[0018]优选的,还包括将报告进行图片化和附加水印的过程,包括如下步骤:
[0019]将报告转化为报告图片;
[0020]在报告图片上设置水印。本申请对于原报告图片进行双重的水印处理,第一方面是将溯源信息,即图片的基本信息引入其中,第二方面则是将客户端信息,也就是浏览该图片人员的信息也加入其中,通过双重水印的引入,可以在报告图片当中得到报告图片的制作人和浏览人,从而如果报告图片被外传,可以进行该报告图片被泄露情况以及其原有信息的溯源。
[0021]优选的,按照如下方式在图片上设置水印:
[0022]S1获取报告图片的溯源信息;
[0023]所述溯源信息包括单位名称、用户、主机MAC、报告图片的形成时间;
[0024]S2将溯源信息转化为第一隐形水印,基于报告图片将第一隐形水印融入到报告图片当中得到溯源图片;
[0025]将溯源信息经国密SM4加密算法转换为第一隐形水印;溯源信息按照如下方式得到第一隐形水印并将第一隐形水印与报告图片复合得到溯源图片:
[0026]确定第一隐形水印的位置,将第一隐形水印中的字符排列为方形设置的第一字符块,然后将第一字符块进行图片化处理,使得第一字符块中的线条宽度所占的像素数不少于10个;
[0027]获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,将第一字符块铺满报告图片,然后得到溯源图片。
[0028]溯源信息按照如下方式得到:
[0029]对比溯源图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息。
[0030]S3获取浏览的客户端信息;
[0031]所述客户端信息包括系统用户名、客户端IP、浏览时间;
[0032]S4将客户端信息转化为第二隐形水印,基于报告图片和第一隐形水印将第二隐形水印融入到报告图片当中得到档案图片。
[0033]将客户端信息经RSA算法转化为第二隐形水印。客户端信息按照如下方式得到第二隐形水印并将第二隐形水印与报告图片复合得到档案图片:
[0034]将第二隐形水印中的字符排列为条形设置的第二字符块,然后将第二字符块进行
图片化处理,使得第二字符块中的线条宽度所占的像素数不少于2个;
[0035]获取第一字符块,将第二字符块中的线条部分按照第一字符块的线条长度切割后与第一字符块进行复合;
[0036]获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,然后得到档案图片;若检测到具有第一字符块线条的同时,还具有第二字符块线条,像素值则保持不变。
[0037]对于附加第一隐形水印和第二隐形水印的图片,所述档案信息和溯源信息按照如下方式得到:
[0038]对比档案图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息;将第一字符块上线条位置的文字进行文字提取得到第二隐形水印,并通过RSA算法得到客户端信息。
[0039]另一方面,本申请还公开了一种文本报告自动生成系统,包括如下模块:
[0040]拓展模块,用于获取报告模板和原始数据;
[0041]内容提取模块,用于根据报告模板所需内容从原始数据当中提取有效内容;
[0042]报告生成模块,用于将有效内本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本报告自动生成方法,其特征在于:包括如下步骤:获取报告模板和原始数据;根据报告模板所需内容从原始数据当中提取有效内容;将有效内容补充到报告模板当中形成报告。2.根据权利要求1所述的一种文本报告自动生成方法,其特征在于:在对于原始数据进行有效内容的提取时,若无法得到有效内容,则对于原始数据的整体进行检索分析,得到与报告模板当中所需内容接近的内容作为次有效内容,对次有效内容进行解构得到解构内容,并将解构内容作为有效替代内容。3.根据权利要求2所述的一种文本报告自动生成方法,其特征在于:所述次有效内容按照如下方式进行分析得到:获取报告模板对于所需内容的要求;提取报告模板对于所需内容的要求中的关键词;拓展关键词得到关键词组;以该关键词组作为匹配要素,在原始数据当中进行匹配检索,得到匹配度超过匹配阈值的检索对象,将检索对象综合得到次有效内容;所述检索对象以段落为提取起止点。4.根据权利要求3所述的一种文本报告自动生成方法,其特征在于:所述解构内容按照如下方式得到:将检索对象按照匹配度从高到低进行排序;将检索对象中有效信息按照匹配度的排序进行汇总,若从次级的检索对象得到的有效信息低于有效阈值,则停止进行解构内容的汇总;按照匹配度最高的检索对象作为解构内容进行拓展描述,作为在不存在有效内容情况下的有效替代内容。5.根据权利要求4所述的一种文本报告自动生成方法,其特征在于:在得到有效替代内容之后,将有效替代内容的构成形式作为备用模板写入到报告模板当中;备用模板用于在原有报告模板无法得到对应的有效内容时,采用备用模板的要求再次进行有效内容的获取,若能够得到有效内容,则进入到下一部分有效内容的获取,若无法得到有效内容,则再进行有效替代内容的获取。6.根据权利要求1所述的一种文本报告自动生成方法,其特征在于:所述报告模板包括Api参数和SQL参数;所述Api参数包括参数类型、参数名称、参数描述、访问地址;所述SQL参数包括数据库信息、数据库地址、用户名、密码及查询语句。7.根据权利要求6所述的一种文本报告自动生成方法,其特征在于:所述Api参数采用占位符的方式在报告模板中形成可变参数;所述SQL参数用于与Api参数配合,根据Api参数从原始数据当中得到有效内容。8.根据权利要求1所述的一种文本报告自动生成方法,其特征在于:还包括将报告进行图片化和附加水印的过程,包括如下步骤:将报告转化为报告图片;在报告图片上设置水印。9.根据权利要求8所述的一种文本报告自动生成方法,其特征在于:按照如下方式在图
片上设置水印:S1获取报告图片的溯源信息;所述溯源信息包括单位名称、用户、主机MAC、报告图片的形成时间;S2将溯源信息转化为第一隐形水印,基于...

【专利技术属性】
技术研发人员:刘凡殷忠源马强刘斌郑常青张倩公彦法
申请(专利权)人:山东旗帜信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1