一种基于深度学习的研究报告自动生成方法技术

技术编号:27538698 阅读:24 留言:0更新日期:2021-03-03 11:29
本发明专利技术提供了一种基于深度学习的研究报告自动生成方法,其包括:S1,获取需要生成的研究报告的模板以及对应的研究数据;S2,获取所述模板中的待填写项目;S3,基于所述待填写项目,获取对应的深度学习神经网络模型以及从所述研究数据中获取相应的计算数据;S4,将所述计算数据输入到所述深度学习神经网络模型中,得到计算结果;S5,将所述计算结果填入到所述待填写项目中;S6,重复步骤S2

【技术实现步骤摘要】
一种基于深度学习的研究报告自动生成方法


[0001]本专利技术涉及报告生成领域,尤其涉及一种基于深度学习的研究报告自动生成方法。

技术介绍

[0002]目前,各行各业都会用到各种研究报告,而对于同一行业来说,研究报告的框架基本是差不多的,主要是数据的不同以及数据计算结果的不同。各种类型的研究报告需求越来越大,目前,仅靠人工对研究数据进行分析,然后撰写研究报告,显然不能快速得到所需要的研究报告。

技术实现思路

[0003]鉴于上述问题,本专利技术的目的在于提供一种基于深度学习的研究报告自动生成方法。
[0004]本专利技术提供了一种基于深度学习的研究报告自动生成方法,其包括:
[0005]S1,获取需要生成的研究报告的模板以及对应的研究数据;
[0006]S2,获取所述模板中的待填写项目;
[0007]S3,基于所述待填写项目,获取对应的深度学习神经网络模型以及从所述研究数据中获取相应的计算数据;
[0008]S4,将所述计算数据输入到所述深度学习神经网络模型中,得到计算结果;
[0009]S5,将所述计算结果填入到所述待填写项目中;
[0010]S6,重复步骤S2-S5,直到所有的待填写项目被填写完毕,从而得到研究报告。
[0011]优选地,所述研究数据包括数据项目的名称和所述数据项目的具体数值,所述研究数据存储通过扫描输入的方式输入到数据库中,具体包括:
[0012]扫描记载所述研究数据的纸质文件,得到扫描图像;
[0013]对所述扫描图像进行文字识别,获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值;
[0014]将所述数据项目的名称和所述数据项目的具体数值传输至所述数据库进行存储。
[0015]优选地,所述从所述研究数据中获取相应的计算数据,包括:
[0016]所述待填写项目包括待填写的项目的名称以及填写区域;
[0017]将所述待填写的项目的名称与所述数据项目的名称进行匹配,将匹配成功的数据项目的名称对应的数据项目的具体数值作为计算数据。
[0018]优选地,所述将计算结果填入到所述待填写项目中,包括:将所述计算结果填入到所述填写区域。
[0019]优选地,对所述扫描图像进行文字识别,获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值,包括:
[0020]对所述扫描图像进行灰度化处理,获得灰度图像;
[0021]对所述灰度图像进行降噪处理,获得降噪图像;
[0022]对所述降噪图像进行分割处理,获得只包含文字部分的前景图像;
[0023]采用ORC文字识别技术对所述前景图像进行文字识别,从而获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值。
[0024]与现有技术相比,本专利技术的优点在于:
[0025]与人工撰写研究报告相比,本申请的研究报告的生成速度更快,而且准确度相应地也更高,因为人工计算的方式,难免会有输入错误的时候,而通过直接从数据库中获取的方式,能够很大程度上避免这种错误的发生。而且人工计算成本高,效率也比较慢,并不能快速得到所需要的研究报告。
附图说明
[0026]利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
[0027]图1,为本专利技术一种基于深度学习的研究报告自动生成方法的一种示例性实施例图。
具体实施方式
[0028]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。
[0029]参见图1实施例所示,本专利技术提供了一种基于深度学习的研究报告自动生成方法,其包括:
[0030]S1,获取需要生成的研究报告的模板以及对应的研究数据;
[0031]S2,获取所述模板中的待填写项目;
[0032]S3,基于所述待填写项目,获取对应的深度学习神经网络模型以及从所述研究数据中获取相应的计算数据;
[0033]S4,将所述计算数据输入到所述深度学习神经网络模型中,得到计算结果;
[0034]S5,将所述计算结果填入到所述待填写项目中;
[0035]S6,重复步骤S2-S5,直到所有的待填写项目被填写完毕,从而得到研究报告。
[0036]研究报告的模板,采用的是行业内的通用模板,即模板的结构基本一致,只是里面不同的项目所需要填写的数值不同。
[0037]研究数据由研究人员收集得到,研究人员可以对研究数据进行初步的筛选,剔除明显超出正常范围的错误数据,以增强后续的研究报告生成的准确性。
[0038]优选地,所述研究数据包括数据项目的名称和所述数据项目的具体数值,所述研究数据存储通过扫描输入的方式输入到数据库中,具体包括:
[0039]扫描记载所述研究数据的纸质文件,得到扫描图像;
[0040]对所述扫描图像进行文字识别,获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值;
[0041]将所述数据项目的名称和所述数据项目的具体数值传输至所述数据库进行存储。
[0042]除了扫描输入之外,还可以是人工手动输入的方式,这种方式针对的是书写过于潦草,无法通过文字识别技术进行扫描的纸质文件。当然,如果研究数据是电子数据,那研究人员可以直接上所述电子数据输入到所述数据库中,更加快速。
[0043]优选地,所述从所述研究数据中获取相应的计算数据,包括:
[0044]所述待填写项目包括待填写的项目的名称以及填写区域;
[0045]将所述待填写的项目的名称与所述数据项目的名称进行匹配,将匹配成功的数据项目的名称对应的数据项目的具体数值作为计算数据。
[0046]除此之外,还可以设置一个自动匹配模块,该模块的输入值是待填写的项目的名称,输出值是一个或多个数据项目的名称。研究人员可以根据实际需要对所述模块进行调整,从而增加本专利技术自动生成研究报告的适应性。
[0047]优选地,所述将计算结果填入到所述待填写项目中,包括:将所述计算结果填入到所述填写区域。
[0048]优选地,对所述扫描图像进行文字识别,获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值,包括:
[0049]对所述扫描图像进行灰度化处理,获得灰度图像;
[0050]对所述灰度图像进行降噪处理,获得降噪图像;
[0051]对所述降噪图像进行分割处理,获得只包含文字部分的前景图像;
[0052]采用ORC文字识别技术对所述前景图像进行文字识别,从而获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值。
[0053]优选地,所述对所述扫描图像进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的研究报告自动生成方法,其特征在于,其包括:S1,获取需要生成的研究报告的模板以及对应的研究数据;S2,获取所述模板中的待填写项目;S3,基于所述待填写项目,获取对应的深度学习神经网络模型以及从所述研究数据中获取相应的计算数据;S4,将所述计算数据输入到所述深度学习神经网络模型中,得到计算结果;S5,将所述计算结果填入到所述待填写项目中;S6,重复步骤S2-S5,直到所有的待填写项目被填写完毕,从而得到研究报告。2.根据权利要求1所述的一种基于深度学习的研究报告自动生成方法,其特征在于,所述研究数据包括数据项目的名称和所述数据项目的具体数值,所述研究数据存储通过扫描输入的方式输入到数据库中,具体包括:扫描记载所述研究数据的纸质文件,得到扫描图像;对所述扫描图像进行文字识别,获得所述纸质文件上记载的数据项目的名称和所述数据项目的具体数值;将所述数据项目的名称和所述数据项目的具体数值传输至所述数据库进行存储。3.根据权利要求2所述的一种基...

【专利技术属性】
技术研发人员:黄冬虹刘谢慧赵彤
申请(专利权)人:清研灵智信息咨询北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1