一种底稿文件生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36208442 阅读:16 留言:0更新日期:2023-01-04 12:04
本发明专利技术实施例提供了一种底稿文件生成方法、装置、电子设备及存储介质,涉及数据处理技术领域,该方法包括:当接收到底稿文件生成请求时,获取底稿文件信息;从预先设定的各个文件类型对应的底稿文件模板中,确定目标底稿文件的文件类型对应的底稿文件模板,作为目标模板;确定目标模板中的待填充的关于金融信息的各个主题类别;利用目标发行人的标识以及各个主题类别,从结构化数据库中,获取目标发行人的、与各个主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据;利用预定的渲染工具,将每一主题类别对应的底稿数据,渲染至目标模板中的对应的填充位置处,得到针对目标发行人的目标底稿文件。通过本方案可以提高底稿文件的生成效率。文件的生成效率。文件的生成效率。

【技术实现步骤摘要】
一种底稿文件生成方法、装置、电子设备及存储介质


[0001]本专利技术涉及数据处理
,特别是涉及一种底稿文件生成方法、装置、电子设备及存储介质。

技术介绍

[0002]在债券发行准备期间,需要对该债券的发行人进行尽职调查和信息披露,并通过底稿文件,公开发行人的相关数据信息。
[0003]相关技术中,工作人员需要阅读大量的发行人文件,并从发行人文件中提取需要的内容,最终形成底稿文件。所谓发行人文件包括:发行人公开和/或非公开的金融信息文件。
[0004]若采用相关技术生成底稿文件,工作人员常常加班加点的撰写底稿文件,需要大量阅读发行人文件,工作人员工作量大,工作效率低,生成底稿文件的效率不高。因此,如何提高底稿文件的生成效率是亟待解决的问题。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种底稿文件生成方法、装置、电子设备及存储介质,以提高底稿文件的生成效率。具体技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种底稿文件生成方法,所述方法包括:
[0007]当接收到底稿文件生成请求时,获取底稿文件信息;其中,所述底稿文件触发请求为用于生成针对目标发行人的目标底稿文件的请求;所述底稿文件信息至少包括:所述目标发行人的标识以及所述目标底稿文件的文件类型;不同文件类型的底稿文件用于披露一发行人不同核查方面的金融信息;
[0008]从预先设定的各个文件类型对应的底稿文件模板中,确定所述目标底稿文件的文件类型所对应的底稿文件模板,作为目标模板
[0009]确定所述目标模板中的待填充的关于金融信息的各个主题类别;其中,不同的主题类别对应不同的填充位置;
[0010]利用所述目标发行人的标识以及各个主题类别,从预定的结构化数据库中,获取所述目标发行人的、与各个主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据;其中,所述结构化数据库中包含有从多个发行人的金融信息文件中所提取的、用于生成针对每一发行人的任一文件类型的底稿文件的数据,每一发行人为债券发行人;
[0011]利用预定的渲染工具,将每一主题类别对应的底稿数据,渲染至所述目标模板中的对应的填充位置处,得到针对所述目标发行人的目标底稿文件。
[0012]可选地,所述利用所述目标发行人的标识以及各个主题类别,从预定的结构化数据库中,获取所述目标发行人的、与各个主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据,包括:
[0013]利用所述目标发行人的标识,从预定的结构化数据库中,查询所述目标发行人的
数据内容;
[0014]从所查询到的所述目标发行人的数据内容中,筛选每一主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据。
[0015]可选地,所述预定的结构化数据库的建立方式,包括:
[0016]获取多个发行人的金融信息文件;其中,所述金融信息文件包括公开和/或非公开的金融文件;
[0017]针对任一发行人的金融信息文件,按照预定的结构化处理方式,对该金融信息文件进行结构化处理,得到该发行人的关于金融信息文件的结构化数据;
[0018]将多个发行人的结构化数据,存储至预定的结构化数据库;
[0019]其中,所述预定的结构化处理方式包括:
[0020]确定所述金融信息文件的目标格式,利用目标格式对应的解析器对所述金融信息文件进行解析,得到关于金融信息文件的文本文件;利用文本分析器,对所述文本文件进行分析,得到所述文本文件的预定关键信息;对所述预定关键信息进行信息提取,得到结构化数据;
[0021]其中,所述文本分析器用于对所述文本文件进行句法分析、图片提取、表格识别、章节结构分析以及文本清洗的分析处理;所述预定关键信息至少包括:表格、图片以及文本数据中的至少一个。
[0022]可选地,所述金融信息文件包括公开金融文件,以及非公开金融文件;
[0023]所述获取多个发行人的金融信息文件,包括:
[0024]针对每一发行人,利用预先设置的用于进行金融信息调查的指定文件模板,指示该发行人进行关于金融信息的填写,得到针对该发行人进行金融信息调查后的调查文件,作为第一非公开金融文件;
[0025]获取该发行人授权访问的关于金融信息的非公开金融文件,作为该发行人的第二非公开金融文件;
[0026]基于债券公开网站所披露的关于该发行人的金融信息,确定该发行人的公开金融文件。
[0027]可选地,所述当接收到底稿文件生成请求时,获取底稿文件信息之后,从预先设定的各个文件类型对应的底稿文件模板中,确定所述目标底稿文件的文件类型所对应的底稿文件模板,作为目标模板之前,所述方法还包括:
[0028]识别所述目标底稿文件的文件类型是否指定文件类型;其中,所述指定文件类型的底稿文件用于从针对资金使用情况的核查方面披露一发行人的金融信息;
[0029]如果识别结果为是,获取所述目标底稿文件的生成用途,若所述生成用途符合预定用途条件,则执行所述从预先设定的各个文件类型对应的底稿文件模板中,确定所述目标底稿文件的文件类型所对应的底稿文件模板,作为目标模板的步骤;
[0030]如果识别结果为否,则执行所述从预先设定的各个文件类型对应的底稿文件模板中,确定所述目标底稿文件的文件类型所对应的底稿文件模板,作为目标模板的步骤。
[0031]可选地,所述利用预定的渲染工具,将每一主题类别对应的底稿数据,渲染至所述目标模板中的对应的填充位置处,得到针对所述目标发行人的目标底稿文件之后,所述方法还包括:
[0032]检测所述结构化数据库中针对所述目标发行人的数据,是否发生更新;
[0033]若发生更新,从所述结构化数据库中,获取所述目标发行人的发生更新的目标数据;
[0034]识别所述目标数据是否为目标主题类别对应的数据,如果是,利用所述目标数据,对所述目标底稿文件中所述目标主题类别进行数据更新;其中,所述目标主题类别为各个主题类别中的任一类别。
[0035]第二方面,本专利技术实施例提供了一种底稿文件生成装置,所述装置包括:
[0036]第一获取模块,用于当接收到底稿文件生成请求时,获取底稿文件信息;其中,所述底稿文件触发请求为用于生成针对目标发行人的目标底稿文件的请求;所述底稿文件信息至少包括:所述目标发行人的标识以及所述目标底稿文件的文件类型;不同文件类型的底稿文件用于披露一发行人不同核查方面的金融信息;
[0037]第一确定模块,用于从预先设定的各个文件类型对应的底稿文件模板中,确定所述目标底稿文件的文件类型所对应的底稿文件模板,作为目标模板;
[0038]第二确定模块,用于确定所述目标模板中的待填充的关于金融信息的各个主题类别;其中,不同的主题类别对应不同的填充位置;
[0039]第二获取模块,用于利用所述目标发行人的标识以及各个主题类别,从预定的结构化数据库中,获取所述目标发行人的、与各个主题类别相匹配的底本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种底稿文件生成方法,其特征在于,所述方法包括:当接收到底稿文件生成请求时,获取底稿文件信息;其中,所述底稿文件触发请求为用于生成针对目标发行人的目标底稿文件的请求;所述底稿文件信息至少包括:所述目标发行人的标识以及所述目标底稿文件的文件类型;不同文件类型的底稿文件用于披露一发行人不同核查方面的金融信息;从预先设定的各个文件类型对应的底稿文件模板中,确定所述目标底稿文件的文件类型所对应的底稿文件模板,作为目标模板;确定所述目标模板中的待填充的关于金融信息的各个主题类别;其中,不同的主题类别对应不同的填充位置;利用所述目标发行人的标识以及各个主题类别,从预定的结构化数据库中,获取所述目标发行人的、与各个主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据;其中,所述结构化数据库中包含有从多个发行人的金融信息文件中所提取的、用于生成针对每一发行人的任一文件类型的底稿文件的数据,每一发行人为债券发行人;利用预定的渲染工具,将每一主题类别对应的底稿数据,渲染至所述目标模板中的对应的填充位置处,得到针对所述目标发行人的目标底稿文件。2.根据权利要求1所述的方法,其特征在于,所述利用所述目标发行人的标识以及各个主题类别,从预定的结构化数据库中,获取所述目标发行人的、与各个主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据,包括:利用所述目标发行人的标识,从预定的结构化数据库中,查询所述目标发行人的数据内容;从所查询到的所述目标发行人的数据内容中,筛选每一主题类别相匹配的底稿数据,得到每一主题类别对应的底稿数据。3.根据权利要求1所述的方法,其特征在于,所述预定的结构化数据库的建立方式,包括:获取多个发行人的金融信息文件;其中,所述金融信息文件包括公开和/或非公开的金融文件;针对任一发行人的金融信息文件,按照预定的结构化处理方式,对该金融信息文件进行结构化处理,得到该发行人的关于金融信息文件的结构化数据;将多个发行人的结构化数据,存储至预定的结构化数据库;其中,所述预定的结构化处理方式包括:确定所述金融信息文件的目标格式,利用目标格式对应的解析器对所述金融信息文件进行解析,得到关于金融信息文件的文本文件;利用文本分析器,对所述文本文件进行分析,得到所述文本文件的预定关键信息;对所述预定关键信息进行信息提取,得到结构化数据;其中,所述文本分析器用于对所述文本文件进行句法分析、图片提取、表格识别、章节结构分析以及文本清洗的分析处理;所述预定关键信息至少包括:表格、图片以及文本数据中的至少一个。4.根据权利要求3所述的方法,其特征在于,所述金融信息文件包括公开金融文件,以及非公开金融文件;
所述获取多个发行人的金融信息文件,包括:针对每一发行人,利用预先设置的用于进行金融信息调查的指定文件模板,指示该发行人进行关于金融信息的填写,得到针对该发行人进行金融信息调查后的调查文件,作为第一非公开金融文件;获取该发行人授权访问的关于金融信息的非公开金融文件,作为该发行人的第二非公开金融文件;基于债券公开网站所披露的关于该发行人的金融信息,确定该发行人的公开金融文件。5.根据权利要求1所述的方法,其特征在于,所述当接收到底稿文件生成请求时,获取底稿...

【专利技术属性】
技术研发人员:刘申邵明鑫李涛赵旭东
申请(专利权)人:中信建投证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1