一种数据存储方法及装置制造方法及图纸

技术编号:20763944 阅读:34 留言:0更新日期:2019-04-03 14:19
本发明专利技术实施例公开了一种数据存储方法及装置,涉及数据处理技术领域。其中,包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定纳税方对应的第一节点和负税方对应的第二节点;在图数据库中建立第一节点与第二节点之间的关联关系;按照关联关系将所述发票流数据导入图数据库中,实现待存储发票数据的存储。应用本发明专利技术实施例提供的方案时,在面对海量数据存储的情况下,能够满足用户对数据读写等方面的需求。

【技术实现步骤摘要】
一种数据存储方法及装置
本专利技术涉及数据处理
,特别是涉及一种数据存储方法及装置。
技术介绍
随着税务信息化系统的使用,该系统的数据库中需要存储大量的发票数据。现有技术中,一般使用关系型数据库存储发票数据。虽然上述关系型数据库可以实现大量发票数据的存储,但是由于关系型数据库的表结构固定、数据读写效率低下,在需要存储海量发票数据的情况下,以上述关系型数据库存储数据后难以满足用户对数据读写等方面的需求。
技术实现思路
本专利技术实施例的目的在于提供一种数据存储方法及装置,在需要存储海量发票数据的情况下,满足用户对数据读写方面的需求。具体技术方案如下:第一方面,本专利技术实施例提供了一种数据存储方法,所述方法包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点;在所述图数据库中建立所述第一节点与第二节点之间的关联关系;按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数据的存储。本专利技术的一个实施例中,所述干扰数据,包括以下数据中的至少一种:残缺的发票数据、错误的发票数据和重复的发票数据。本专利技术的一个实施例中,所述纳税方和负税方之间的发票流数据,包括以下数据中的至少一种:发票数据中的发票代码、发票号码、开票时间、金额、税额。本专利技术的一个实施例中,所述在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点,包括:查询用于存储数据的图数据库中是否存在表示所述纳税方的节点,若存在,直接将查询到的节点作为所述纳税方对应的第一节点,若不存在,在所述图数据库中创建所述纳税方对应的第一节点;查询图数据库中是否存在表示所述负税方的节点,若存在,直接将查询到的节点作为所述负税方对应的第二节点,若不存在,在所述图数据库中创建所述负税方对应的第二节点。本专利技术的一个实施例中,所述按照所述关联关系将所述发票流数据导入图数据库中,包括:将从清洗后待存储发票数据中的发票代码、开票时间、金额、税额导入图数据库并添加到所述关联关系上,构建所述第一节点和第二节点之间的发票流关系。本专利技术的一个实施例中,所述方法还包括:在所述图数据库中不存在所述纳税方的财务负责人数据、法人数据的情况下,获得所述纳税方的财务负责人数据、法人数据;将所获得的财务负责人数据、法人数据导入所述图数据库中,并建立所获得财务负责人数据、法人数据与所述第一节点之间的关系。本专利技术的一个实施例中,所述方法还包括:获得用户对预设的可视化平台提供的查询条件设置项的设置值;根据各查询条件设置项的设置值,生成查询条件;按照所述查询条件进行数据查询,并向所述可视化平台反馈查询结果,以使得所述可视化平台展示所述查询结果。第二方面,本专利技术实施例提供了一种数据存储装置,所述装置包括:数据清洗模块,用于对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;信息确定模块,用于确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;节点确定模块,用于在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述开票方对应的第二节点;关系建立模块,用于在所述图数据库中建立所述第一节点与第二节点之间的关联关系;第一数据导入模块,用于按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数据的存储。本专利技术的一个实施例中,所述干扰数据,包括以下数据中的至少一种:残缺的发票数据、错误的发票数据和重复的发票数据。本专利技术的一个实施例中,所述纳税方和开票方之间的发票流数据,包括以下数据中的至少一种:发票数据中的发票代码、发票号码、开票时间、金额、税额。本专利技术的一个实施例中,所述节点确定模块,包括:第一节点查询单元和第二节点查询单元;所述第一节点查询单元,用于查询用于存储数据的图数据库中是否存在表示所述纳税方的节点,若存在,直接将查询到的节点作为所述纳税方对应的第一节点,若不存在,在所述图数据库中创建所述纳税方对应的第一节点;所述第二节点查询单元,用于查询用于存储数据的图数据库中是否存在表示所述负税方的节点,若存在,直接将查询到的节点作为所述负税方对应的第二节点,若不存在,在所述图数据库中创建所述负税方对应的第二节点。本专利技术的一个实施例中,所述第一数据导入模块,具体用于将从清洗后待存储发票数据中的发票代码、开票时间、金额、税额导入图数据库并添加到所述关联关系上,构建所述第一节点和第二节点之间的发票流关系。本专利技术的一个实施例中,所述装置还包括:数据获得模块和第二数据导入模块;所述数据获得模块,用于在所述图数据库中不存在所述纳税方的财务负责人数据、法人数据的情况下,获得所述纳税方的财务负责人数据、法人数据;所述第二数据导入模块,用于将所获得的财务负责人数据、法人数据导入所述图数据库中,并建立所获得财务负责人数据、法人数据与所述第一节点之间的关系。本专利技术的一个实施例中,所述装置还包括:查询条件设置模块和数据查询模块;所述查询条件设置模块,用于获得用户对预设的可视化平台提供的查询条件设置项的设置值,根据各查询条件设置项的设置值,生成查询条件;所述数据查询模块,用于按照所述查询条件进行数据查询,并向所述可视化平台反馈查询结果,以使得所述可视化平台展示所述查询结果。第三方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现本专利技术实施例所述的方法步骤。第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例所述的方法步骤。由上述的技术方案可见,本专利技术实施例提供的一种数据存储方法及装置,通过对待存储的发票数据进行清洗,清洗掉其中干扰数据;在清洗后的发票数据中确定负税方、纳税方以及双方的发票流数据;在存储发票数据的图数据库中分别确定纳税方对应的第一节点和负税方对应的第二节点;建立第一节点和第二节点之间的关联关系;将待存储的发票流数据导入到图数据库中,并添加到所述关联关系上。由于图数据库具有灵活的数据存储结构,这样借助于图数据库实现数据存储相比于借助关系型数据库实现数据存储更为高效、快速,且能够应对高并发读写,因此,在需要存储海量发票数据的情况下,能够满足用户对数据读写等方面的需求。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。图1为本专利技术实施例提供的数据存储方法的一种流程示意图;图2为本专利技术实施例提供的纳税人发票流信息查询示意图;图3为本专利技术实施例提供的数据存储方法的另一种流程示意图;图4为本专利技术实施例提供的数据存储装置的一种结构示意图;图5为本专利技术实施例提供的数据存储电子设备的一种结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本本文档来自技高网...

【技术保护点】
1.一种数据存储方法,其特征在于,所述方法包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点;在所述图数据库中建立所述第一节点与第二节点之间的关联关系;按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数据的存储。

【技术特征摘要】
1.一种数据存储方法,其特征在于,所述方法包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点;在所述图数据库中建立所述第一节点与第二节点之间的关联关系;按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数据的存储。2.根据权利要求1所述的方法,其特征在于,所述干扰数据,包括以下数据中的至少一种:残缺的发票数据、错误的发票数据和重复的发票数据。3.根据权利要求1所述的方法,其特征在于,所述纳税方和负税方之间的发票流数据,包括以下数据中的至少一种:发票数据中的发票代码、发票号码、开票时间、金额、税额。4.根据权利要求1所述的方法,其特征在于,所述在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点,包括:查询用于存储数据的图数据库中是否存在表示所述纳税方的节点,若存在,直接将查询到的节点作为所述纳税方对应的第一节点,若不存在,在所述图数据库中创建所述纳税方对应的第一节点;查询图数据库中是否存在表示所述负税方的节点,若存在,直接将查询到的节点作为所述负税方对应的第二节点,若不存在,在所述图数据库中创建所述负税方对应的第二节点。5.根据权利要求3所述的方法,其特征在于,所述按照所述关联关系将所述发票流数据导入图数据库中,包括:将从清洗后待存储发票数据中的发票代码、开票时间、金额、税额导入图数据库并添加到所述关联关系上,构建所述第一节点和第二节点之间的发票流关系。6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:乔媛媛邱宇辰林文辉舒南飞杨洁
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1