【技术实现步骤摘要】
一种数据存储方法及装置
本专利技术涉及数据处理
,特别是涉及一种数据存储方法及装置。
技术介绍
随着税务信息化系统的使用,该系统的数据库中需要存储大量的发票数据。现有技术中,一般使用关系型数据库存储发票数据。虽然上述关系型数据库可以实现大量发票数据的存储,但是由于关系型数据库的表结构固定、数据读写效率低下,在需要存储海量发票数据的情况下,以上述关系型数据库存储数据后难以满足用户对数据读写等方面的需求。
技术实现思路
本专利技术实施例的目的在于提供一种数据存储方法及装置,在需要存储海量发票数据的情况下,满足用户对数据读写方面的需求。具体技术方案如下:第一方面,本专利技术实施例提供了一种数据存储方法,所述方法包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点;在所述图数据库中建立所述第一节点与第二节点之间的关联关系;按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数 ...
【技术保护点】
1.一种数据存储方法,其特征在于,所述方法包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点;在所述图数据库中建立所述第一节点与第二节点之间的关联关系;按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数据的存储。
【技术特征摘要】
1.一种数据存储方法,其特征在于,所述方法包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及所述纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点;在所述图数据库中建立所述第一节点与第二节点之间的关联关系;按照所述关联关系将所述发票流数据导入图数据库中,实现所述待存储发票数据的存储。2.根据权利要求1所述的方法,其特征在于,所述干扰数据,包括以下数据中的至少一种:残缺的发票数据、错误的发票数据和重复的发票数据。3.根据权利要求1所述的方法,其特征在于,所述纳税方和负税方之间的发票流数据,包括以下数据中的至少一种:发票数据中的发票代码、发票号码、开票时间、金额、税额。4.根据权利要求1所述的方法,其特征在于,所述在用于存储数据的图数据库中确定所述纳税方对应的第一节点和所述负税方对应的第二节点,包括:查询用于存储数据的图数据库中是否存在表示所述纳税方的节点,若存在,直接将查询到的节点作为所述纳税方对应的第一节点,若不存在,在所述图数据库中创建所述纳税方对应的第一节点;查询图数据库中是否存在表示所述负税方的节点,若存在,直接将查询到的节点作为所述负税方对应的第二节点,若不存在,在所述图数据库中创建所述负税方对应的第二节点。5.根据权利要求3所述的方法,其特征在于,所述按照所述关联关系将所述发票流数据导入图数据库中,包括:将从清洗后待存储发票数据中的发票代码、开票时间、金额、税额导入图数据库并添加到所述关联关系上,构建所述第一节点和第二节点之间的发票流关系。6.根据权利要求1所述的...
【专利技术属性】
技术研发人员:乔媛媛,邱宇辰,林文辉,舒南飞,杨洁,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。