System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文件差异比对方法及装置制造方法及图纸_技高网

一种文件差异比对方法及装置制造方法及图纸

技术编号:40545490 阅读:8 留言:0更新日期:2024-03-05 19:02
本发明专利技术提供了一种文件差异比对方法及装置,可以应用于第一文件数据和第二文件数据的差异比对。第一文件数据和第二文件数据为油气管道SCADA系统的数据。该方法包括:获取第一文件数据和第二文件数据。根据第一文件数据通过第一算法确定第一摘要信息,根据第二文件数据通过第一算法确定第二摘要信息,第一算法用于以字节方式读取文件数据,并根据每个字节存储的数据生成文件数据对应的摘要信息。确定第一摘要信息与第二摘要信息是否一致。在第一摘要信息与第二摘要信息一致的情况下,确定第一文件数据和第二文件数据无差异。否则,确定第一文件数据和第二文件数据存在差异。这样,可以提高文件数据差异比对的效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及一种文件差异比对方法及装置


技术介绍

1、油气管道数据采集与监视控制(supervisory control and data acquisition,scada)系统是对油气管网进行集中调度管理的工具,是保证油气管网安全、平稳、高效运行的基础,也是油气长输管道自动化调控系统的核心。通过获取并分析油气管道scada系统的文件数据,可以实现油气管道日常生产调度和调控。

2、在实际应用中,会出现判断油气管道scada系统的两个文件数据是否存在差异的情况。通常,可以通过比较文件数据的属性信息(例如:文件的最后修改时间、文件的大小等)进行差异比对。或者,还可以通过哈希算法计算文件数据的摘要数据,通过比较两个文件数据分别对应的摘要数据以进行判断是否存在差异。

3、但是,上述通过比对文件数据属性信息的方法存在判断不准确的情况。并且,上述通过哈希算法的比对方法也存在效率不高的情况。由于哈希算法主要是针对于加密学,算法复杂,循环计算次数多,抗碰撞性高(即两个不同的输入数据得到相同的输出数据的概率)。并且,由于油气管道scada系统的文件数量较多,每个文件数据量较大,每次计算一遍文件数据对应的摘要数据,需要较长时间,已无法满足油气管道scada系统对实时性的要求,导致差异比对的效率降低。


技术实现思路

1、本专利技术所要解决的技术问题是油气管道scada系统的文件数据差异比对的效率低。

2、为解决上述技术问题,本专利技术提供了一种文件差异比对方法及装置。具体采用如下技术方案:

3、第一方面,本专利技术提供一种文件差异比对方法,可以应用于第一文件数据和第二文件数据的差异比对。其中,第一文件数据和第二文件数据为油气管道数据采集与监视控制scada系统的数据。具体的,该方法包括:首先,获取第一文件数据和第二文件数据。然后,根据第一文件数据通过第一算法确定第一摘要信息,根据第二文件数据通过第一算法确定第二摘要信息,第一算法用于以字节方式读取文件数据,并根据每个字节存储的数据生成文件数据对应的摘要信息。接下来,确定第一摘要信息与第二摘要信息是否一致。在第一摘要信息与第二摘要信息一致的情况下,确定第一文件数据和第二文件数据无差异,在第一摘要信息与第二摘要信息不一致的情况下,确定第一文件数据和第二文件数据存在差异。

4、该方法中,可以通过第一算法生成第一文件数据对应的第一摘要信息和第二文件数据对应的第二摘要信息。然后,根据第一摘要信息和第二摘要信息是否一致以判断第一文件数据和第二文件数据是否存在差异。由于不仅第一算法的抗碰撞性满足油气管道scada系统文件数据的要求,而且第一算法计算轮数远远小于哈希算法的计算轮数。这样,可以提高摘要信息的生成速度,从而提高了文件数据差异比对的效率。

5、结合第一方面,在一种可选择的实现方式中,文件数据包括多个字节,摘要信息包括:第一分组信息、第二分组信息、第三分组信息和第四分组信息,则第一算法包括:将多个字节中每个字节存储的数据相加,得到第一分组信息。将多个字节中每个字节存储的数据取反后再右移一位后相加,得到第二分组信息。将多个字节中位于奇数位的字节存储的数据右移一位后,与多个字节中位于偶数位的字节存储的数据取反后再右移一位后相加,得到第三分组信息。将多个字节中位于偶数位的字节存储的数据右移一位后,与多个字节中位于奇数位的字节存储的数据取反后再右移一位后相加,得到第四分组信息。根据第一分组信息、第二分组信息、第三分组信息和第四分组信息组合,确定文件数据对应的摘要信息。在本实现方式中,第一算法通过较少的计算轮数可以确定摘要信息,提高了摘要生成速度,进一步提高了文件数据差异比对的效率。

6、结合第一方面,在一种可选择的实现方式中,根据第一分组信息、第二分组信息、第三分组信息和第四分组信息组合,确定文件数据对应的摘要信息,包括:将第一分组信息、第二分组信息、第三分组信息和第四分组信息依次结合,组成摘要信息。

7、结合第一方面,在一种可选择的实现方式中,摘要信息的长度为160位。这样,摘要信息的长度能够满足应用于油气管道scada系统文件数据的需求。

8、结合第一方面,在一种可选择的实现方式中,第一分组信息的长度为40位,第二分组信息的长度为40位,第三分组信息的长度为40位,第四分组信息的长度为40位。

9、第二方面,本专利技术提供一种文件差异比对装置,可以应用于第一文件数据和第二文件数据的差异比对。其中,第一文件数据和第二文件数据为油气管道数据采集与监视控制scada系统的数据。具体的,该装置包括:获取模块、摘要信息生成模块和差异比对模块。其中,获取模块,用于获取第一文件数据和第二文件数据。摘要信息生成模块,用于根据第一文件数据通过第一算法确定第一摘要信息,根据第二文件数据通过第一算法确定第二摘要信息,第一算法用于以字节方式读取文件数据,并根据每个字节存储的数据生成文件数据对应的摘要信息。差异比对模块,用于确定第一摘要信息与第二摘要信息是否一致;在第一摘要信息与第二摘要信息一致的情况下,确定第一文件数据和第二文件数据无差异;在第一摘要信息与第二摘要信息不一致的情况下,确定第一文件数据和第二文件数据存在差异。

10、结合第二方面,在一种可选择的实现方式中,文件数据包括多个字节,摘要信息包括:第一分组信息、第二分组信息、第三分组信息和第四分组信息。则上述摘要信息生成模块,具体用于:将多个字节中每个字节存储的数据相加,得到第一分组信息。将多个字节中每个字节存储的数据取反后再右移一位后相加,得到第二分组信息。将多个字节中位于奇数位的字节存储的数据右移一位后,与多个字节中位于偶数位的字节存储的数据取反后再右移一位后相加,得到第三分组信息。将多个字节中位于偶数位的字节存储的数据右移一位后,与多个字节中位于奇数位的字节存储的数据取反后再右移一位后相加,得到第四分组信息。根据第一分组信息、第二分组信息、第三分组信息和第四分组信息组合,确定文件数据对应的摘要信息。

11、结合第二方面,在一种可选择的实现方式中,根据第一分组信息、第二分组信息、第三分组信息和第四分组信息组合,确定文件数据对应的摘要信息,包括:将第一分组信息、第二分组信息、第三分组信息和第四分组信息依次结合,组成摘要信息。

12、结合第二方面,在一种可选择的实现方式中,摘要信息的长度为160位。

13、结合第二方面,在一种可选择的实现方式中,第一分组信息的长度为40位,第二分组信息的长度为40位,第三分组信息的长度为40位,第四分组信息的长度为40位。

14、可以理解地,上述第二方面的文件差异比对装置所能达到的有益效果,可参考第一方面及其任一种可能的设计方式中的有益效果,此处不再赘述。

本文档来自技高网...

【技术保护点】

1.一种文件差异比对方法,其特征在于,应用于第一文件数据和第二文件数据的差异比对,所述第一文件数据和所述第二文件数据为油气管道数据采集与监视控制SCADA系统的数据,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述文件数据包括多个字节,所述摘要信息包括:第一分组信息、第二分组信息、第三分组信息和第四分组信息;

3.根据权利要求2所述的方法,其特征在于,所述根据所述第一分组信息、所述第二分组信息、所述第三分组信息和所述第四分组信息组合,确定所述文件数据对应的所述摘要信息,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述摘要信息的长度为160位。

5.根据权利要求4所述的方法,其特征在于,所述第一分组信息的长度为40位,所述第二分组信息的长度为40位,所述第三分组信息的长度为40位,所述第四分组信息的长度为40位。

6.一种文件差异比对装置,其特征在于,应用于第一文件数据和第二文件数据的差异比对,所述第一文件数据和所述第二文件数据为油气管道数据采集与监视控制SCADA系统的数据,所述装置包括:获取模块、摘要信息生成模块和差异比对模块;其中,

7.根据权利要求6所述的装置,其特征在于,所述文件数据包括多个字节,所述摘要信息包括:第一分组信息、第二分组信息、第三分组信息和第四分组信息;

8.根据权利要求7所述的装置,其特征在于,所述根据所述第一分组信息、所述第二分组信息、所述第三分组信息和所述第四分组信息组合,确定所述文件数据对应的所述摘要信息,包括:

9.根据权利要求6-8任一项所述的装置,其特征在于,所述摘要信息的长度为160位。

10.根据权利要求9所述的装置,其特征在于,所述第一分组信息的长度为40位,所述第二分组信息的长度为40位,所述第三分组信息的长度为40位,所述第四分组信息的长度为40位。

...

【技术特征摘要】

1.一种文件差异比对方法,其特征在于,应用于第一文件数据和第二文件数据的差异比对,所述第一文件数据和所述第二文件数据为油气管道数据采集与监视控制scada系统的数据,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述文件数据包括多个字节,所述摘要信息包括:第一分组信息、第二分组信息、第三分组信息和第四分组信息;

3.根据权利要求2所述的方法,其特征在于,所述根据所述第一分组信息、所述第二分组信息、所述第三分组信息和所述第四分组信息组合,确定所述文件数据对应的所述摘要信息,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述摘要信息的长度为160位。

5.根据权利要求4所述的方法,其特征在于,所述第一分组信息的长度为40位,所述第二分组信息的长度为40位,所述第三分组信息的长度为40位,所述第四分组信息的长度为40位。

6.一种文件差异比...

【专利技术属性】
技术研发人员:孙铁良李亚锋闫峰房凡秀咸玉龙高山邓小草
申请(专利权)人:国家石油天然气管网集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1