文件版本识别方法、系统、终端设备及存储介质技术方案

技术编号:34324415 阅读:65 留言:0更新日期:2022-07-31 00:50
本发明专利技术提供了一种文件版本识别方法、系统、终端设备及存储介质,该方法包括:对待识别文件流进行分段得到分段文件流,并对各分段文件流进行字节错位处理;将各分段文件流分别与预设规则字节进行字节匹配;若任一所述分段文件流与所述预设规则字节的字节匹配成功,则分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配,所述版本号特征值用于表征对应的文件版本号;分别获取各分段文件流匹配到的版本号特征值,并根据获取到的所述版本号特征值的优先级,确定所述待识别文件的版本号。本发明专利技术通过分别获取各分段文件流匹配到的版本号特征值,基于获取到的版本号特征值的优先级,能有效地确定到待识别文件的版本号。能有效地确定到待识别文件的版本号。能有效地确定到待识别文件的版本号。

Document version identification method, system, terminal device and storage medium

【技术实现步骤摘要】
文件版本识别方法、系统、终端设备及存储介质


[0001]本专利技术涉数据处理
,尤其涉及一种文件版本识别方法、系统、终端设备及存储介质。

技术介绍

[0002]建筑信息模型(Building Information Modelling,BIM)以三维数字化技术为基础,集成了工程项目规划、设计、施工和运维各个阶段信息。以Autodesk Revit为代表的BIM设计专业软件,走在了BIM研究、应用的前沿,目前作为一套成熟的BIM模型解决方案,占据了国内外主流市场。随着BIM技术的广泛应用和深入发展,利用Revit设计软件处理BIM模型,通过浏览器或者移动端在线查看BIM模型已经成为大型项目协同、运维的一项重要能力,这项技术就是BIM轻量化技术。
[0003]BIM轻量化技术将不同版本的Revit模型数据转换为一种加密的二三维格式,首要工作便是通过后台静默方式准确快速地识别出需要轻量化处理的Revit文件的版本,然后利用对应版本的轻量化程序进行后续处理。Revit文件的版本一旦识别错误,则可能直接导致后续轻量化操作失败。
[0004]现有的Revit文件版本识别过程中,一般采用编码读取的方式直接读取Revit文件流,并匹配关键字得到Revit文件的版本号,但由于采用编码读取的方式直接读取Revit文件流时,容易因字节错位形成乱码,导致Revit文件版本识别错误,降低了文件版本识别的准确性。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种文件版本识别方法、系统、终端设备及存储介质,旨在解决现有的Revit文件版本识别过程中,版本识别准确性较低的问题。
[0006]本专利技术实施例是这样实现的,一种文件版本识别方法,所述方法包括:
[0007]对待识别文件流进行分段,得到分段文件流,并对各分段文件流进行字节错位处理,所述字节错位处理后的相邻分段文件流之间存在字节重叠;
[0008]将各分段文件流分别与预设规则字节进行字节匹配;
[0009]若任一所述分段文件流与所述预设规则字节的字节匹配成功,则分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配,所述版本号特征值用于表征对应的文件版本号;
[0010]分别获取各分段文件流匹配到的版本号特征值,并根据获取到的所述版本号特征值的优先级,确定所述待识别文件的版本号。
[0011]更进一步的,所述对各分段文件流进行字节错位处理,包括:
[0012]针对除第一个分段文件流和最后一个分段文件流外的剩余分段文件流,根据预设字节错位数量,将字节起点向相邻的上一个分段文件流的字节终点进行错位重叠;
[0013]针对除第一个分段文件流和最后一个分段文件流外的剩余分段文件流,根据所述
预设字节错位数量,将字节终点向相邻的下一个分段文件流的字节起点进行错位重叠。
[0014]更进一步的,所述分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配,包括:
[0015]根据各版本号特征值的优先级对各版本号特征值进行排序,得到优先级排序表;
[0016]根据所述优先级排序表依序将各版本号特征值与所述分段文件流进行特征匹配。
[0017]更进一步的,所述根据所述优先级排序表依序将各版本号特征值与所述分段文件流进行特征匹配之后,还包括:
[0018]若所述版本号特征值与所述分段文件流的特征匹配成功,且所述版本号特征值的优先级是预设优先级,则直接根据所述版本号特征值确定所述待识别文件的版本号。
[0019]更进一步的,所述分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配之后,还包括:
[0020]若获取到的所述版本号特征值的优先级中,未存在所述预设优先级,则对所述待识别文件流进行字节偏移;
[0021]将字节偏移后的所述待识别文件流,返回执行所述进行分段,得到分段文件流,将各分段文件流分别与预设规则字节进行字节匹配的步骤及后续步骤。
[0022]更进一步的,所述对所述待识别文件流进行字节偏移,包括:
[0023]根据预设字节偏移数量,将所述待识别文件流的起始字节向后偏移。
[0024]更进一步的,所述根据获取到的所述版本号特征值的优先级,确定所述待识别文件的版本号,包括:
[0025]在获取到的所述版本号特征值中,将最高优先级的所述版本号特征值确定为目标特征值;
[0026]将所述目标特征值对应的版本号,确定为所述待识别文件的版本号。
[0027]本专利技术实施例的另一目的在于提供一种文件版本识别系统,所述系统包括:
[0028]字节错位单元,用于对待识别文件流进行分段,得到分段文件流,并对各分段文件流进行字节错位处理,所述字节错位处理后的相邻分段文件流之间存在字节重叠;
[0029]字节匹配单元,用于将各分段文件流分别与预设规则字节进行字节匹配;
[0030]特征匹配单元,用于若任一所述分段文件流与所述预设规则字节的字节匹配成功,则分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配,所述版本号特征值用于表征对应的文件版本号;
[0031]版本号确定单元,用于分别获取各分段文件流匹配到的版本号特征值,并根据获取到的所述版本号特征值的优先级,确定所述待识别文件的版本号。
[0032]本专利技术实施例的另一目的在于提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
[0033]本专利技术实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
[0034]本专利技术实施例,通过对各分段文件流进行字节错位处理,防止了待识别文件流中由于分段所导致的版本号被截断的现象,提高了文件版本识别的准确性,通过将各分段文件流分别与预设规则字节进行字节匹配,以达到对各分段文件流的初次版本识别的效果,
若任一分段文件流与预设规则字节的字节匹配成功,通过分别将预设特征列表中的版本号特征值与分段文件流进行特征匹配,以达到对分段文件流的二次版本识别的效果,进一步提高了文件版本识别的准确性,通过分别获取各分段文件流匹配到的版本号特征值,基于获取到的版本号特征值的优先级,能有效地确定到待识别文件的版本号,防止了由于采用编码读取的方式直接读取待识别文件流进行版本识别,所导致的版本识别准确性低下的现象。
附图说明
[0035]图1是本专利技术第一实施例提供的文件版本识别方法的流程图;
[0036]图2是本专利技术第一实施例提供的UTF

16LE编码文件特征的示意图;
[0037]图3是本专利技术第一实施例提供的版本号特征值的示意图;
[0038]图4是本专利技术第一实施例提供的对待识别文件流进行字节偏移的示意图;
[0039]图5是本专利技术第二实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件版本识别方法,其特征在于,所述方法包括:对待识别文件流进行分段,得到分段文件流,并对各分段文件流进行字节错位处理,所述字节错位处理后的相邻分段文件流之间存在字节重叠;将各分段文件流分别与预设规则字节进行字节匹配;若任一所述分段文件流与所述预设规则字节的字节匹配成功,则分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配,所述版本号特征值用于表征对应的文件版本号;分别获取各分段文件流匹配到的版本号特征值,并根据获取到的所述版本号特征值的优先级,确定所述待识别文件的版本号。2.如权利要求1所述的文件版本识别方法,其特征在于,所述对各分段文件流进行字节错位处理,包括:针对除第一个分段文件流和最后一个分段文件流外的剩余分段文件流,根据预设字节错位数量,将字节起点向相邻的上一个分段文件流的字节终点进行错位重叠;针对除第一个分段文件流和最后一个分段文件流外的剩余分段文件流,根据所述预设字节错位数量,将字节终点向相邻的下一个分段文件流的字节起点进行错位重叠。3.如权利要求1所述的文件版本识别方法,其特征在于,所述分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配,包括:根据各版本号特征值的优先级对各版本号特征值进行排序,得到优先级排序表;根据所述优先级排序表依序将各版本号特征值与所述分段文件流进行特征匹配。4.如权利要求3所述的文件版本识别方法,其特征在于,所述根据所述优先级排序表依序将各版本号特征值与所述分段文件流进行特征匹配之后,还包括:若所述版本号特征值与所述分段文件流的特征匹配成功,且所述版本号特征值的优先级是预设优先级,则直接根据所述版本号特征值确定所述待识别文件的版本号。5.如权利要求4所述的文件版本识别方法,其特征在于,所述分别将预设特征列表中的版本号特征值与所述分段文件流进行特征匹配之后,还包括:若获取到的所...

【专利技术属性】
技术研发人员:刘云兵周梦罗小平柳堤
申请(专利权)人:厦门市建筑科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1