一种文件字符集解析转码方法、装置及介质制造方法及图纸

技术编号:35994261 阅读:53 留言:0更新日期:2022-12-17 23:10
本发明专利技术公开了一种文件字符集解析转码方法、装置及介质,所述方法包括以下步骤:配置文件解码算法、解码分析算法和转码验证算法;获取上游供数系统的文件编码情况,基于文件编码情况、文件解码算法和解码分析算法进行选择性转码操作,得到第一待验证文件;基于第一待验证文件调用转码验证算法,得到待使用数据文件;本发明专利技术能够当由于数据库技术更替,导致的上游供数系统所供文件编码格式不统一,以及上游供数系统进行供数文件的编码格式发生变化时,使程序加载数据文件自动化匹配文件编码,自动的对不统一或错误的编码进行对应转换和验证,并根据验证结果进行选择性二次转码避免了国产数据库无法加载数据文件,或者加载数据就会产生乱码的情况。就会产生乱码的情况。就会产生乱码的情况。

【技术实现步骤摘要】
一种文件字符集解析转码方法、装置及介质


[0001]本专利技术涉及数据导入处理
,具体的,本专利技术应用于数据库的数据编码处理领域,特别是涉及一种文件字符集解析转码方法、装置及介质。

技术介绍

[0002]现有技术中,将上游数据导入数据库的方法是采用oracle自带的sqlload工具进行导入;而随着技术国产化进程的推进,oracle数据库将被国产化数据库所取代,在这个过程中所有涉及到oracle的技术以及加载数据文件工具的系统将发生更替;由于这种数据库的技术更替,会导致上游供数系统所供文件编码格式不统一,以及上游供数系统进行供数文件的编码格式发生变化,这最终会导致国产数据库无法加载数据文件,或者加载数据就会产生乱码的情况。

技术实现思路

[0003]本专利技术的目的在于,针对现有技术中的上述问题,提供一种文件字符集解析转码方法、装置及介质,进而解决现有技术中由于数据库技术更替,导致的上游供数系统所供文件编码格式不统一,以及上游供数系统进行供数文件的编码格式发生变化,最终导致的国产数据库无法加载数据文件,或者加载数据就会产生乱码的情况的问题。
[0004]为解决上述技术问题,本专利技术的具体技术方案如下:
[0005]一方面,本专利技术提供一种文件字符集解析转码方法,包括以下步骤:
[0006]算法配置:
[0007]配置文件解码算法、解码分析算法和转码验证算法;
[0008]解析转码:
[0009]获取上游供数系统的文件编码情况,基于所述文件编码情况、所述文件解码算法和所述解码分析算法进行选择性转码操作,得到第一待验证文件;
[0010]转码验证:
[0011]基于所述第一待验证文件调用所述转码验证算法,得到待使用数据文件。
[0012]作为一种改进的方案,所述上游供数系统的文件编码情况包括:第一情况和第二情况;
[0013]所述第一情况为所述上游供数系统的文件编码格式非统一;
[0014]所述第二情况为所述上游供数系统中存在文件编码格式变更。
[0015]作为一种改进的方案,所述基于所述文件编码情况、所述文件解码算法和所述解码分析算法进行选择性转码操作,得到第一待验证文件,包括:
[0016]识别所述文件编码情况;
[0017]所述文件编码情况为所述第一情况或所述第二情况时,基于所述文件解码算法和所述解码分析算法执行所述选择性转码操作,得到所述第一待验证文件。
[0018]作为一种改进的方案,所述选择性转码操作,包括:
[0019]基于所述上游供数系统调用所述文件解码算法,得到第一供数文件和第一编码格式;
[0020]基于所述第一供数文件和所述第一编码格式调用所述解码分析算法,得到所述第一待验证文件。
[0021]作为一种改进的方案,所述文件解码算法,包括:
[0022]获取上游供数系统的上游供数文件;
[0023]解析所述上游供数文件的文件编码格式;
[0024]设定所述上游供数文件为所述第一供数文件;
[0025]设定所述文件编码格式为所述第一编码格式。
[0026]作为一种改进的方案,所述解码分析算法,包括:
[0027]获取第一需求文件编码格式;
[0028]比对所述第一编码格式与所述第一需求文件编码格式是否匹配;
[0029]若匹配,则设定所述第一供数文件为所述第一待验证文件;
[0030]若非匹配,则将所述第一供数文件转换为与所述第一需求文件编码格式相匹配的第二供数文件,并设定所述第二供数文件为所述第一待验证文件。
[0031]作为一种改进的方案,所述转码验证算法,包括:
[0032]设置文件验证函数;
[0033]调用所述文件验证函数验证所述第一待验证文件的文件合格性;
[0034]基于所述文件合格性、所述解码分析算法和所述第一待验证文件生成所述待使用数据文件。
[0035]作为一种改进的方案,所述基于所述文件合格性、所述解码分析算法和所述第一待验证文件生成所述待使用数据文件,包括:
[0036]识别所述文件合格性;
[0037]若所述文件合格性为合格,则设定所述第一待验证文件为所述待使用数据文件;
[0038]若所述文件合格性为非合格,则基于所述解码分析算法获取第二需求文件编码格式;基于所述解码分析算法将所述第一待验证文件转换为与所述第二需求文件编码格式相匹配的第三供数文件;令所述第三供数文件作为第二待验证文件,并基于所述第二待验证文件调用所述转码验证算法。
[0039]另一方面,本专利技术还提供一种文件字符集解析转码装置,包括:
[0040]算法配置单元、解析转码单元和转码验证单元;
[0041]所述算法配置单元,用于配置文件解码算法、解码分析算法和转码验证算法;
[0042]所述解析转码单元,用于获取上游供数系统的文件编码情况,并基于所述文件编码情况、所述文件解码算法和所述解码分析算法进行选择性转码操作,得到第一待验证文件;
[0043]所述转码验证单元,用于基于所述第一待验证文件调用所述转码验证算法,得到待使用数据文件。
[0044]另一方面,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述文件字符集解析转码方法的步骤。
[0045]本专利技术技术方案的有益效果是:
[0046]1、本专利技术所述的文件字符集解析转码方法,可以实现当由于数据库技术更替,导致的上游供数系统所供文件编码格式不统一,以及上游供数系统进行供数文件的编码格式发生变化时,使程序加载数据文件自动化匹配文件编码,自动的对不统一或错误的编码进行对应转换和验证,并根据验证结果进行选择性二次转码,最终可以减少手工转码处理的次数,从而大大增加了时效性和灵活性,并且本专利技术易于配置和开发,且易于拓展,最终避免了国产数据库无法加载数据文件,或者加载数据就会产生乱码的情况,减少了系统开发维护成本,减少因人工操作而造成的错误率,弥补了现有技术的空缺。
[0047]2、本专利技术所述的文件字符集解析转码装置,可以通过算法配置单元、解析转码单元和转码验证单元的相互配合,进而实现当由于数据库技术更替,导致的上游供数系统所供文件编码格式不统一,以及上游供数系统进行供数文件的编码格式发生变化时,使程序加载数据文件自动化匹配文件编码,自动的对不统一或错误的编码进行对应转换和验证,并根据验证结果进行选择性二次转码,最终可以减少手工转码处理的次数,从而大大增加了时效性和灵活性,并且本专利技术易于配置和开发,且易于拓展,最终避免了国产数据库无法加载数据文件,或者加载数据就会产生乱码的情况,减少了系统开发维护成本,减少因人工操作而造成的错误率,弥补了现有技术的空缺。
[0048]3、本专利技术所述的计算机可读存储介质,可以实现引导算法配置单元、解析转码单元和转码验证单元进行配合,进而实现本专利技术所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件字符集解析转码方法,其特征在于,包括以下步骤:算法配置:配置文件解码算法、解码分析算法和转码验证算法;解析转码:获取上游供数系统的文件编码情况,基于所述文件编码情况、所述文件解码算法和所述解码分析算法进行选择性转码操作,得到第一待验证文件;转码验证:基于所述第一待验证文件调用所述转码验证算法,得到待使用数据文件。2.根据权利要求1所述的一种文件字符集解析转码方法,其特征在于:所述上游供数系统的文件编码情况包括:第一情况和第二情况;所述第一情况为所述上游供数系统的文件编码格式非统一;所述第二情况为所述上游供数系统中存在文件编码格式变更。3.根据权利要求2所述的一种文件字符集解析转码方法,其特征在于:所述基于所述文件编码情况、所述文件解码算法和所述解码分析算法进行选择性转码操作,得到第一待验证文件,包括:识别所述文件编码情况;所述文件编码情况为所述第一情况或所述第二情况时,基于所述文件解码算法和所述解码分析算法执行所述选择性转码操作,得到所述第一待验证文件。4.根据权利要求3所述的一种文件字符集解析转码方法,其特征在于:所述选择性转码操作,包括:基于所述上游供数系统调用所述文件解码算法,得到第一供数文件和第一编码格式;基于所述第一供数文件和所述第一编码格式调用所述解码分析算法,得到所述第一待验证文件。5.根据权利要求4所述的一种文件字符集解析转码方法,其特征在于:所述文件解码算法,包括:获取上游供数系统的上游供数文件;解析所述上游供数文件的文件编码格式;设定所述上游供数文件为所述第一供数文件;设定所述文件编码格式为所述第一编码格式。6.根据权利要求4所述的一种文件字符集解析转码方法,其特征在于:所述解码分析算法,包括:获取第一需求文件编码格式;比对所述第一编码格式与所述第一需求文件编码格式是否匹配;若匹配,则设定...

【专利技术属性】
技术研发人员:高强王在印胡焱常绍盈袭祥亮
申请(专利权)人:浪潮金融信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1