乱码处理方法、装置及存储介质制造方法及图纸

技术编号:34988265 阅读:54 留言:0更新日期:2022-09-21 14:33
本申请提供一种乱码处理方法、装置及存储介质,所述方法包括:基于源数据库中的待迁移数据,确定异常字段,基于所述异常字段,确定异常字符,基于所述源数据库与目标数据库的字符集,确定所述异常字符对应的正确编码,并将所述正确编码录入所述目标数据库,能够高效、准确地解决数据在不同字符集的数据库之间进行迁移时出现的数据库字符乱码问题。迁移时出现的数据库字符乱码问题。迁移时出现的数据库字符乱码问题。

【技术实现步骤摘要】
乱码处理方法、装置及存储介质


[0001]本申请涉及互联网应用
,尤其涉及一种乱码处理方法、装置及存储介质。

技术介绍

[0002]数据库字符集在创建数据库时指定,在创建后一般不能更改。由于不同地区之间字符集选择的差异,以及不同字符集之间的编码差异,导致数据库在进行数据的迁移、合并等操作时,经常出现字符乱码的现象,影响数据的一致性与有效性。
[0003]针对上述产生乱码现象,现有的处理方式有:
[0004]1)数据迁移完成后,由业务侧进行数据一致性核查,并逐个进行人工修复。
[0005]2)数据迁移完成后,按照字符编码对照表扫描目标数据库中是否存在生僻字。如发现则进行人工比对判断,确认是否为乱码,并逐个进行人工修复。
[0006]上述处理方式1)的缺点如下:
[0007]a)无法主动发现乱码问题,只能在发现问题后被动响应,对数据质量影响大。
[0008]b)发现乱码后,需要到原始数据库中查找对应的记录,从而确定正确字符,处理效率极低。
[0009]c)因无法确认乱码是否全部处理完成,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种乱码处理方法,其特征在于,包括:基于源数据库中的待迁移数据,确定异常字段;基于所述异常字段,确定异常字符;基于所述源数据库与目标数据库的字符集,确定所述异常字符对应的正确编码,并将所述正确编码录入所述目标数据库。2.根据权利要求1所述的乱码处理方法,其特征在于,所述基于源数据库中的待迁移数据,确定异常字段,包括:确定所述待迁移数据中的字符类型字段;将所述字符类型字段转换为通用字符集,基于转换结果确定所述异常字段。3.根据权利要求2所述的乱码处理方法,其特征在于,所述将所述字符类型字段转换为通用字符集,基于转换结果确定所述异常字段,包括:将各所述字符类型字段分别转换为通用字符集,若转换失败或报错,则将对应的字符类型字段确定为异常字段;将所述源数据库中每行对应的字符类型字段作为一个整体转换为通用字符集,若转换失败或报错,则将对应行中的字符类型字段确定为异常字段。4.根据权利要求1所述的乱码处理方法,其特征在于,所述基于所述异常字段,确定异常字符,包括:基于所述异常字段的元数据,确定所述异常字段对应的字符串;基于所述字符串,确定异常字符。5.根据权利要求1所述的乱码处理方法,其特征在于,所述基于所述源数据库与目标数据库的字符集,确定所述异常字符对应的正确编码,并将所述正确编码录入所述目标数据库,包括:确定所述异常字符对应的乱码类型;基于所述异常字符对应的乱码类型以及所述源数据库与目标数据库的字符集,确定所述异常字符对应的正确编码。6.根据权利要求5所述的乱码处理方法,其特征在于,所述基于所述异常字符对应的乱码类型以及所述源数据库与目标...

【专利技术属性】
技术研发人员:胡远明叶芝高何林艳吴岳檑匡蕾
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1