The embodiment of the invention discloses a garbled code processing method and device, which is used for conveniently eliminating the chaotic code of the text data. The method of embodiment of the invention includes: obtaining text data, determining whether the text data includes random codes in a pre established corresponding relationship, the corresponding relationship includes the corresponding relationship between the chaotic code and the operation; if the text data includes the chaotic code in the corresponding relation, the root according to the corresponding relationship is used with the code. The corresponding operation processes the text data to eliminate the garbled code in the text data. In this way, for the textual data that includes the random code, compare the random code with the corresponding relation. If the text data includes the random code of the corresponding relation, the chaotic code can be removed from the text data by the operation of the corresponding relation, so the method of eliminating the chaotic code is realized easily and quickly without the developers and the operation and maintenance. The person's intervention can be realized.
【技术实现步骤摘要】
乱码处理方法和装置
本专利技术涉及数据处理领域,尤其涉及一种乱码处理方法和装置。
技术介绍
在通过设备采集得到的文本数据中,因采集过程的问题或设备的原因,采集到的数据往往会出现乱码。例如,在IPTV数据处理中,由于数据源可能是通过设备采集而得到,得到的数据可能会出来乱码,如下表一所示:表一:频道观看人数观看时长华夏卫视~~10002300中央##频道A20004000华夏%@卫视30005300xx4486e1005000用户在面对这些文本数据中的乱码时,往往是要开发人员或运维人员介入,对数据采集的设备或算法等进行优化改进,这样的解决方式往往花费较多的时间,且较麻烦。
技术实现思路
本专利技术实施例提供了一种乱码处理方法和装置,用于方便消除文本数据的乱码。为了解决上述技术问题,本专利技术实施例提供了以下技术方案:一种乱码处理方法,包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述文本数据中的乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。为了解决上述技术问题,本专利技术实施例还提供了以下技术方案:一种乱码处理装置,包括:获取单元,用于获取文本数据;判断单元,用于判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;处理单元,用于若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。从以上技术方案可以 ...
【技术保护点】
1.一种乱码处理方法,其特征在于,包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。
【技术特征摘要】
1.一种乱码处理方法,其特征在于,包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。2.根据权利要求1所述的方法,其特征在于,所述对应关系包括至少两种类型,不同类型的对应关系对应于不同类型的操作和不同等级的优先级;所述判断所述文本数据是否包括预先建立的对应关系中的乱码,包括:根据所述优先级的等级顺序,由先到后使用不同类型的对应关系判断所述文本数据是否包括对应关系中的乱码。3.根据权利要求1所述的方法,其特征在于,所述对应关系包括第一对应关系、第二对应关系、第三对应关系和第四对应关系,所述第一对应关系包括第一乱码和第一操作的对应关系,所述第一操作为将包括所述第一乱码的待处理文本数据替换为第一文本,所述第一乱码包括所述待处理文本数据中的所有字符;所述第二对应关系包括第二乱码和第二操作的对应关系,所述第二操作为将包括所述第二乱码的待处理文本数据替换为第二文本,所述第二乱码为所述待处理文本数据中的部分字符;所述第三对应关系包括第三乱码和第三操作的对应关系,所述第三操作为将所述第三乱码从待处理文本数据中删除;所述第四对应关系包括第四乱码和第四操作的对应关系,所述第四操作为将包括所述第四乱码的待处理文本数据进行隐藏。4.根据权利要求3所述的方法,其特征在于,所述对应关系的优先级等级由高到低依次为:所述第一对应关系、所述第二对应关系、所述第三对应关系和所述第四对应关系。5.根据权利要求1至4任一项所述的方法,其特征在于,所述对应关系的数目包括多个,每一对应关系还包括第一预设指标,所述文本数据还包括第二预设指标,所述判断所述文本数据是否包括预先建立的对应关系中的乱码之前,所述方法还包括:从所述多个对应关系中确定所述第一预设指标与所述第二预设指标对应的目标对应关系;所述判断所述文本数据是否包括预先建立的对应关系中的乱码,包括:判断所述文本数据是否包括所述目标对...
【专利技术属性】
技术研发人员:焦张波,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。