乱码处理方法和装置制造方法及图纸

技术编号:18417655 阅读:24 留言:0更新日期:2018-07-11 09:21
本发明专利技术实施例公开了一种乱码处理方法和装置,用于方便消除文本数据的乱码。本发明专利技术实施例方法包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与该乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。这样,对于包括乱码的文本数据,将其与对应关系的乱码进行比较,若文本数据包括该对应关系的乱码,则可使用该对应关系的操作将该乱码从该文本数据中消除,这样的乱码消除方法实现起来方便快捷,无需开发人员和运维人员的介入即可实现。

Random code processing method and device

The embodiment of the invention discloses a garbled code processing method and device, which is used for conveniently eliminating the chaotic code of the text data. The method of embodiment of the invention includes: obtaining text data, determining whether the text data includes random codes in a pre established corresponding relationship, the corresponding relationship includes the corresponding relationship between the chaotic code and the operation; if the text data includes the chaotic code in the corresponding relation, the root according to the corresponding relationship is used with the code. The corresponding operation processes the text data to eliminate the garbled code in the text data. In this way, for the textual data that includes the random code, compare the random code with the corresponding relation. If the text data includes the random code of the corresponding relation, the chaotic code can be removed from the text data by the operation of the corresponding relation, so the method of eliminating the chaotic code is realized easily and quickly without the developers and the operation and maintenance. The person's intervention can be realized.

【技术实现步骤摘要】
乱码处理方法和装置
本专利技术涉及数据处理领域,尤其涉及一种乱码处理方法和装置。
技术介绍
在通过设备采集得到的文本数据中,因采集过程的问题或设备的原因,采集到的数据往往会出现乱码。例如,在IPTV数据处理中,由于数据源可能是通过设备采集而得到,得到的数据可能会出来乱码,如下表一所示:表一:频道观看人数观看时长华夏卫视~~10002300中央##频道A20004000华夏%@卫视30005300xx4486e1005000用户在面对这些文本数据中的乱码时,往往是要开发人员或运维人员介入,对数据采集的设备或算法等进行优化改进,这样的解决方式往往花费较多的时间,且较麻烦。
技术实现思路
本专利技术实施例提供了一种乱码处理方法和装置,用于方便消除文本数据的乱码。为了解决上述技术问题,本专利技术实施例提供了以下技术方案:一种乱码处理方法,包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述文本数据中的乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。为了解决上述技术问题,本专利技术实施例还提供了以下技术方案:一种乱码处理装置,包括:获取单元,用于获取文本数据;判断单元,用于判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;处理单元,用于若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。从以上技术方案可以看出,本专利技术实施例具有以下优点:获取文本数据后,判断文本数据是否包括预先建立的对应关系中的乱码,该对应关系包括乱码和操作的对应关系。若文本数据包括对应关系中的乱码,则根据对应关系,使用与该乱码对应的操作对文本数据进行处理,从而即可消除文本数据中的乱码。这样,对于包括乱码的文本数据,将其与对应关系的乱码进行比较,若文本数据包括该对应关系的乱码,则可使用该对应关系的操作将该乱码从该文本数据中消除,这样的乱码消除方法实现起来方便快捷,无需开发人员和运维人员的介入即可实现。附图说明图1为本专利技术一实施例提供的一种乱码处理方法的方法流程图;图2为本专利技术另一实施例提供的一种乱码处理方法的方法流程图;图3为本专利技术另一实施例提供的一种乱码处理装置的结构示意图。具体实施方式本专利技术实施例提供了一种乱码处理方法和装置,用于方便消除文本数据的乱码。图1为本专利技术实施例提供的一种乱码处理方法的方法流程图。参阅图1,本专利技术实施例的方法包括:步骤101:获取文本数据;步骤102:判断文本数据是否包括预先建立的对应关系中的乱码,该对应关系包括乱码和操作的对应关系;若文本数据包括对应关系中的乱码,则执行步骤103。步骤103:根据对应关系,使用与该乱码对应的操作对文本数据进行处理,以消除文本数据中的乱码。可选地,对应关系包括至少两种类型,不同类型的对应关系对应于不同类型的操作和不同等级的优先级;判断文本数据是否包括预先建立的对应关系中的乱码,包括:根据优先级的等级顺序,由先到后使用不同类型的对应关系判断文本数据是否包括对应关系中的乱码。可选地,对应关系包括第一对应关系、第二对应关系、第三对应关系和第四对应关系,第一对应关系包括第一乱码和第一操作的对应关系,第一操作为将包括第一乱码的待处理文本数据替换为第一文本,第一乱码包括待处理文本数据中的所有字符;第二对应关系包括第二乱码和第二操作的对应关系,第二操作为将包括第二乱码的待处理文本数据替换为第二文本,第二乱码为待处理文本数据中的部分字符;第三对应关系包括第三乱码和第三操作的对应关系,第三操作为将第三乱码从待处理文本数据中删除;第四对应关系包括第四乱码和第四操作的对应关系,第四操作为将包括第四乱码的待处理文本数据进行隐藏。可选地,对应关系的优先级等级由高到低依次为:第一对应关系、第二对应关系、第三对应关系和第四对应关系。可选地,对应关系的数目包括多个,每一对应关系还包括第一预设指标,文本数据还包括第二预设指标,判断文本数据是否包括预先建立的对应关系中的乱码之前,本专利技术实施例的方法还包括:从该多个对应关系中确定第一预设指标与第二预设指标对应的目标对应关系;判断文本数据是否包括预先建立的对应关系中的乱码,包括:判断文本数据是否包括目标对应关系中的乱码。可选地,第一预设指标为对应关系的第一建立时间,第二预设指标为文本数据的第二建立时间。可选地,对应关系的数目包括多个,每一对应关系还包括用户名,判断文本数据是否包括预先建立的对应关系中的乱码之前,本专利技术实施例的方法还包括:获取当前操作用户的用户名;从该多个对应关系中确定用户名与当前操作用户的用户名相同的对应关系;判断文本数据是否包括预先建立的对应关系中的乱码,包括:判断文本数据是否包括确定出的对应关系中的乱码。综上所述,获取文本数据后,判断文本数据是否包括预先建立的对应关系中的乱码,该对应关系包括乱码和操作的对应关系。若文本数据包括对应关系中的乱码,则根据对应关系,使用与该乱码对应的操作对文本数据进行处理,从而即可消除文本数据中的乱码。这样,对于包括乱码的文本数据,将其与对应关系的乱码进行比较,若文本数据包括该对应关系的乱码,则可使用该对应关系的操作将该乱码从该文本数据中消除,这样的乱码消除方法实现起来方便快捷,无需开发人员和运维人员的介入即可实现。图2为本专利技术实施例提供的一种乱码处理方法。参考上述内容,以及参阅图2,下面即对图2所示的实施例加以说明。在对图2所示的实施例的方法的流程进行描述之前,先对本专利技术实施例的方法用到的对应关系进行说明,以作铺垫。在本专利技术实施例的方法中为了消除获取到的文本数据中的乱码,需要用到对应关系,该对应关系包括多个维度,该对应关系主要包括乱码和操作的对应关系。该对应关系的乱码用于与文本数据中的字符进行匹配,匹配是否相同,若匹配为相同,则执行该对应关系中的与该乱码对应的操作,该操作包括但不限于替换文本数据为预设的文本、删除乱码、隐藏包括该乱码的文本数据等等。为了将文本数据替换为预设的文本,该对应关系还包括与乱码对应的预设文本维度。可以理解,该对应关系的维度还可以包括多种信息,例如建立时间、用户名等等。在本专利技术有的实施例中,对不同的对应关系还可以分配优先级等级,根据不同的优先级来决定对不同的对应关系的使用顺序。即,对应关系包括至少两种类型,不同类型的对应关系对应于不同类型的操作和不同等级的优先级。根据这些优先级的等级顺序,对这些不同类型的对应关系逐一进行选择,以选择出的对应关系执行后续的判断文本数据是否包括预先建立的对应关系中的乱码的步骤。关于对应关系的具体情形,例如可以如下:对应关系包括第一对应关系、第二对应关系、第三对应关系和第四对应关系。1.1第一对应关系包括第一乱码和第一操作的对应关系。第一操作为将包括第一乱码的待处理文本数据替换为第一文本,第一乱码包括待处理文本数据中的所有字符。即,第一对应关系包括第一乱码、第一文本、和第一操作三者的对应关系,若文本数据包括第一乱码,且文本数据的所有字符为该第一乱码,即文本数据为第一乱码,则根据该第一操作,使用第一文本替换掉文本数据。本文档来自技高网...

【技术保护点】
1.一种乱码处理方法,其特征在于,包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。

【技术特征摘要】
1.一种乱码处理方法,其特征在于,包括:获取文本数据;判断所述文本数据是否包括预先建立的对应关系中的乱码,所述对应关系包括乱码和操作的对应关系;若所述文本数据包括所述对应关系中的乱码,则根据所述对应关系,使用与所述乱码对应的操作对所述文本数据进行处理,以消除所述文本数据中的乱码。2.根据权利要求1所述的方法,其特征在于,所述对应关系包括至少两种类型,不同类型的对应关系对应于不同类型的操作和不同等级的优先级;所述判断所述文本数据是否包括预先建立的对应关系中的乱码,包括:根据所述优先级的等级顺序,由先到后使用不同类型的对应关系判断所述文本数据是否包括对应关系中的乱码。3.根据权利要求1所述的方法,其特征在于,所述对应关系包括第一对应关系、第二对应关系、第三对应关系和第四对应关系,所述第一对应关系包括第一乱码和第一操作的对应关系,所述第一操作为将包括所述第一乱码的待处理文本数据替换为第一文本,所述第一乱码包括所述待处理文本数据中的所有字符;所述第二对应关系包括第二乱码和第二操作的对应关系,所述第二操作为将包括所述第二乱码的待处理文本数据替换为第二文本,所述第二乱码为所述待处理文本数据中的部分字符;所述第三对应关系包括第三乱码和第三操作的对应关系,所述第三操作为将所述第三乱码从待处理文本数据中删除;所述第四对应关系包括第四乱码和第四操作的对应关系,所述第四操作为将包括所述第四乱码的待处理文本数据进行隐藏。4.根据权利要求3所述的方法,其特征在于,所述对应关系的优先级等级由高到低依次为:所述第一对应关系、所述第二对应关系、所述第三对应关系和所述第四对应关系。5.根据权利要求1至4任一项所述的方法,其特征在于,所述对应关系的数目包括多个,每一对应关系还包括第一预设指标,所述文本数据还包括第二预设指标,所述判断所述文本数据是否包括预先建立的对应关系中的乱码之前,所述方法还包括:从所述多个对应关系中确定所述第一预设指标与所述第二预设指标对应的目标对应关系;所述判断所述文本数据是否包括预先建立的对应关系中的乱码,包括:判断所述文本数据是否包括所述目标对...

【专利技术属性】
技术研发人员:焦张波
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1