一种自动辨识文字编码的装置及其方法制造方法及图纸

技术编号：2834582 阅读：200 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种自动辨识文字编码的装置与方法，该自动辨识文字编码装置包括编码数据库、读取模块、比对模块、判别模块及转换模块，转换模块中设有编码对照表以及撷取器；编码数据库和读取模块分别与比对模块连接，比对模块和判别模块相连，判别模块与转换模块连通。编码数据库储存对应于复数个编码方式的复数个编码资料；读取模块依据编码方式之一的内定编码读取文件，并由文件的编码与内定编码不符的部分产生差异段落；比对模块将异段落与编码资料进行比对，产生复数个符合程度；判别模块依据符合程度的最高者，判别为编码方式之一的原始编码；转换模块将差异段落由原始编码转换为内定编码，以显示文件的全部。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是一种辨识文字编码的装置与方法，特别是一种自动辨识文字编码的装置与方法。
技术介绍
随着电子信息快速发展，掌上型电子消费产品所提供的便捷性，使掌上型电子消费产品日趋受到大众的青睐。掌上型电子消费产品的种类繁多，包括电子辞典、掌上型计算机(Handheld Personal Computer, HPC)、个人数字助理(Personal Digital Assistant, PDA)等。同时，使用者对掌上型电子消费产品所能提供的功能要求也愈来愈高。因此，未来掌上型电子消费产品是否能以使用者的需求为导向，提供功能越多使用上愈便利，实已成为掌上型电子消费产品能否成功打入市场的重要筹码。掌上型电子消费产品通常具有一显示屏，可让使用者通过该显示屏阅读多种文本文件。但目前文字编码种类繁多，即使是读取纯文字文件，也需事先在系统设定中选定好开启档案的文字编码方式，否则读入的文字文件会成为乱码而无法正确显示。此种状况在需要打开编码各异的多个文字文件时，就变得非常麻烦。例如，要分别开启一个BIG 5编码的文字文件、一个GB 编码的文字文件、以及一个UTF-8编码的文字文件，前后可能必须分别到系统设定中做三次设定才行。所以当这些掌上型电子消费产品用来阅读文件时，例如Textviewer、 MP3 LRC歌词等，因文件和产品主机使用的文字编码方式可能会有所不同，造成主机会显示为乱码，使得使用者无法正常阅读。此时，使用者必须如上所述，自行判断文件属于何种编码方式，将文件重新制作成相同编码方式的档案，或者通过相关转换软件进行手动转换。加上，如果遇...

【技术保护点】
一种自动辨识文字编码的装置，其特征在于，该装置包括：一编码数据库，用于储存对应于复数个编码方式的复数个编码资料；一读取模块，用于依据编码数据库的编码方式之一的内定编码读取文件，并由文件的编码与内定编码不符的部份产生差异段落，其中，内定编码为正确显示字符的文字编码；一比对模块，用于将差异段落与编码资料进行比对，产生复数个符合程度；一判别模块，用于依据符合程度中最高者，由编码方式判别原始编码；所述的原始编码就是读取模块所读取文件的差异段落的编码方式；一转换模块，将差异段落由原始编码转换为内定编码，以显示文件的全部；该转换模块中设有编码对照表以及撷取器；编码数据库和读取模块分别与比对模块连接，比对模块和判别模块相连，判别模块与转换模块连通。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈淮琰，赵崇，赵珺，
申请(专利权)人：无敌科技西安有限公司，
类型：发明
国别省市：87[中国|西安]

全部详细技术资料下载我是这个专利的主人