用于嵌入式浏览器的网页编码语言自动识别方法及装置制造方法及图纸

技术编号:3494685 阅读:613 留言:0更新日期:2012-04-11 18:40
本发明专利技术提出一种用于嵌入式浏览器的网页编码语言自动识别方法及装置,其中,该方法包括以下步骤:步骤一,从嵌入式浏览器的协议栈中获取部分网页数据和协议头;步骤二,解析网页数据和协议头,以获得指明网页编码的元数据;步骤三,利用从网页数据中获取的元数据和从协议头中获取的元数据,根据优先级判断第一次文本解析应该使用的编码;以及步骤四,根据所采用的编码解析当前数据块,并统计解析过程中出现的错误,并且在出现错误的情况下,再次选择编码进行解析。通过本发明专利技术的方法及装置,为嵌入式浏览器在有限的内存和计算能力范围内提供了一种效率和成功率较高的网页自动编码语言识别和解析方法。

【技术实现步骤摘要】

【技术保护点】
一种用于嵌入式浏览器的网页编码语言自动识别方法,其特征在于,包括以下步骤:S102,从所述嵌入式浏览器的协议栈中获取网页数据和协议头;S104,解析所述网页数据和所述协议头,以获得指明网页编码的元数据;以及S106, 利用从所述网页数据中获取的元数据和从所述协议头中获取的元数据,根据优先级判断第一次文本解析应该使用的编码;S108,根据所采用的编码解析当前数据块,并统计解析过程中出现的错误,并且在出现错误的情况下,再次选择编码进行解析。

【技术特征摘要】

【专利技术属性】
技术研发人员:谢曼
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1