基于图像的语种识别方法及装置制造方法及图纸

技术编号:12470216 阅读:82 留言:0更新日期:2015-12-09 19:23
本发明专利技术提供了一种基于图像的语种识别方法及装置。所述语种识别方法包括:计算给定文字图像的图像特征;以及基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像上的文字所属的语种。本发明专利技术提供的基于图像的语种识别方法及装置通过图像特性自动判断给定文字所属的语种,识别精度高且速度快,此外还免去了人工辨识和指定语种的过程,因此可以极大提高文档处理、自动翻译等过程的效率。

【技术实现步骤摘要】

本专利技术涉及图像处理
,具体而言涉及一种基于图像的语种识别方法及装 置。
技术介绍
在世界范围内,不同国家、地区的人使用不同种类的语言,相应地,文字也各不相 同。因此,各种书籍、资料、文档以及物品上的文字所属的语种也千差万别(如中文、英文、 阿拉伯文和泰文等,样例见图1)。随着全球化的飞速发展,来自不同国家和地区的人员之 间的往来和交流日益频繁,而语言和文字的差异是一种严重的障碍。各种光学字符识别 (OCR)、自动翻译技术应运而生,且得到了大规模的普及和应用。 然而,现有的OCR和自动翻译技术和系统都假定文字所属的类别(也即语种)已 知。例如,ABBYY公司推出的OCR产品可以识别数十种语言的文字,但是需要用户事先指定 待识别文字的语种。因此,当语种未知或指定错误时,该类产品无法给出正确的识别结果。 另外,有一类技术可以从语音中自动判别语种以及一种采用总变化量因子的语种识别方法 及系统。然而,该类技术只能处理语音数据,无法应用于图像数据。总之,目前尚缺乏可以 从文字图像(见图1)中直接判断语种的技术和系统。
技术实现思路
针对现有技术的不足,一方面,本专利技术本文档来自技高网...

【技术保护点】
一种基于图像的语种识别方法,其特征在于,所述语种识别方法包括:计算给定文字图像的图像特征;以及基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像上的文字所属的语种。

【技术特征摘要】

【专利技术属性】
技术研发人员:姚聪周舒畅周昕宇徐梓哲印奇
申请(专利权)人:北京旷视科技有限公司北京小孔科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1