基于图像的语种识别方法及装置制造方法及图纸

技术编号：12470216 阅读：82 留言：0更新日期：2015-12-09 19:23

本发明专利技术提供了一种基于图像的语种识别方法及装置。所述语种识别方法包括：计算给定文字图像的图像特征；以及基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像上的文字所属的语种。本发明专利技术提供的基于图像的语种识别方法及装置通过图像特性自动判断给定文字所属的语种，识别精度高且速度快，此外还免去了人工辨识和指定语种的过程，因此可以极大提高文档处理、自动翻译等过程的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，具体而言涉及一种基于图像的语种识别方法及装置。
技术介绍
在世界范围内，不同国家、地区的人使用不同种类的语言，相应地，文字也各不相同。因此，各种书籍、资料、文档以及物品上的文字所属的语种也千差万别（如中文、英文、阿拉伯文和泰文等，样例见图1)。随着全球化的飞速发展，来自不同国家和地区的人员之间的往来和交流日益频繁，而语言和文字的差异是一种严重的障碍。各种光学字符识别 (OCR)、自动翻译技术应运而生，且得到了大规模的普及和应用。然而，现有的OCR和自动翻译技术和系统都假定文字所属的类别（也即语种）已知。例如，ABBYY公司推出的OCR产品可以识别数十种语言的文字，但是需要用户事先指定待识别文字的语种。因此，当语种未知或指定错误时，该类产品无法给出正确的识别结果。另外，有一类技术可以从语音中自动判别语种以及一种采用总变化量因子的语种识别方法及系统。然而，该类技术只能处理语音数据，无法应用于图像数据。总之，目前尚缺乏可以从文字图像（见图1)中直接判断语种的技术和系统。
技术实现思路
针对现有技术的不足...

【技术保护点】
一种基于图像的语种识别方法，其特征在于，所述语种识别方法包括：计算给定文字图像的图像特征；以及基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像上的文字所属的语种。

【技术特征摘要】

【专利技术属性】
技术研发人员：姚聪，周舒畅，周昕宇，徐梓哲，印奇，
申请(专利权)人：北京旷视科技有限公司，北京小孔科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人