自动提取网址并自动打开网页的方法技术

技术编号：5350651 阅读：594 留言：0更新日期：2012-04-11 18:40

本发明专利技术揭示了一种自动提取网址并自动打开网页的方法，所述方法包括如下步骤：使用光学字符识别技术识别图像中的文字，并自动判断识别出来的文字中是否包含网址；如果包含网址则自动打开浏览网页的软件，自动连接网络并打开所述网址指向的网页。本发明专利技术提出的结合光学字符识别技术自动提取网址并自动打开网页的方法，使得用户可以通过拍摄打印在各种材料上的网址来自动打开所述网址指向的网页；该方法提高了人们使用互联网的便利性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于文字识别
，涉及一种打开网页的方法，尤其涉及一种结合光学字符识别技术。
技术介绍
目前摄像头已经在手机和微机中广泛使用，利用图像处理和光学字符识别(OCR， Optical Character Recognition)的原理，对相机拍摄或扫描仪扫描得到的图像进行处理和识别，获取图像中的文字的技术也已得到广泛使用，典型的如用手机中自带的相机拍摄名片的图像，通过图像处理和OCR技术识别出其中的文字来，并提取其中包含的姓名，电话等有用信息加入到地址簿中去。利用图像处理和光学字符识别技术来拍摄识别文字一般会有错误，对扫描的图像，因为图像很清楚错误会比较少，而对相机拍摄的图像，由于环境光线，拍摄时的聚焦，抖动等问题的存在不可避免地会造成图像的质量下降，进而造成OCR识别出来的文字中错误会比扫描的图像OCR出来的文字中错误多很多。而从光学字符技术的基本原理来说，对同类的，或者说拍摄质量相似的图像而言，需要进行辨别的不同字符的数量越多，错误可能性越大，比如说，在同样的图像上，如果只需要识别“0”到“9” 10个数字字符，其准确率会高于需要识别包括“0”到“9” 10个数字字符和“A”到“Z”在内的26个英文字符一共36个字符的准确率。也就是说，如果我们事先知道需要用OCR技术进行识别的文字的类型，就可以利用这个信息来限制需要OCR识别的字符个数，从而提高识别的准确率，减少出错的可能。比如说，如果我们事先知道需要识别的就是电话号码，那么我们在使用OCR技术进行识别的时候就可以只识别能合法出现在电话号码中的字符，从而提高识别...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：镇立新，罗希平，陈青山，曹超阳，
申请(专利权)人：上海合合信息科技发展有限公司，
类型：发明
国别省市：31

全部详细技术资料下载我是这个专利的主人