【技术实现步骤摘要】
一种自然场景图片中文本检测方法、系统及设备
本申请涉及文字检测
,尤其涉及一种自然场景图片中文本检测方法、系统及设备。
技术介绍
自然场景图片是指由各种拍摄设备如照相机、手机等,没有特定限制条件下,直接对生活中真实存在的场景拍摄下来的图片。在自然场景图像中寻找文字区域是很有必要的,这些文字囊括了日常生活中许多有用且重要的信息,比如街道牌、交通指示牌等,对于辅助获取场景信息很有帮助。现有技术中存在一些对自然场景图片进行文字检测的方法。例如,基于连通区域的文本检测技术,原理是利用文本信息区域中相同颜色、结构等特征来生成文本连通域,然后使用人工设计的规则或者分类器进行分类。该技术往往需要通过大量的训练样本来求得合适的分类器,进而检测出图像中的文本区域。还有包括基于神经网络的文本检测技术,原理是利用神经网络对大量文本图像样本进行学习训练,通过不断地学习来修正神经网络各层的连接权重,提升准确性,从而得到这些文本中较为稳定的特征,进而检测并得到图像中的文本信息。该技术主要缺点是算法本身比较复杂,且搭建神经网 ...
【技术保护点】
1.一种自然场景图片中文本检测方法,其特征在于,包括:/n对待测图像进行预处理;/n对所述预处理后的待测图像进行数据转化,得到包含像素点数值及对应坐标的数据集;/n采用DBSCAN聚类算法对所述数据集进行聚类,生成不同类的数据集;/n采用Alpha Shape算法获取聚类后所述待测图像的感兴趣区域;/n检测所述感兴趣区域的内容,提取相应的文字信息。/n
【技术特征摘要】
1.一种自然场景图片中文本检测方法,其特征在于,包括:
对待测图像进行预处理;
对所述预处理后的待测图像进行数据转化,得到包含像素点数值及对应坐标的数据集;
采用DBSCAN聚类算法对所述数据集进行聚类,生成不同类的数据集;
采用AlphaShape算法获取聚类后所述待测图像的感兴趣区域;
检测所述感兴趣区域的内容,提取相应的文字信息。
2.根据权利要求1所述的自然场景图片中文本检测方法,其特征在于,所述对待测图像进行预处理具体包括:
将所述待测图像装换成灰度图;
将所述灰度图进行二值化处理;
将二值化处理后的灰度图进行腐蚀和膨胀处理。
3.根据权利要求1所述的自然场景图片中文本检测方法,其特征在于,所述对所述预处理后的待测图像进行数据转化,得到包含像素点数值及对应坐标的数据集具体为:
获取所述预处理后的待测图像中每个像素点的像素值,以及像素值不为零的像素点的坐标,形成所述数据集。
4.根据权利要求1所述的自然场景图片中文本检测方法,其特征在于,所述采用DBSCAN聚类算法对所述数据集进行聚类,生成不同类的数据集具体包括:
选取所述数据集中未处理的像素点;
获取以所述像素点为圆心,以设定的距离为直径的圆内所有数值不为0的像素点个数;
若所述数值不为0的像素点的个数大于预设的阈值时,则将所述圆内的像素点归为一类。
5.根据权利要求1所述的自然场景图片中文本检测方法,其特征在于,所述采用AlphaShape算法获取聚类后所述待测图像的感兴趣区域具体包括:
对所述数据集中的像素点按照坐标进行排序;
从所述像素点中的一点A出发,找到与A的距离小于预设的距离值的点B,以AB为起始边;
以B为原点,以所述预设的距离值为直径画圆,统计圆内的N个像素点得到BCi向量,其中0<i<N;以AB向量为基准进行极坐标方向排序,即按照BCi向量与AB向量的夹角大小进行排序;建立以BCi为直径的圆,若圆内不存在除Ci外的C0~CN点,则以BCi为新边;
以Ci为原点继续寻找新边,直到找不到新边或找到已经做过边的像素点为止。
6.一种自然场景图片中文本检测系统,其特征在于,包...
【专利技术属性】
技术研发人员:谭北海,罗林江,余荣,张浩川,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。