【技术实现步骤摘要】
【技术保护点】
一种渐进层次认知的场景图像文本检测方法,其特征在于:借鉴人类认知的层次特点,在获得场景图像连通成分基础上,首先利用连通成分的空间相邻和排列关系组成不同的连通成分集合:单个连通成分、连通成分对和连通成分行;然后针对不同连通成分集合分别设计不同的特征,把不同连通成分集合的文本置信度作为后续连通成分集合的一种特征;通过连通成分集合的一致性认知假设和条件随机场模型监督学习每个层次的分类器参数,并依次计算连通成分的文本置信度;最终定位文本行;具体包括如下步骤:步骤1:在第一层分析中,提取单个连通成分的外观特征,用分类器监督学习并估计单个连通成分的文本置信度;步骤2:在第二层分析前,候选单个连通成分以空间位置关系,两两聚类形成连通成分对;步骤3:在第二层分析中,提取连通成分对的相似性特征和平均连通成分能量特征,用分类器监督学习并估计连通成分对的文本置信度;步骤4:在第三层分析前,候选连通成分对以相连关系和排列关系,形成连通成分行;步骤5:在第三层分析中,提取连通成分行的外观差异特征、梯度直方图特征以及所有单个连通成分能量特征均值和连通成分对能量特征均值,用分类器监督学习并最终判定出文本行。
【技术特征摘要】
【专利技术属性】
技术研发人员:刘跃虎,周刚,苏远歧,翟少卓,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。