The present invention is the text localization and recognition method of network animation, the method makes full use of the structure of the network animation analysis technology, embedded encoding text in Web animation directly extracted, and the network animation is decomposed into basic shape, and the basic shape is the main elements of network animation. Next, for each basic shape, the basic shape of two stage text localization method, feature clustering heuristic connected domain in the non embedded text based on the noise filtering method based on stroke width histogram, reasonable non text connected domain filtering, so that all the non embedded text location, and then use the gradient histogram feature recognition embedded text. Finally, the identified non embedded text and embedded text are returned to the user.
【技术实现步骤摘要】
本专利技术提出了一种网络动画(Flash)中的文字定位及识别方法,可以用于网络动 画内容分析、监控、检索等
技术介绍
随着计算机技术及网络的发展,网络动画已经成为一种热门的媒体形式。尤其在 网络广告中,网络动画更是占据了主导地位。随之而来,针对网络动画的内容分析、检索、监 控的需求也越来越迫切。而网络动画中的文字无疑是实现这些需求的重要线索。当前,世界上已经有很多关于文字定位的研究。这些研究基本可以被分为两类基 于纹理的方法和基于连通域的方法。基于纹理的方法主要是利用Gabor滤波器、小波变换 等方法计算出区域的纹理特征,然后利用分类器来区分文本块与非文本块。而基于连通域 的方法首先要假设字符的前景颜色基本一致。因此,基于连通域的方法首先要执行颜色聚 类,将当前图形分解成若干颜色层,然后针对每个颜色层去执行连通域分析的方法,最终将 符合文字特点的连通域定位出来。目前这些方法在一定程度上解决了文字定位的问题,但是并不适合网络动画中文 字的特点。在网络动画中,大量存在多语言文本混排,正体字和斜体字混排,不同字体、大 小、颜色的文字混排。因此,传统算法不能很 ...
【技术保护点】
1.一种网络动画中的文字定位及识别方法,其特征在于,将网络动画结构分析技术与光学字符识别技术结合,直接提取网络动画文件中的编码内嵌文字,并利用一种基于连通域的启发合并、特征聚类的两阶段文字定位算法定位非内嵌文字,利用一种基于笔画宽度直方图的噪声过滤算法去除非文字连通域,最后利用基于梯度直方图特征识别非内嵌文字,该方法的步骤为:步骤S1:利用网络动画结构分析技术,分析给定网络动画文件的内容,如果存在DefineText标签,DefineText2标签之一,则将其中TextRecords域中FontID所定义的编码内嵌文字直接提取出来;步骤S2:利用网络动画结构分析技术,将网络 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:张树武,刘杰,梁伟,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。