一种网络动画中的文字定位及识别方法技术

技术编号：6049714 阅读：258 留言：0更新日期：2012-04-11 18:40

本发明专利技术是一种网络动画中的文字定位及识别方法，该方法充分利用网络动画的结构分析技术，将网络动画中的内嵌编码文字直接提取出来，并将网络动画分解为基本形状，而基本形状是构成网络动画的主要元素。接下来针对每个基本形状，利用基于连通域的启发合并、特征聚类的两阶段文字定位方法定位基本形状中的非内嵌文字，再利用基于笔画宽度直方图的噪声过滤方法，合理地将非文字连通域过滤掉，从而将所有非内嵌文字定位出来，然后利用梯度直方图特征识别非内嵌文字。最后将识别出的非内嵌文字和内嵌文字返回给用户。

A method of text location and recognition in network animation

The present invention is the text localization and recognition method of network animation, the method makes full use of the structure of the network animation analysis technology, embedded encoding text in Web animation directly extracted, and the network animation is decomposed into basic shape, and the basic shape is the main elements of network animation. Next, for each basic shape, the basic shape of two stage text localization method, feature clustering heuristic connected domain in the non embedded text based on the noise filtering method based on stroke width histogram, reasonable non text connected domain filtering, so that all the non embedded text location, and then use the gradient histogram feature recognition embedded text. Finally, the identified non embedded text and embedded text are returned to the user.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术提出了一种网络动画(Flash)中的文字定位及识别方法，可以用于网络动画内容分析、监控、检索等

技术介绍
随着计算机技术及网络的发展，网络动画已经成为一种热门的媒体形式。尤其在网络广告中，网络动画更是占据了主导地位。随之而来，针对网络动画的内容分析、检索、监控的需求也越来越迫切。而网络动画中的文字无疑是实现这些需求的重要线索。当前，世界上已经有很多关于文字定位的研究。这些研究基本可以被分为两类基于纹理的方法和基于连通域的方法。基于纹理的方法主要是利用Gabor滤波器、小波变换等方法计算出区域的纹理特征，然后利用分类器来区分文本块与非文本块。而基于连通域的方法首先要假设字符的前景颜色基本一致。因此，基于连通域的方法首先要执行颜色聚类，将当前图形分解成若干颜色层，然后针对每个颜色层去执行连通域分析的方法，最终将符合文字特点的连通域定位出来。目前这些方法在一定程度上解决了文字定位的问题，但是并不适合网络动画中文字的特点。在网络动画中，大量存在多语言文本混排，正体字和斜体字混排，不同字体、大小、颜色的文字混排。因此，传统算法不能很...

【技术保护点】
１．一种网络动画中的文字定位及识别方法，其特征在于，将网络动画结构分析技术与光学字符识别技术结合，直接提取网络动画文件中的编码内嵌文字，并利用一种基于连通域的启发合并、特征聚类的两阶段文字定位算法定位非内嵌文字，利用一种基于笔画宽度直方图的噪声过滤算法去除非文字连通域，最后利用基于梯度直方图特征识别非内嵌文字，该方法的步骤为：步骤Ｓ１：利用网络动画结构分析技术，分析给定网络动画文件的内容，如果存在ＤｅｆｉｎｅＴｅｘｔ标签，ＤｅｆｉｎｅＴｅｘｔ２标签之一，则将其中ＴｅｘｔＲｅｃｏｒｄｓ域中ＦｏｎｔＩＤ所定义的编码内嵌文字直接提取出来；步骤Ｓ２：利用网络动画结构分析技术，将网络动画分解为若干基本形...

【技术特征摘要】

【专利技术属性】
技术研发人员：张树武，刘杰，梁伟，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人