当前位置: 首页 > 专利查询>徐庆专利>正文

图像文本及形音义特征识别方法和装置制造方法及图纸

技术编号:19178574 阅读:25 留言:0更新日期:2018-10-17 00:35
本发明专利技术涉及一种图像文本及形音义特征识别方法和装置,其中,图像文本及形音义特征识别方法,包括以下步骤:对待处理图像的图像特征描述符进行分割,得到各最小单元;按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据;基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。本发明专利技术能够基于海量知识数据信息,从形音义方面对待处理图像进行文本识别和其形音义特征信息的推定获取。

Image text and shape recognition method and device

The invention relates to an image text and form-sound-meaning feature recognition method and device, wherein the image text and form-sound-meaning feature recognition method comprises the following steps: the image feature descriptor of the processed image is segmented to obtain the minimum units; and the minimum units are combined according to the preset minimum unit combination rule. The data of each combination unit is obtained; the sample image matching the combination unit data is obtained by searching the sample image database based on the combination unit data, and the minimum unit matching rate and the minimum unit mismatching rate between the sample image and the image to be processed are obtained; the minimum unit matching rate and the minimum unit mismatching rate are selected to meet the pre-processing requirements. Sample images for application requirements are set up, and the recorded text and shape, sound and meaning features of the selected sample images are used as text and shape, sound and meaning features of the image to be processed. The invention can recognize the text of the processed image from the aspect of shape, sound and meaning and obtain the presumption of the shape, sound and meaning characteristic information based on the mass knowledge data information.

【技术实现步骤摘要】
图像文本及形音义特征识别方法和装置
本申请涉及图像识别
,特别是涉及一种图像文本及形音义特征识别方法和装置。
技术介绍
对图像的内容识别是数字图像处理中的一项重要工作,传统技术一般采用光学字符识别OCR(OpticalCharacterRecognition,光学字符识别);OCR是一种基于计算机的将文本图像转化为机器可编辑文本的数字形式,能够提取文本图像文字信息。在实现过程中,专利技术人发现传统技术中至少存在如下问题:OCR对图像的内容识别仅限于图像中的文本图像,无法识别获取非文本图像的内容,目前非文本图像的内容主要靠人工判断获取;传统技术易造成相同或近似图像的漏检。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够获取图像更多的文本及其形音义特征的图像文本及形音义特征识别方法和装置。为了实现上述目的,一方面,本专利技术实施例提供了一种图像文本及形音义特征识别方法,包括以下步骤:对待处理图像的图像特征描述符进行分割,得到各最小单元;最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串;按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据;基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征;选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。在其中一个实施例中,图像特征描述符为采用相同或高度相似的字符串、对待处理图像中具有相同感知内容或特征进行记录,而采用不同的字符串、对待处理图像中具有不同感知内容或特征进行记录的图像特征表示形式;图像特征表示形式为描述待处理图像的图像特征的一组或多组字符串的集合;预设最小单元组合规则包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则;组合单元数据为根据预设最小单元组合规则对各最小单元进行组合得到的、用于存储以及作为检索的关键词的字符串数据;样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像;样本图像数据库包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;形音义特征包括形状特征、读音特征以及含义特征;对待处理图像的图像特征描述符进行分割,得到各最小单元的步骤之前还包括步骤:提取待处理图像的图像特征描述符;和/或建立样本图像数据库。在其中一个实施例中,建立样本图像数据库的步骤包括:记录样本图像的可认读的文字内容、读音、文字组合的含义,商标图形要素编码,图像信息编码以及形音义特征;对样本图像进行图像特征描述符分割以及最小单元组合处理,得到样本图像的各最小单元以及样本图像的各组合单元数据。在其中一个实施例中,图像轮廓线的图像特征描述符的最小单元组合规则包括:将任一图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,第一预设定长的取值范围为大于或等于图像轮廓线上的线段总长的20%;图像骨架线的图像特征描述符的最小单元组合规则包括:将任一图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,第二预设定长的取值范围为大于或等于图像骨架线上的线段总长的20%。在其中一个实施例中,图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;最小单元为任一规格的标准坐标系的任一坐标区域所对应图像轮廓线或图像骨架线的一个或多个像素点的位置数据。在其中一个实施例中,获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率的步骤包括:获取待处理图像的最小单元的总数,样本图像匹配待处理图像的最小单元合计数,样本图像不匹配待处理图像的最小单元合计数基于以下公式得到最小单元匹配率:Ma=(Ua÷U0)×100%其中,Ma表示最小单元匹配率,U0表示待处理图像的最小单元的总数,Ua表示样本图像匹配待处理图像的最小单元合计数;基于以下公式得到最小单元不匹配率:Mi=(Uc÷U0)×100%+(n-1)×ω其中,Mi表示最小单元不匹配率,U0表示待处理图像的最小单元的总数,Uc表示样本图像不匹配待处理图像的最小单元合计数,n表示样本图像与待处理图像在图像特征线上所不相匹配的处数,ω表示处数的权数;其中,ω的取值范围为小于或等于50%。在其中一个实施例中,选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像的步骤包括:选取出最小单元匹配率大于或等于预设最小单元匹配率,且最小单元不匹配率小于或等于预设最小单元不匹配率的各初步匹配样本图像;对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序,将最小单元匹配率和最小单元不匹配率的排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。在其中一个实施例中,预设应用需求包括预设最小单元匹配率的取值范围、预设最小单元不匹配率的取值范围以及预设排序名次的取值范围;其中,预设最小单元匹配率的取值范围为大于30%;预设最小单元不匹配率的取值范围为小于70%;预设排序名次的取值范围为前100名以内;对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序的步骤包括:对各最小单元匹配率由大至小进行排序,对最小单元不匹配率由小至大进行排序,将排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。另一方面,本专利技术实施例还提供了一种图像文本及形音义特征识别装置,包括:分割模块,用于对待处理图像的图像特征描述符进行分割,得到各最小单元;最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串;组合模块,用于按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据;检索模块,用于基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征;筛选模块,用于选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述图像文本及形音义特征识别方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述图像文本及形音义特征识别方法的步骤。上述技术方案中的一个技术方案具有如下优点和有益效果:本专利技术实施例可以通过现有海量的知识数据信息,从形音义本文档来自技高网...

【技术保护点】
1.一种图像文本及形音义特征识别方法,其特征在于,包括以下步骤:对待处理图像的图像特征描述符进行分割,得到各最小单元;所述最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串;按照预设最小单元组合规则对各所述最小单元进行组合,得到各组合单元数据;基于所述组合单元数据检索样本图像数据库,得到匹配所述组合单元数据的样本图像,并获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率;所述样本图像数据库包含所述样本图像的各最小单元、所述样本图像的各组合单元数据和所述样本图像已记录的文本及形音义特征;选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像,并将所述选取出的样本图像已记录的文本及形音义特征作为所述待处理图像的文本及形音义特征。

【技术特征摘要】
1.一种图像文本及形音义特征识别方法,其特征在于,包括以下步骤:对待处理图像的图像特征描述符进行分割,得到各最小单元;所述最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串;按照预设最小单元组合规则对各所述最小单元进行组合,得到各组合单元数据;基于所述组合单元数据检索样本图像数据库,得到匹配所述组合单元数据的样本图像,并获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率;所述样本图像数据库包含所述样本图像的各最小单元、所述样本图像的各组合单元数据和所述样本图像已记录的文本及形音义特征;选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像,并将所述选取出的样本图像已记录的文本及形音义特征作为所述待处理图像的文本及形音义特征。2.根据权利要求1所述的图像文本及形音义特征识别方法,其特征在于,所述图像特征描述符为采用相同或高度相似的字符串、对所述待处理图像中具有相同感知内容或特征进行记录,而采用不同的字符串、对所述待处理图像中具有不同感知内容或特征进行记录的图像特征表示形式;所述图像特征表示形式为描述所述待处理图像的图像特征的一组或多组字符串的集合;所述预设最小单元组合规则包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则;所述组合单元数据为根据所述预设最小单元组合规则对各所述最小单元进行组合得到的、用于存储以及作为所述检索的关键词的字符串数据;所述样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像;所述样本图像数据库包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;所述形音义特征包括形状特征、读音特征以及含义特征;对待处理图像的图像特征描述符进行分割,得到各最小单元的步骤之前还包括步骤:提取所述待处理图像的所述图像特征描述符;和/或建立所述样本图像数据库。3.根据权利要求2所述的图像文本及形音义特征识别方法,其特征在于,建立所述样本图像数据库的步骤包括:记录所述样本图像的可认读的文字内容、读音、文字组合的含义,商标图形要素编码,图像信息编码以及所述形音义特征;对所述样本图像进行图像特征描述符分割以及最小单元组合处理,得到所述样本图像的各最小单元以及所述样本图像的各组合单元数据。4.根据权利要求2所述的图像文本及形音义特征识别方法,其特征在于,所述图像轮廓线的图像特征描述符的最小单元组合规则包括:将任一图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,所述第一预设定长的取值范围为大于或等于所述图像轮廓线上的线段总长的20%;所述图像骨架线的图像特征描述符的最小单元组合规则包括:将任一图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,所述第二预设定长的取值范围为大于或等于所述图像骨架线上的线段总长的20%。5.根据权利要求2所述的图像文本及形音义特征识别方法,其特征在于,所述图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;所述最小单元为所述任一规格的标准坐标系的任一坐标区域所对应所述图像轮廓线或所述图像骨架线的一个或多个像素点的位置数据。6.根...

【专利技术属性】
技术研发人员:徐庆
申请(专利权)人:徐庆佛山市国方商标服务有限公司佛山市国方商标识别科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1