当前位置: 首页 > 专利查询>徐庆专利>正文

图像文本及形音义特征识别方法和装置制造方法及图纸

技术编号：19178574 阅读：25 留言：0更新日期：2018-10-17 00:35

本发明专利技术涉及一种图像文本及形音义特征识别方法和装置，其中，图像文本及形音义特征识别方法，包括以下步骤：对待处理图像的图像特征描述符进行分割，得到各最小单元；按照预设最小单元组合规则对各最小单元进行组合，得到各组合单元数据；基于组合单元数据检索样本图像数据库，得到匹配组合单元数据的样本图像，并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率；选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像，并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。本发明专利技术能够基于海量知识数据信息，从形音义方面对待处理图像进行文本识别和其形音义特征信息的推定获取。

Image text and shape recognition method and device

The invention relates to an image text and form-sound-meaning feature recognition method and device, wherein the image text and form-sound-meaning feature recognition method comprises the following steps: the image feature descriptor of the processed image is segmented to obtain the minimum units; and the minimum units are combined according to the preset minimum unit combination rule. The data of each combination unit is obtained; the sample image matching the combination unit data is obtained by searching the sample image database based on the combination unit data, and the minimum unit matching rate and the minimum unit mismatching rate between the sample image and the image to be processed are obtained; the minimum unit matching rate and the minimum unit mismatching rate are selected to meet the pre-processing requirements. Sample images for application requirements are set up, and the recorded text and shape, sound and meaning features of the selected sample images are used as text and shape, sound and meaning features of the image to be processed. The invention can recognize the text of the processed image from the aspect of shape, sound and meaning and obtain the presumption of the shape, sound and meaning characteristic information based on the mass knowledge data information.

全部详细技术资料下载

【技术实现步骤摘要】
图像文本及形音义特征识别方法和装置
本申请涉及图像识别
，特别是涉及一种图像文本及形音义特征识别方法和装置。
技术介绍
对图像的内容识别是数字图像处理中的一项重要工作，传统技术一般采用光学字符识别OCR(OpticalCharacterRecognition，光学字符识别)；OCR是一种基于计算机的将文本图像转化为机器可编辑文本的数字形式，能够提取文本图像文字信息。在实现过程中，专利技术人发现传统技术中至少存在如下问题：OCR对图像的内容识别仅限于图像中的文本图像，无法识别获取非文本图像的内容，目前非文本图像的内容主要靠人工判断获取；传统技术易造成相同或近似图像的漏检。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够获取图像更多的文本及其形音义特征的图像文本及形音义特征识别方法和装置。为了实现上述目的，一方面，本专利技术实施例提供了一种图像文本及形音义特征识别方法，包括以下步骤：对待处理图像的图像特征描述符进行分割，得到各最小单元；最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串；按照预设最小单元组合规则对各最小单元进行组合，得到各组合单元数据；基于组合单元数据检索样本图像数据库，得到匹配组合单元数据的样本图像，并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率；样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征；选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像，并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。在其中一...

【技术保护点】
1.一种图像文本及形音义特征识别方法，其特征在于，包括以下步骤：对待处理图像的图像特征描述符进行分割，得到各最小单元；所述最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串；按照预设最小单元组合规则对各所述最小单元进行组合，得到各组合单元数据；基于所述组合单元数据检索样本图像数据库，得到匹配所述组合单元数据的样本图像，并获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率；所述样本图像数据库包含所述样本图像的各最小单元、所述样本图像的各组合单元数据和所述样本图像已记录的文本及形音义特征；选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像，并将所述选取出的样本图像已记录的文本及形音义特征作为所述待处理图像的文本及形音义特征。

【技术特征摘要】
1.一种图像文本及形音义特征识别方法，其特征在于，包括以下步骤：对待处理图像的图像特征描述符进行分割，得到各最小单元；所述最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串；按照预设最小单元组合规则对各所述最小单元进行组合，得到各组合单元数据；基于所述组合单元数据检索样本图像数据库，得到匹配所述组合单元数据的样本图像，并获取所述样本图像与所述待处理图像的最小单元匹配率、最小单元不匹配率；所述样本图像数据库包含所述样本图像的各最小单元、所述样本图像的各组合单元数据和所述样本图像已记录的文本及形音义特征；选取出所述最小单元匹配率以及所述最小单元不匹配率满足预设应用需求的样本图像，并将所述选取出的样本图像已记录的文本及形音义特征作为所述待处理图像的文本及形音义特征。2.根据权利要求1所述的图像文本及形音义特征识别方法，其特征在于，所述图像特征描述符为采用相同或高度相似的字符串、对所述待处理图像中具有相同感知内容或特征进行记录，而采用不同的字符串、对所述待处理图像中具有不同感知内容或特征进行记录的图像特征表示形式；所述图像特征表示形式为描述所述待处理图像的图像特征的一组或多组字符串的集合；所述预设最小单元组合规则包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则；所述组合单元数据为根据所述预设最小单元组合规则对各所述最小单元进行组合得到的、用于存储以及作为所述检索的关键词的字符串数据；所述样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像；所述样本图像数据库包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库；所述形音义特征包括形状特征、读音特征以及含义特征；对待处理图像的图像特征描述符进行分割，得到各最小单元的步骤之前还包括步骤：提取所述待处理图像的所述图像特征描述符；和/或建立所述样本图像数据库。3.根据权利要求2所述的图像文本及形音义特征识别方法，其特征在于，建立所述样本图像数据库的步骤包括：记录所述样本图像的可认读的文字内容、读音、文字组合的含义，商标图形要素编码，图像信息编码以及所述形音义特征；对所述样本图像进行图像特征描述符分割以及最小单元组合处理，得到所述样本图像的各最小单元以及所述样本图像的各组合单元数据。4.根据权利要求2所述的图像文本及形音义特征识别方法，其特征在于，所述图像轮廓线的图像特征描述符的最小单元组合规则包括：将任一图像轮廓线上的全部线段确认为一个图像整体组合单元；将任一图像轮廓线上的闭环线确认为一个连通域组合单元；将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元；其中，所述第一预设定长的取值范围为大于或等于所述图像轮廓线上的线段总长的20％；所述图像骨架线的图像特征描述符的最小单元组合规则包括：将任一图像骨架线上的全部线段确认为一个图像整体组合单元；将任一图像骨架线上不间断的连线确认为一个连通域组合单元；将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元；其中，所述第二预设定长的取值范围为大于或等于所述图像骨架线上的线段总长的20％。5.根据权利要求2所述的图像文本及形音义特征识别方法，其特征在于，所述图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符；所述最小单元为所述任一规格的标准坐标系的任一坐标区域所对应所述图像轮廓线或所述图像骨架线的一个或多个像素点的位置数据。6.根...

【专利技术属性】
技术研发人员：徐庆，
申请(专利权)人：徐庆，佛山市国方商标服务有限公司，佛山市国方商标识别科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人