The invention discloses a standard processing method for processing standard image resource processing, which belongs to the field of image resource processing technology, and establishes an image receiving and processing unit, an image data storage unit, an artificial simulation cover unit, a text acquisition unit and a standard search and query unit. The content which has special meaning in the standard literature image, according to the content determined by the mark, greatly reduces the range of feature extraction, improves the accuracy and efficiency of feature extraction, and changes the complicated process of finding paper text, scanning special identification page and uploading server. The invention greatly reduces the range of feature extraction, improves the accuracy and efficiency of the feature extraction, reduces the workload of the personnel and improves the working efficiency of the standard resource processing.
【技术实现步骤摘要】
一种标准图像资源加工标准化处理方法
本专利技术涉及一种图像资源处理方法,特别是涉及一种标准图像资源加工标准化处理方法,属于图像资源处理
技术介绍
标准图像资源加工处理的标准化手段及其方法和普通的文档图像处理方法有类似的地方,现有的文档图像处理方法大多是通过识别文档图像的特殊文字、特殊字符或者特殊图像来确定图像的分类和图像信息。在申请号为CN201410563687.X的中国专利中,其公开了一种文档图像识别方法,将单个文字看作是文档图像上的一个小区域,基于聚类的思想识别图像上的连通区域,抽取每个区域上的形状特征、颜色特征,设计概率模型,实现文档图像的识别。此专利虽然可以实现文档图像中文字和图像的识别,但在运用到标准图像资源加工处理时,就会出现如下不适合的方面:标准基本全部都是文字描述,并没有文字和图像的区分,所以识别出来也基本上全是文字,在我们标记特殊页时没有任何的帮助。由于前言和首页在文字上的特殊字样就只有‘前言’和‘首页’,而这两个词在每一个标准文本中出现的频次是很多的,所以此专利不适用于标准图像资源的加工处理。
技术实现思路
本专利技术的主要目的是为了提供一种标准图像资源加工标准化处理方法,解决了现有技术中前言、首页不能定位的问题,题录字段因提取范围过大而提取不准确导致的特征值提取效率低的问题,解决了标准的前言和首页需要人工找到标准文本,然后扫描获取图像,再把图像上传到服务器的繁琐过程。本专利技术的目的可以通过采用如下技术方案达到:一种标准图像资源加工标准化处理方法,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、 ...
【技术保护点】
一种标准图像资源加工标准化处理方法,其特征在于,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元;步骤2:图像接收处理单元获取上传的标准文献图像资源,对标准文献图像进行清晰化处理,然后拆分成每一页的切图,通过对文字识别技术的封装使用生成标准文本电子书文件;步骤3:图像数据存储单元根据图像接收处理单元的产出物,设计建造数据存储系统,将每个标准对应的标准基础信息、标准文献图像、标准文献切页图像和电子书文件通过唯一识别标识存储到图像数据存储系统中;步骤4:人工模拟盖章单元通过人工模拟盖章技术,从众多的标准文献切页图像中识别出前言和首页,并通过对应标准的唯一标识将前言和首页图像与标准号关联存储到存储单元;步骤5:文字获取单元根据标准文献图像录入标准特征字段,通过获取该标准对应的前言和首页,缩短特征值的提取范围;步骤6:标准搜索查询单元面向公众标准查询检索,检索到标准文献图像后,通过人工模拟盖章单元标记的首页和前言,从存储系统中提取出首页图像。
【技术特征摘要】
1.一种标准图像资源加工标准化处理方法,其特征在于,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元;步骤2:图像接收处理单元获取上传的标准文献图像资源,对标准文献图像进行清晰化处理,然后拆分成每一页的切图,通过对文字识别技术的封装使用生成标准文本电子书文件;步骤3:图像数据存储单元根据图像接收处理单元的产出物,设计建造数据存储系统,将每个标准对应的标准基础信息、标准文献图像、标准文献切页图像和电子书文件通过唯一识别标识存储到图像数据存储系统中;步骤4:人工模拟盖章单元通过人工模拟盖章技术,从众多的标准文献切页图像中识别出前言和首页,并通过对应标准的唯一标识将前言和首页图像与标准号关联存储到存储单元;步骤5:文字获取单元根据标准文献图像录入标准特征字段,通过获取该标准对应的前言和首页,缩短特征值的提取范围;步骤6:标准搜索查询单元面向公众标准查询检索,检索到标准文献图像后,通过人工模拟盖章单元标记的首页和前言,从存储系统中提取出首页图像。2.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述图像接收处理单元用于接收标准文献的图像,对文献图像进行清晰化处理,对标准文献资源进行切割,生成分页图像。3.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述图像数据存储单元将图像接收处理单元产出的标准文献切图,清洗处理的标准文献和文字可识别的双层PDF进行存储,并通过唯一标识将一个标准的所有数据和文本资源关联。4.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述人工模拟盖章单元首先按标准文献顺序展示标准文献的切图,然后通过人工模拟盖章技术对标准的前言和首页进行标记处理,并将结果存储到图像数据存储系统中。5.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述文字获取单元是通过获取人工...
【专利技术属性】
技术研发人员:陈银龙,金志刚,伍薇,魏雪艳,赵华,
申请(专利权)人:江苏省质量和标准化研究院,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。