一种标准图像资源加工标准化处理方法技术

技术编号:18165638 阅读:50 留言:0更新日期:2018-06-09 11:31
本发明专利技术公开了一种标准图像资源加工标准化处理方法,属于图像资源处理技术领域,建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元,通过人工模拟盖章技术,准确定位和标记标准文献图像中具有特殊意义的内容,根据标记确定的内容,极大的缩减了特征值提取的范围,提高了特征值提取的准确性和效率,改变了现有的人工寻找纸质文本,扫描特殊标识页,再上传服务器的繁琐过程。本发明专利技术极大的缩减了特征值提取的范围,提高了特征值提取的准确性和效率,减轻人员工作量,提高了标准资源加工的工作效率。

A standardized processing method for standard image resources processing

The invention discloses a standard processing method for processing standard image resource processing, which belongs to the field of image resource processing technology, and establishes an image receiving and processing unit, an image data storage unit, an artificial simulation cover unit, a text acquisition unit and a standard search and query unit. The content which has special meaning in the standard literature image, according to the content determined by the mark, greatly reduces the range of feature extraction, improves the accuracy and efficiency of feature extraction, and changes the complicated process of finding paper text, scanning special identification page and uploading server. The invention greatly reduces the range of feature extraction, improves the accuracy and efficiency of the feature extraction, reduces the workload of the personnel and improves the working efficiency of the standard resource processing.

【技术实现步骤摘要】
一种标准图像资源加工标准化处理方法
本专利技术涉及一种图像资源处理方法,特别是涉及一种标准图像资源加工标准化处理方法,属于图像资源处理

技术介绍
标准图像资源加工处理的标准化手段及其方法和普通的文档图像处理方法有类似的地方,现有的文档图像处理方法大多是通过识别文档图像的特殊文字、特殊字符或者特殊图像来确定图像的分类和图像信息。在申请号为CN201410563687.X的中国专利中,其公开了一种文档图像识别方法,将单个文字看作是文档图像上的一个小区域,基于聚类的思想识别图像上的连通区域,抽取每个区域上的形状特征、颜色特征,设计概率模型,实现文档图像的识别。此专利虽然可以实现文档图像中文字和图像的识别,但在运用到标准图像资源加工处理时,就会出现如下不适合的方面:标准基本全部都是文字描述,并没有文字和图像的区分,所以识别出来也基本上全是文字,在我们标记特殊页时没有任何的帮助。由于前言和首页在文字上的特殊字样就只有‘前言’和‘首页’,而这两个词在每一个标准文本中出现的频次是很多的,所以此专利不适用于标准图像资源的加工处理。
技术实现思路
本专利技术的主要目的是为了提供一种标准图像资源加工标准化处理方法,解决了现有技术中前言、首页不能定位的问题,题录字段因提取范围过大而提取不准确导致的特征值提取效率低的问题,解决了标准的前言和首页需要人工找到标准文本,然后扫描获取图像,再把图像上传到服务器的繁琐过程。本专利技术的目的可以通过采用如下技术方案达到:一种标准图像资源加工标准化处理方法,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元;步骤2:图像接收处理单元获取上传的标准文献图像资源,对标准文献图像进行清晰化处理,然后拆分成每一页的切图,通过对文字识别技术的封装使用生成标准文本电子书文件;步骤3:图像数据存储单元根据图像接收处理单元的产出物,设计建造数据存储系统,将每个标准对应的标准基础信息、标准文献图像、标准文献切页图像和电子书文件通过唯一识别标识存储到图像数据存储系统中;步骤4:人工模拟盖章单元通过人工模拟盖章技术,从众多的标准文献切页图像中识别出前言和首页,并通过对应标准的唯一标识将前言和首页图像与标准号关联存储到存储单元;步骤5:文字获取单元根据标准文献图像录入标准特征字段,通过获取该标准对应的前言和首页,缩短特征值的提取范围;步骤6:标准搜索查询单元面向公众标准查询检索,检索到标准文献图像后,通过人工模拟盖章单元标记的首页和前言,从存储系统中提取出首页图像。进一步的,步骤1中,所述图像接收处理单元用于接收标准文献的图像,对文献图像进行清晰化处理,对标准文献资源进行切割,生成分页图像。进一步的,步骤1中,所述图像数据存储单元将图像接收处理单元产出的标准文献切图,清洗处理的标准文献和文字可识别的双层PDF进行存储,并通过唯一标识将一个标准的所有数据和文本资源关联。进一步的,步骤1中,所述人工模拟盖章单元首先按标准文献顺序展示标准文献的切图,然后通过人工模拟盖章技术对标准的前言和首页进行标记处理,并将结果存储到图像数据存储系统中。进一步的,步骤1中,所述文字获取单元是通过获取人工模拟盖章单元标记的前言和首页两处的文字信息,快速准确的筛选标准的特征值区域,并通过文字解析技术来准确定位特征值域。进一步的,步骤1中,所述标准搜索查询单元是建立面向公共的标准查询系统,查询标准并展示标准的首页图像。进一步的,步骤1中,所述图像接收处理单元、所述图像数据存储单元、所述人工模拟盖章单元、所述文字获取单元和所述标准搜索查询单元之间均通过互联网通信。进一步的,步骤4中,所述人工模拟盖章单元从所述图像数据存储单元中提取出标准文献切页图像并按序排列,通过人工模拟盖章单元实现前言和首页的标记工作。进一步的,所述人工模拟盖章单元实现前言和首页的标记工作按以下步骤进行:步骤41:从图像数据存储单元中取出标准资源图片,在页面上经过图片的宽与高的尺寸各放大不同的倍数;步骤42:用鼠标点击右侧的图章,通过页面元素鼠标浮动实现图章随鼠标一起移动,实现模拟人工盖章的效果,图章的位置为鼠标当前位置(X,Y)相应的减掉图章的宽度(W)和高度(H),即(X-W,Y-H);步骤43:将鼠标移动到标准文献区域,点击鼠标右键,图章便会自动定位到先前预设的位置,此位置可以任意设置或直接设置相对于显示区域的高度X和宽度Y;步骤44:图章定位之后,如果定位的页面不是所需要的页面,可以取消,然后重新盖章,在确定之后,会形成一个标记,当再次显示的时候,图章的位置标记也会出现,以此确认上一次所盖图章的位置;步骤45:将标记的前言和首页的图像及数据通过唯一标识和标准号关联保存到图像数据存储单元中。进一步的,步骤41中,还动态的创建显示区域,显示区域分两部分,左边是内容区域,右边是章显示区域。本专利技术的有益技术效果:按照本专利技术的标准图像资源加工标准化处理方法,本专利技术提供的标准图像资源加工标准化处理方法,通过自主研发的人工模拟盖章技术,准确定位和标记标准文献图像中具有特殊意义的内容,根据标记确定的内容,极大的缩减了特征值提取的范围,提高了特征值提取的准确性和效率,改变了现有的人工寻找纸质文本,扫描特殊标识页,再上传服务器的繁琐过程,减轻人员工作量,提高了标准资源加工的工作效率。附图说明图1为按照本专利技术的标准图像资源加工标准化处理方法的一优选实施例的流程图;图2为按照本专利技术的标准图像资源加工标准化处理方法的一优选实施例的人工模拟盖章的流程图。具体实施方式为使本领域技术人员更加清楚和明确本专利技术的技术方案,下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。如图1所示,本实施例提供的一种标准图像资源加工标准化处理方法,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元;图像接收处理单元用于接收标准文献的图像,对文献图像进行清晰化处理,对标准文献资源进行切割,生成分页图像;图像数据存储单元将图像接收处理单元产出的标准文献切图,清洗处理的标准文献和文字可识别的双层PDF进行存储,并通过唯一标识将一个标准的所有数据和文本资源关联;人工模拟盖章单元首先按标准文献顺序展示标准文献的切图,然后通过人工模拟盖章技术对标准的前言和首页进行标记处理,并将结果存储到图像数据存储系统中;文字获取单元是通过获取人工模拟盖章单元标记的前言和首页两处的文字信息,快速准确的筛选标准的特征值区域,并通过文字解析技术来准确定位特征值域;标准搜索查询单元是建立面向公共的标准查询系统,查询标准并展示标准的首页图像;步骤2:图像接收处理单元获取上传的标准文献图像资源,对标准文献图像进行清晰化处理,然后拆分成每一页的切图,通过对文字识别技术的封装使用生成标准文本电子书文件;步骤3:图像数据存储单元根据图像接收处理单元的产出物,设计建造数据存储系统,将每个标准对应的标准基础信息、标准文献图像、标准文献切页图像和电子书文件通过唯一识别标识存储到图像数据存储系统中;步骤4:人工模拟盖章单元通过自主研发的人工模拟盖章技术,从众多的标准文献切页图像中识别出前言和首页,并通过对应标准的唯本文档来自技高网...
一种标准图像资源加工标准化处理方法

【技术保护点】
一种标准图像资源加工标准化处理方法,其特征在于,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元;步骤2:图像接收处理单元获取上传的标准文献图像资源,对标准文献图像进行清晰化处理,然后拆分成每一页的切图,通过对文字识别技术的封装使用生成标准文本电子书文件;步骤3:图像数据存储单元根据图像接收处理单元的产出物,设计建造数据存储系统,将每个标准对应的标准基础信息、标准文献图像、标准文献切页图像和电子书文件通过唯一识别标识存储到图像数据存储系统中;步骤4:人工模拟盖章单元通过人工模拟盖章技术,从众多的标准文献切页图像中识别出前言和首页,并通过对应标准的唯一标识将前言和首页图像与标准号关联存储到存储单元;步骤5:文字获取单元根据标准文献图像录入标准特征字段,通过获取该标准对应的前言和首页,缩短特征值的提取范围;步骤6:标准搜索查询单元面向公众标准查询检索,检索到标准文献图像后,通过人工模拟盖章单元标记的首页和前言,从存储系统中提取出首页图像。

【技术特征摘要】
1.一种标准图像资源加工标准化处理方法,其特征在于,包括如下步骤:步骤1:建立图像接收处理单元、图像数据存储单元、人工模拟盖章单元、文字获取单元和标准搜索查询单元;步骤2:图像接收处理单元获取上传的标准文献图像资源,对标准文献图像进行清晰化处理,然后拆分成每一页的切图,通过对文字识别技术的封装使用生成标准文本电子书文件;步骤3:图像数据存储单元根据图像接收处理单元的产出物,设计建造数据存储系统,将每个标准对应的标准基础信息、标准文献图像、标准文献切页图像和电子书文件通过唯一识别标识存储到图像数据存储系统中;步骤4:人工模拟盖章单元通过人工模拟盖章技术,从众多的标准文献切页图像中识别出前言和首页,并通过对应标准的唯一标识将前言和首页图像与标准号关联存储到存储单元;步骤5:文字获取单元根据标准文献图像录入标准特征字段,通过获取该标准对应的前言和首页,缩短特征值的提取范围;步骤6:标准搜索查询单元面向公众标准查询检索,检索到标准文献图像后,通过人工模拟盖章单元标记的首页和前言,从存储系统中提取出首页图像。2.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述图像接收处理单元用于接收标准文献的图像,对文献图像进行清晰化处理,对标准文献资源进行切割,生成分页图像。3.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述图像数据存储单元将图像接收处理单元产出的标准文献切图,清洗处理的标准文献和文字可识别的双层PDF进行存储,并通过唯一标识将一个标准的所有数据和文本资源关联。4.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述人工模拟盖章单元首先按标准文献顺序展示标准文献的切图,然后通过人工模拟盖章技术对标准的前言和首页进行标记处理,并将结果存储到图像数据存储系统中。5.根据权利要求1所述的一种标准图像资源加工标准化处理方法,其特征在于,步骤1中,所述文字获取单元是通过获取人工...

【专利技术属性】
技术研发人员:陈银龙金志刚伍薇魏雪艳赵华
申请(专利权)人:江苏省质量和标准化研究院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1