【技术实现步骤摘要】
本专利技术涉及计算机应用系统中的数据采集及处理技木,可用于各类技术标准文本的数字化处理、索引创建和检索。尤其适用于对技术标准的分类。
技术介绍
技术标准的整编、分类、管理、使用对于各行业具有特別重大的意义,在促进技术进步、科技创新,保证设计质量方面起着重要的作用。而由于技术标准本身在分类、管理上的复杂性,传统的纸质技术标准文本和人工发放管理的方式已经难以适应新的设计管理模式的要求,尽管有部分技术标准开始采用数字化的分发方式,但目前纸质版本的使用还是主流,现有的数字化技术仅仅是将纸质版本扫描成图像或PDF文件,使用者在电脑上ー页页翻阅,对于大量的技术标准内容无法进行全文检索,也无法将技术标准的条文和条文说明相互參照。
技术实现思路
本专利技术所要解决的技术问题是提供适合处理行业技术标准数字化的相关信息处理技木,解决现有数字化技术存在的弊端,实现海量技术标准数字化后的全文检索和索引创建。还可以融入企业的整体信息平台,在技术标准数据库系统中提供对标准条文的讨论功能,成为企业知识管理的重要数据来源。本专利技术的基本方案为根据技术标准数字化应用的数据模型,综合考虑各种数据源和处理校对的工作量,本专利技术包括下列步骤1.将技术标准分页扫描为图像格式;2.使用OCR软件批量转换为PDF文件,OCR软件为现有通用的光学字符识别软件;3.在软件系统中创建主文件夹,包含公共属性,所述公共属性包括标准名称和 TAG,如下表所示权利要求1. 一种,包括下列步骤1)将技术标准分页扫描为图像格式;2)使用OCR软件批量转换为PDF文件;3)在软件系统中创建主文件夹,创建公共属性,所述公 ...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:翟韦,
申请(专利权)人:上海现代建筑设计集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。