The embodiment of the invention relates to a data processing method and device of the standard format of the software engineering and design documents and structured model of two-way conversion, the method comprises: according to import configuration information, document data extraction, the formation of intermediate file; to detect the document conversion format and content is in line with the requirements of the template; by detecting. Format and resolution of the intermediate file; the intermediate file processed into the corresponding model and the definition of the CSV file; the CSV file into a structured database model. At the same time, the method includes customizing the management reports by configuring tables, and obtaining the required data from the structured model. The embodiment of the invention is to convert the standard format of the system analysis and summary of the design documents for structured data model, greatly enhance the design content of the unity, readability and manageability, and improve the design results in the enterprise sharing and reuse degree.
【技术实现步骤摘要】
数据处理的方法及装置
本专利技术涉及非结构化文档的数据处理
,尤其涉及一种能将标准格式的软件工程系统分析与概要设计文档和结构化模型进行双向转换的数据处理的方法及装置。
技术介绍
在软件工程的生命周期中,分析与概要设计的文档对后面的开发、测试、实施、维护工作起到了关键性的影响,设计文档的质量直接影响工程的进度与软件交付的质量。为保证设计质量,目前,IT业界的通常做法是:制定标准的设计文档模板,以统一企业内的所有IT项目的设计过程、设计标准、规范及约束等。但是,文档本身并不具备很好的约束性,它无法固化设计标准与约束,以文档作为交付物的设计成果质量,一定程度商取决于设计者对设计模板的遵从性。而且,对于设计审查人员来说,除了通读文档,并没有其他更好的方式帮助其审查设计内容,而对于一个企业级设计管理者来说,要实现对企业内部所有信息系统设计内容的总体分析与管理,只能依靠手工收集、汇总与整理的方法,这种方法简单、低效、需耗费大量人力物力,而形成的结果具有有限的时效性,且质量无法保证。为了解决上述问题,我们对传统的软件工程系统分析与概要设计交付文档,进行总结与提炼,形成一套可承载系统分析与概要设计内容,同时固化设计标准与约束,内置本阶段设计要素间内在关系的系统分析与概要设计模型,以结构化的模型作为交付成果。由于在采用模型化分析与设计的过程中,可能存在已设计好的文档,存在设计文档与结构化模型并存的情况,而手工将已设计好的大量文档,转换成结构化模型需要耗费大量的时间,效率非常低,转换质量也无法保证。因此,我们专利技术了一种将系统分析与概要设计文档转换为结构化模型的数据处 ...
【技术保护点】
一种数据处理的方法,其特征在于,所述方法包括:读取导入配置信息,抽取待转换文档的数据,形成中间文件,所述导入配置信息包括第一格式信息和所述待转换文档的数据与模型数据的映射关系;检测所述待转换文档的第二格式信息与所述第一格式信息是否一致;当检测到所述第二格式信息与所述第一格式信息不一致时,将所述第二格式信息的错误信息及其在待转换文档中的具体位置写入错误日志,用以帮助用户修正文档;当检测到所述第二格式信息与所述第一格式信息一致时,对所述中间文件进行格式处理和拆分处理,并转换成与所述模型定义对应的CSV文件;将所述CSV文件导入结构化模型数据库。
【技术特征摘要】
1.一种数据处理的方法,其特征在于,所述方法包括:读取导入配置信息,抽取待转换文档的数据,形成中间文件,所述导入配置信息包括第一格式信息和所述待转换文档的数据与模型数据的映射关系;检测所述待转换文档的第二格式信息与所述第一格式信息是否一致;当检测到所述第二格式信息与所述第一格式信息不一致时,将所述第二格式信息的错误信息及其在待转换文档中的具体位置写入错误日志,用以帮助用户修正文档;当检测到所述第二格式信息与所述第一格式信息一致时,对所述中间文件进行格式处理和拆分处理,并转换成与所述模型定义对应的CSV文件;将所述CSV文件导入结构化模型数据库。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:抽象并定义从所述结构化模型中抽取数据的常见取数逻辑类型;设置导出配置表信息,所述导出配置表信息包括:待生成报表适用的取数逻辑,报表的表头,报表各要素对应的模型定义及属性,报表的输入项以及输出项,或者是待生成设计文档的模板;读取并解析导出配置表信息,确定在所述模型数据中的取数范围和取数逻辑;根据所述取数范围和取数逻辑,读取相应的模型定义、图和符号,生成报表或标准的设计文档。3.根据权利要求1所述的方法,其特征在于,所述检测所述待转换文档的第二格式信息与所述第一格式信息是否一致,具体包括:根据所述导入配置信息中的关键词对所述待转换文档进行定位,通过是否定位成功判断所述第二格式信息与所述导入配置信息中的所述第一格式信息是否一致。4.根据权利要求1所述的方法,其特征在于,所述检测所述待转换文档的第二格式信息与所述第一格式信息是否一致,具体还包括:检测所述待转换文档是否包括不可为空的数据或者所述不可为空的数据是否填写,输入数据是否在规定的范围内,不可重复的内容是否存在重复。5.根据权利要求1所述的方法,其特征在于,所述检测所述待转换文档的第二格式信息与所述第一格式信息是否一致,具体还包括:当检测到所述第二格式信息与所述第一格式信息不一致时,将所述第二格式信...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。