The invention discloses an analysis method and system for unstructured evidence files, which configures metadata information of unstructured data files and data source conversion rule information to database, generates front-end pages dynamically by parsing engine, and completes data binding and data filling dynamically according to metadata information of documents and data source conversion rule information. The aggregated storage and display of unstructured data and structured data ultimately achieve the purpose of fast retrieval and analysis of unstructured evidence files. The invention not only has unified design and implementation mode, easy service management, and can manage different databases and unstructured files, but also greatly reduces the workload of developers, improves the speed of data reprocessing, and achieves the requirements of generalization, encapsulation and stability of unstructured evidence file management.
【技术实现步骤摘要】
一种面向非结构化证据文件的分析方法及系统
本专利技术涉及数据处理
,特别是一种面向非结构化证据文件的分析方法及系统。
技术介绍
对于来源繁多的信息资料,专业人士根据信息的格式加以划分,将其分为结构化信息和非结构化信息两大类。其中,结构化信息是可以数字化的数据信息,可以方便地通过计算机和数据库技术进行管理;而无法完全数字化的信息称为非结构化信息,如文档文件、图片、图纸资料、缩微胶片等,这些资源中拥有大量的、有价值的证据信息,伴随着非结构化信息正以成倍的速度增长的趋势,如何快速有效地对其处理后再利用是目前分析处理的难题之一。为了有效的对非结构化证据文件进行分析和管理,解决非结构化证据文件利用率不高、无法归档等问题,需要引入非结构化数据管理机制。通常情况下,对非结构化数据的分析需要强大的计算能力,将海量的非结构化证据文件转为文本,再在此基础上进行关联、分析和检索。这一过程耗时耗力,且转化出的数据质量良莠不齐,无法形成相对统一、准确的分析维度,因此非结构化数据存在难管理、检索慢、效率低以及出错率高等问题。
技术实现思路
本专利技术需要解决的技术问题是克服现有技术的不足而提供一种面向非结构化证据文件的分析方法及系统,能够减少开发人员的工作量,设计实现方式统一,能够转化及管理非结构化证据文件。为解决上述技术问题,本专利技术所采取的技术方案如下。一种面向非结构化证据文件的分析方法,所述分析方法包括以下步骤:A.针对web页面控件元素制定一套配置规则,按照配置规则构建界面解析引擎;B.针对数据库DDL、DML语句特点制定一套映射规则,按照映射规则构建智能填充引擎;C.配 ...
【技术保护点】
1.一种面向非结构化证据文件的分析方法,其特征在于,所述分析方法包括以下步骤:A.针对web页面控件元素制定一套配置规则,按照配置规则构建界面解析引擎;B.针对数据库DDL、DML语句特点制定一套映射规则,按照映射规则构建智能填充引擎;C.配置非结构化证据文件的元数据信息,通过步骤A制定的配置规则配置界面元数据,通过步骤B制定的映射规则配置数据元数据;D.根据步骤C配置的界面元数据经由配置A构建的界面解析引擎生成非结构化证据文件的重要信息表单;E.根据步骤C配置的数据元数据经由配置B构建的智能填充引擎智能填充步骤D生成的重要信息表单内容;F.在步骤E生成的重要信息表单中上传非结构化证据文件,将表单内容与非结构化证据文件绑定后统一保存入数据库;G.将步骤F产生的内容以非结构化证据文件重要信息表单和非结构证据文件在线预览的方式做关联展示,通过重要信息表单内容实现多维度检索、分析;通过文件在线预览、编辑操作实现非结构化证据文件的处理。
【技术特征摘要】
1.一种面向非结构化证据文件的分析方法,其特征在于,所述分析方法包括以下步骤:A.针对web页面控件元素制定一套配置规则,按照配置规则构建界面解析引擎;B.针对数据库DDL、DML语句特点制定一套映射规则,按照映射规则构建智能填充引擎;C.配置非结构化证据文件的元数据信息,通过步骤A制定的配置规则配置界面元数据,通过步骤B制定的映射规则配置数据元数据;D.根据步骤C配置的界面元数据经由配置A构建的界面解析引擎生成非结构化证据文件的重要信息表单;E.根据步骤C配置的数据元数据经由配置B构建的智能填充引擎智能填充步骤D生成的重要信息表单内容;F.在步骤E生成的重要信息表单中上传非结构化证据文件,将表单内容与非结构化证据文件绑定后统一保存入数据库;G.将步骤F产生的内容以非结构化证据文件重要信息表单和非结构证据文件在线预览的方式做关联展示,通过重要信息表单内容实现多维度检索、分析;通过文件在线预览、编辑操作实现非结构化证据文件的处理。2.根据权利要求1所述的一种面向非结构化证据文件的分析方法,其特征在于,步骤A中所述的web页面控件元素包括文本框、下拉框、时间选择器和列表选择框;所述配置规则指用户自定义上述web页面控件的样式与行为时应遵守的约束;所述界面解析引擎指系统根据用户配置的控件自动生成用户界面的代码模块。3.根据权利要求2所述的一种面向非结构化证据文件的分析方法,其特征在于,步骤A的实现过程包括以下步骤:A1.列举常用web前端控件,对其属性与行为进行抽象,将各前端控件特征点抽取出用户可自定义的配置点;A2.读取用户配置,使用velocity模板技术将用户配置转换成浏览器前端可渲染的html/css/javascript代码。4.根据权利要求1所述的一种面向非结构化证据文件的分析方法,其特征在于:步骤B中所述数据库DML语句指数据库结构定义语言,数据库DDL语句指数据库内容操作语言,所述映射规则指用户自定义重要信息表单字段与业务数据关联关系时应遵守的约束;所述智能填充引擎指系统根据用户配置的关联关系自动为界面控件填充业务数据的代码模块。5.根据权利要求4所述的一种面向非结构化证据文件的分析方法,其特征在于,步骤...
【专利技术属性】
技术研发人员:陈继良,吴明武,欧炳杰,刘怀春,吴海平,
申请(专利权)人:珠海市新德汇信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。