一种基于历史分析的无人智能驱动的数据文件生成方法技术

技术编号：10599390 阅读：144 留言：0更新日期：2014-10-30 13:07

本发明专利技术涉及一种基于历史分析的无人智能驱动的数据文件生成方法，步骤如下：1）使用同构数据生成模拟器生成模拟数据；2）使用XML文件生成器抽取模拟数据，生成XML文件；3）在知识分析数据库中记录抽取模拟数据、生成每个XML文件的生成效率参数；4）将各个数量级数据生成XML文件执行时间最短的生成效率参数作为执行标准，基于执行标准进行实际环境数据抽取并生成XML文件。通过使用同构数据生成模拟器生成模拟数据，使用XML文件生成器进行真实环境数据抽取模拟，然后记录整个过程的执行结果，初步建立知识库，以效率最高的模型为参考标准，初步实现数据抽取的高效率；并使用数据分析挖掘技术，不断完善知识库，逐步提高数据抽取的效率。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及，步骤如下：1）使用同构数据生成模拟器生成模拟数据；2）使用XML文件生成器抽取模拟数据，生成XML文件；3）在知识分析数据库中记录抽取模拟数据、生成每个XML文件的生成效率参数；4）将各个数量级数据生成XML文件执行时间最短的生成效率参数作为执行标准，基于执行标准进行实际环境数据抽取并生成XML文件。通过使用同构数据生成模拟器生成模拟数据，使用XML文件生成器进行真实环境数据抽取模拟，然后记录整个过程的执行结果，初步建立知识库，以效率最高的模型为参考标准，初步实现数据抽取的高效率；并使用数据分析挖掘技术，不断完善知识库，逐步提高数据抽取的效率。【专利说明】
本专利技术涉及一种数据抽取方法，更具体地说，涉及一种基于历史分析的无人智能驱动的数据文件生成方法。
技术介绍
-般的数据抽取的方式主要分为两种：一种是将需要的数据从数据库中提取然后通过二进制数据流进行传输然后存储到其他数据库中。另一种是从数据库中提取需要的数据存储以文本文件的形式存储到硬盘上。对于从数据库中提取需要的数据存储以文本文件的形式存储到硬盘上这种方法，其在技术上存在一个缺点：当数据库中有一张数据表A该表每天都海量的新数据写入，并且数量级不等。如果要将增量的数据同时写入到同一个文本文件对象中，那么这个文本文件对象的所占用的存储空间就会变得很庞大，对文件的存储效率和文件传输效率都存在一个制约性，对数据抽取的效率产生了瓶颈。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种在海量新数据写入数据库的情 ...

【技术保护点】
一种基于历史分析的无人智能驱动的数据文件生成方法，其特征在于，步骤如下：1）使用同构数据生成模拟器生成模拟数据；2）使用XML文件生成器抽取模拟数据，生成XML文件；3）在知识分析数据库中记录抽取模拟数据、生成每个XML文件的生成效率参数；4）将各个数量级数据生成XML文件执行时间最短的生成效率参数作为执行标准，基于执行标准进行实际环境数据抽取并生成XML文件。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄文淮，邓慧挺，余建成，
申请(专利权)人：厦门雅迅网络股份有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人