【技术实现步骤摘要】
面向虚拟训练系统的数据收集系统及方法
[0001]本专利技术涉及数据处理
,尤其涉及一种面向虚拟训练系统的数据收集系统及方法。
技术介绍
[0002]如何把训练数据转换为信息、知识,用于指导优化训练过程,是提高训练效果的主要瓶颈。面向虚拟训练软件开展数据仓库技术(Extract
‑
Transform
‑
Load,ETL)是主要的一个技术手段,首先需要收集训练过程数据,快速高效的收集各类型虚拟训练应用中的数据,可以便于后续将数据进行各种变形和转换,构造出易于分析和理解的数据。
[0003]在无法直接读取数据存储的情况下,如无法访问数据库时,常见的采集方法包括爬虫等。
[0004]但是爬虫只能针对web服务,这种虚拟训练程序数据收集方法局限性较大,无法适应不同的应用场景。
技术实现思路
[0005]本专利技术提供的面向虚拟训练系统的数据收集系统及方法,用以解决现有技术中爬虫只能针对web服务,这种虚拟训练程序数据收集方法局限性较大,无法适应不同的应用场景的 ...
【技术保护点】
【技术特征摘要】
1.一种面向虚拟训练系统的数据收集系统,其特征在于,包括:通信连接的收集模块和预处理模块;所述收集模块,用于对每个运行终端的虚拟训练过程进行页面遍历和行为跟踪,获取所述每个运行终端的信息数据和数据截图;所述预处理模块,用于根据所述每个运行终端的信息数据和所述数据截图,获取所述每个运行终端的预处理数据。2.根据权利要求1所述的面向虚拟训练系统的数据收集系统,其特征在于,所述收集模块,包括:遍历子模块、第一获取子模块和构建子模块;所述遍历子模块,用于基于测试框架,对所述每个运行终端的虚拟训练过程进行页面遍历和用户行为跟踪,以获取每个被操作控件的控件信息,并将控件信息发送至获取子模块;所述第一获取子模块,具体用于:在根据任一被操作控件的控件信息,确定所述任一被操作控件为标准控件的情况下,通过所述任一被操作控件获取数据信息;在根据任一被操作控件的控件信息,确定所述任一被操作控件为非标准控件的情况下,对操作页面进行截图,以获取数据截图;所述构建子模块,用于根据虚拟训练的训练类型,对所述每个运行终端的虚拟训练过程的数据信息和数据截图构建索引。3.根据权利要求2所述的面向虚拟训练系统的数据收集系统,其特征在于,所述收集模块还包括跟踪子模块;所述跟踪子模块,具体用于:在根据任一被操作控件的控件信息,确定所述任一被操作控件为非标准控件的情况下,跟踪所述虚拟训练过程中的用户操作;对所述用户操作进行分析,生成过程文件;读入所述过程文件,以存入多维元组;所述多维元组,生成仿真脚本。4.根据权利要求3所述的面向虚拟训练系统的数据收集系统,其特征在于,所述预处理模块包括:第二获取子模块、文字识别子模块和清洗子模块;所述第二获取子模块,用于根据预设模板,获取所述标准控件中的所述信息数据;所述预设模板是基于所述过程文件生成的;所述文字识别子模块,用于抽取所述数据截图中的文字信息;所述清洗子模块,用于对所述信息数据和所述文字信息进行数据清洗,以获取所述预处理数据。5.根据权利要求1
...
【专利技术属性】
技术研发人员:李肖赫,樊子德,邓雅文,王磊,赵新昱,朱可卿,张伊丹,
申请(专利权)人:中国科学院空天信息创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。