面向虚拟训练系统的数据收集系统及方法技术方案

技术编号:39320134 阅读:29 留言:0更新日期:2023-11-12 16:01
本发明专利技术提供的面向虚拟训练系统的数据收集系统及方法,属于数据处理技术领域,系统包括:通信连接的收集模块和预处理模块;收集模块,用于对每个运行终端的虚拟训练过程进行页面遍历和行为跟踪,获取每个运行终端的信息数据和数据截图;预处理模块,用于根据每个运行终端的信息数据和数据截图,获取每个运行终端的预处理数据。本发明专利技术提供的面向虚拟训练系统的数据收集系统及方法,通过自动化的非侵入式的数据收集,并整理成便于调用的预处理数据采集接口,能够有效解决训练应用中的数据孤岛的问题,既适用于虚拟训练应用,也适用于web端,能够支持多种类型的数据采集、广泛应用于多种应用场景。应用场景。应用场景。

【技术实现步骤摘要】
面向虚拟训练系统的数据收集系统及方法


[0001]本专利技术涉及数据处理
,尤其涉及一种面向虚拟训练系统的数据收集系统及方法。

技术介绍

[0002]如何把训练数据转换为信息、知识,用于指导优化训练过程,是提高训练效果的主要瓶颈。面向虚拟训练软件开展数据仓库技术(Extract

Transform

Load,ETL)是主要的一个技术手段,首先需要收集训练过程数据,快速高效的收集各类型虚拟训练应用中的数据,可以便于后续将数据进行各种变形和转换,构造出易于分析和理解的数据。
[0003]在无法直接读取数据存储的情况下,如无法访问数据库时,常见的采集方法包括爬虫等。
[0004]但是爬虫只能针对web服务,这种虚拟训练程序数据收集方法局限性较大,无法适应不同的应用场景。

技术实现思路

[0005]本专利技术提供的面向虚拟训练系统的数据收集系统及方法,用以解决现有技术中爬虫只能针对web服务,这种虚拟训练程序数据收集方法局限性较大,无法适应不同的应用场景的缺陷,实现通过自动化本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向虚拟训练系统的数据收集系统,其特征在于,包括:通信连接的收集模块和预处理模块;所述收集模块,用于对每个运行终端的虚拟训练过程进行页面遍历和行为跟踪,获取所述每个运行终端的信息数据和数据截图;所述预处理模块,用于根据所述每个运行终端的信息数据和所述数据截图,获取所述每个运行终端的预处理数据。2.根据权利要求1所述的面向虚拟训练系统的数据收集系统,其特征在于,所述收集模块,包括:遍历子模块、第一获取子模块和构建子模块;所述遍历子模块,用于基于测试框架,对所述每个运行终端的虚拟训练过程进行页面遍历和用户行为跟踪,以获取每个被操作控件的控件信息,并将控件信息发送至获取子模块;所述第一获取子模块,具体用于:在根据任一被操作控件的控件信息,确定所述任一被操作控件为标准控件的情况下,通过所述任一被操作控件获取数据信息;在根据任一被操作控件的控件信息,确定所述任一被操作控件为非标准控件的情况下,对操作页面进行截图,以获取数据截图;所述构建子模块,用于根据虚拟训练的训练类型,对所述每个运行终端的虚拟训练过程的数据信息和数据截图构建索引。3.根据权利要求2所述的面向虚拟训练系统的数据收集系统,其特征在于,所述收集模块还包括跟踪子模块;所述跟踪子模块,具体用于:在根据任一被操作控件的控件信息,确定所述任一被操作控件为非标准控件的情况下,跟踪所述虚拟训练过程中的用户操作;对所述用户操作进行分析,生成过程文件;读入所述过程文件,以存入多维元组;所述多维元组,生成仿真脚本。4.根据权利要求3所述的面向虚拟训练系统的数据收集系统,其特征在于,所述预处理模块包括:第二获取子模块、文字识别子模块和清洗子模块;所述第二获取子模块,用于根据预设模板,获取所述标准控件中的所述信息数据;所述预设模板是基于所述过程文件生成的;所述文字识别子模块,用于抽取所述数据截图中的文字信息;所述清洗子模块,用于对所述信息数据和所述文字信息进行数据清洗,以获取所述预处理数据。5.根据权利要求1
...

【专利技术属性】
技术研发人员:李肖赫樊子德邓雅文王磊赵新昱朱可卿张伊丹
申请(专利权)人:中国科学院空天信息创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1