一种基于深度模拟操作的数据采集方法技术

技术编号：37849840 阅读：9 留言：0更新日期：2023-06-14 22:37

本发明专利技术提供一种基于深度模拟操作的数据采集方法，包括：采集多个APP多次进行完整操作行为的数据集；利用数据集训练利用DQN算法建立的模拟用户操作模型；模拟用户操作模型对目标APP进行界面识别和模拟用户操作，根据界面识别的内容类型确定对应的操作类型，同时采集模拟用户操作过程中的所有数据。本发明专利技术通过收集大量不同手机操作不同APP的行为数据进行深度强化学习算法模型训练，通过改进的训练方法，实现通过模拟真人操作的方式采集信息。实现通过模拟真人操作的方式采集信息。实现通过模拟真人操作的方式采集信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度模拟操作的数据采集方法

[0001]本专利技术属于数据采集
，具体涉及一种基于深度模拟操作的数据采集方法。

技术介绍

[0002]移动互联网时代的到来令人们阅读新闻的习惯、方式、场景和渠道均发生了重大的转变。一方面，人们在固定场所浏览新闻的时间减少，而利用碎片化时间获取新闻的时间不断增加，从而呈现出典型的移动化、碎片化、便利化的趋势。另一方面，用户更喜欢“短、平、快”的新闻内容，且在阅读新闻过程中重视自身的参与度，导致移动新闻资讯平台愈发成为用户接收新闻的重要渠道之一。
[0003]为了保证APP的正常使用，需要在测试过程中对APP进行操作并采集相关数据进行进一步研究，例如研究同一型号手机中各项APP是否可以正常运行，同一APP在多个型号的手机中是否可以正常运行。目前一家手机开发企业旗下通常会有多个型号的手机，如今手机型号繁多、APP界面不统一，传统的APP数据采集方案对数据的自动化采集难度大，需要针对不同的手机及APP定制灵活性较差的程序，存在通用性差、操作单一、采集效率低的技术问题。其次，目前的自动化采集的操作单一，基本都是根据设定的程序自动执行，采集的测试数据不具备真实性、广泛性。

技术实现思路

[0004]针对现有技术的上述不足，本专利技术提供一种基于深度模拟操作的数据采集方法，以解决上述技术问题。
[0005]本专利技术提供一种基于深度模拟操作的数据采集方法，包括：采集多个APP多次进行完整操作行为的数据集；利用数据集训练利用DQN算法建立的模拟用户操作模型...

【技术保护点】

【技术特征摘要】
1.一种基于深度模拟操作的数据采集方法，其特征在于，包括：采集多个APP多次进行完整操作行为的数据集；利用数据集训练利用DQN算法建立的模拟用户操作模型；所述模拟用户操作模型包括两个DQN网络模型，分别为行为策略网络和目标策略网络；将用户操作的控件定义为动作a，动作执行后显示的界面为状态s；行为策略网络用于，评价当前状态s
t
下每个动作a
t
的Q()，然后利用贪婪法选择选取Q()最大的动作a
t
，环境接收到动作a
t
后会给出一个奖励r
t
和下一个状态s
t+1
，得到每个时间步t下用户操作APP的状态转移数组{当前状态s
t
，当前状态s
t
生成的动作a
t
, 该动作a
t
产生的奖励r
t
，执行该动作后下一个状态s
t+1
}；目标策略网络用于，根据当前状态s
t
生成当前时刻要执行的动作a
t
，表示根据当前的界面确定待操作的控件，根据下一个状态s
t+1
生成当前时刻要执行的动作a
t
，表示根据待跳转的界面确定待操作的控件；模拟用户操作模型对目标APP进行界面识别和模拟用户操作，根据界面识别的内容类型确定对应的操作类型，同时采集模拟用户操作过程中的所有数据。2.根据权利要求1所述的方法，其特征在于，数据集按照APP化分成多个子集，即数据集为APP_Name＝{APP1,APP2,
…
,APPn,
…
,APPN}，其中N表示APP的总个数，APPn表示第n个APP，n∈[1 ,N]；APPn子集内包括APPn对应用户操作数据APPn_Action，每一个APP操作行为子集为APPn_Action＝{Action1,Action2,
…
,Actionm,
…
,ActionM}，其中M表示在APPn内进行完整操作...

【专利技术属性】
技术研发人员：魏传强，矫娟，宋耀，徐哲，司君波，
申请(专利权)人：山东齐鲁壹点传媒有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人