一种基于新媒体业务的内容爬测分析方法技术

技术编号:33027187 阅读:16 留言:0更新日期:2022-04-15 09:02
本发明专利技术提出了一种基于新媒体业务的内容爬测分析方法,新媒体业务载体众多,传统的分析方法很难满足各类新媒体业务的分析需求,且目前各种新媒体业务的应用程序都涉及加密认证流程,现有技术没有办法针对所有的应用程序的加密认证流程进行模拟,导致新媒体业务内容爬测分析能力受限。本发明专利技术基于新媒体业务载体特性,提出了一种基于用户行为和用户终端为基础的爬测方法,结合新媒体业务常用的应用场景,通过对每种新媒体业务实际的用户使用流程,进行模板脚本录制,再通过平台调度脚本执行,重复执行脚本任务,逐层自适应遍历,实现对所有新媒体业务内容爬测分析。所有新媒体业务内容爬测分析。所有新媒体业务内容爬测分析。

【技术实现步骤摘要】
一种基于新媒体业务的内容爬测分析方法


[0001]本专利技术属于电子信息
,涉及了一种基于新媒体业务的内容爬测分析方法。

技术介绍

[0002]新媒体是指相对传统媒体而言,通过数字压缩、无线网络技术为支撑,利用其大容量、 实时性和交互性等优点,跨越地理界线最终得以实现全球化的媒体。随着互联网技术、5G 技术、边缘技术、智能AI计算的快速发展,新媒体逐渐受到人们的关注,改变了我们的信 息环境,给我们提供了一个共享、互动的信息环境。
[0003]但是新媒体业务也是一把双刃剑,我们也要面对新媒体环境下给我们带来的信息安全 的挑战。新媒体业务的快速发展,既有利也有弊,这对于内容安全工作是一项全新的挑战。 新媒体在传播方式方面具有交互性、共享性、广泛性等特点,因此对于内容安全造成了很 大的困扰。近几年来,各种商业信息内容、网络信息内容、个人信息内容的泄露等现象层 出不穷,所以对于新媒体环境的内容安全保障研究是有迫切需求的。新媒体业务相对于传 统媒体业务,有更多元化的用户体验、更丰富的信息资源、更及时的资源更新,但是这种 便捷的信息传播接入方式,同时也存在着一定的安全隐患。

技术实现思路

[0004]本专利技术的目的旨在至少解决所述技术缺陷之一。
[0005]为此,本专利技术的目的在于提出一种基于新媒体业务的内容爬测分析方法,以解决背 景技术中所提到的问题,克服现有技术中存在的不足。
[0006]为了实现上述目的,本专利技术的实施例提供一种基于新媒体业务的内容爬测分析方法, 包括:<br/>[0007]S1新媒体业务场景模板定义,包括:针对新媒体业务场景需要定义的内容包括新媒体 业务类型、业务名称、厂家信息、入口URL、终端类型、爬测类,新媒体业务场景模板主 要用于脚本关键信息的预配置,降低在实际应用中重复的脚本策略配置,提升新媒体业务 内容爬测分析方法的适配效率;
[0008]S2接入终端类型定义,包括:接入终端的类型配置主要用于在新媒体业务测试过程中, 通过不同的终端载体新媒体业务版面和内容回有差异,通过本项参数的定义让新媒体业务 内容测试覆盖更多的测试终端类型,为不同的终端类型定义不同的处理逻辑流程;
[0009]S3基于终端和业务类型的执行脚本录制,包括定义新媒体业务内容爬测的主要流程, 需要基于每种新媒体业务单独录制脚本,录制步骤包括:
[0010]S31输入终端类型,如果输入的终端类型不在已有的终端类型列表中,需要新增终端 类型;
[0011]S32输入新媒体业务场景,如果输入的新媒体业务场景不在已有的新媒体业务场景中 需要新增新媒体业务场景;
[0012]S33输入终端IP地址和端口,确认网络是否可以正常连接,如果不能正常连接需要排 查网络问题,修复网络连通性;
[0013]S34加载终端界面,远程播放和操控终端界面;
[0014]S35录制遍历脚本的关键步骤;
[0015]S36预执行已录制的脚本步骤,脚本执行正常则流程结束,脚本执行异常则需要排查 脚本的错误步骤并修复,重新执行脚本;
[0016]S4脚本自适应策略配置,其中,采用Jump Point Search跳点搜索算法;
[0017]S5脚本任务管理策略;
[0018]S6新媒体业务内容数据分层关联分析,其中,基于S1~S5完成了新媒体业务内容爬测 任务后,将所有的新媒体业务数据上传到平台侧进行数据多层关联分析的过程,数据多层 关联分析主要采用凝聚式层次聚类算法;
[0019]S7新媒体业务详细爬测数据存储,包括:将上述S1

S5的脚本任务执行后爬测下来的 详细新媒体业务内容数据和S6基于多层关联分析后得出的新媒体业务分层关联数据进行 存储,用户直接通过平台WEB界面查询和导出新媒体业务相关的内容爬测数据,也可基于 系统的存储数据进行二次计算。
[0020]进一步,在所述步骤S2中,接入终端类型的定义主要包括:
[0021]S21终端类型:包括Android客户端、IOS客户端、PC客户端、机顶盒客户端、智能 电视客户端;
[0022]S22终端厂家:终端设备硬件厂家;终端型号:终端设备硬件型号;
[0023]S23终端测试参数:是否执行主动爬测测试并上报还是只需要将终端被动采集数据上 报即可;
[0024]S24入口测试协议:终端类型新媒体业务测试的入口资源类型协议配置;
[0025]S25是否下载图片:新媒体业务涉及很多图片信息,但是图片占用带宽和存储空间较 大,故需要的定义是否在测试过程中下载图片;
[0026]S26图片下载大小:单张图片下载大小上限设置;
[0027]S27图片下载超时:单张图片下载超时时间设置。
[0028]进一步,在所述步骤S4中,
[0029]S41寻找从S到E的最短路径,首先初始化将起点S加入openset;
[0030]S42从openset取出F值最小的点S,并从openset删除,加入closedset,S的 当前方向为空,则沿八个方向寻找跳点,从S出发只有下、右、右下三个方向可走,但向 下搜索到D遇到边界,向右搜索到F遇到阻挡,因此都没有找到跳点,然后沿右下方向 寻找跳点,在G点,parent(G)为S,praent(G)到S为对角线移动,并且G经过垂直 方向移动,即向下移动到达跳点I,因此G为跳点;将G加入openset;
[0031]S43从openset取出F值最小的点G,并从openset删除,加入closedset,因为 G当前方向为对角线方向,从S到G的方向,因此在右,即当前方向水平分量、下,即 当前方向垂直分量、右下,即当前方向三个方向寻找跳点,从G出发只有向下可走,因此 向下寻找跳点,将I加入openset。
[0032]S44从openset取出F值最小的点I,并从openset删除,加入closedset,因为 I的当前方向为直线方向,从G到I的方向,在I点时I的左后方不可走且左方、前 方可走,因此沿
左、左前、前寻找跳点,但左前、前都遇到边界,只有向左寻找到跳点Q, 因此将Q加入openset;
[0033]S45从openset取出F值最小的点Q,并从openset删除,加入closedset,因为 Q的当前方向为直线方向,Q的左后方不可走且左方、前方可走,因此沿左、左前、前寻 找跳点,但左前、前都遇到边界,只有向左寻找到跳点E,因此将E加入openset。从 openset取出F值最小的点E,因为E是目标点,因此寻路结束,路径是S、G、I、Q、 E。
[0034]进一步,在所述步骤S5中,脚本任务管理策略包括:
[0035]S51超时时间:任务执行的超时时间设置;
[0036]S52测试结果上报间隔,定义脚本任务执行过程中多久向平台侧上报一次已完成的测 试数据;
[0037]S53终端界面回传方式:定义测试终端的界面通过哪种方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于新媒体业务的内容爬测分析方法,其特征在于,包括如下步骤:S1新媒体业务场景模板定义,包括:针对新媒体业务场景需要定义的内容包括新媒体业务类型、业务名称、厂家信息、入口URL、终端类型、爬测类,新媒体业务场景模板主要用于脚本关键信息的预配置,降低在实际应用中重复的脚本策略配置,提升新媒体业务内容爬测分析方法的适配效率;S2接入终端类型定义,包括:接入终端的类型配置主要用于在新媒体业务测试过程中,通过不同的终端载体新媒体业务版面和内容回有差异,通过本项参数的定义让新媒体业务内容测试覆盖更多的测试终端类型,为不同的终端类型定义不同的处理逻辑流程;S3基于终端和业务类型的执行脚本录制,包括定义新媒体业务内容爬测的主要流程,需要基于每种新媒体业务单独录制脚本,录制步骤包括:S31输入终端类型,如果输入的终端类型不在已有的终端类型列表中,需要新增终端类型;S32输入新媒体业务场景,如果输入的新媒体业务场景不在已有的新媒体业务场景中需要新增新媒体业务场景;S33输入终端IP地址和端口,确认网络是否可以正常连接,如果不能正常连接需要排查网络问题,修复网络连通性;S34加载终端界面,远程播放和操控终端界面;S35录制遍历脚本的关键步骤;S36预执行已录制的脚本步骤,脚本执行正常则流程结束,脚本执行异常则需要排查脚本的错误步骤并修复,重新执行脚本;S4脚本自适应策略配置,其中,采用Jump Point Search跳点搜索算法;S5脚本任务管理策略;S6新媒体业务内容数据分层关联分析,其中,基于S1~S5完成了新媒体业务内容爬测任务后,将所有的新媒体业务数据上传到平台侧进行数据多层关联分析的过程,数据多层关联分析主要采用凝聚式层次聚类算法;S7新媒体业务详细爬测数据存储,包括:将上述S1

S5的脚本任务执行后爬测下来的详细新媒体业务内容数据和S6基于多层关联分析后得出的新媒体业务分层关联数据进行存储,用户直接通过平台WEB界面查询和导出新媒体业务相关的内容爬测数据,也可基于系统的存储数据进行二次计算。2.如权利要求1所述的基于新媒体业务的内容爬测分析方法,其特征在于,在所述步骤S2中,接入终端类型的定义主要包括:S21终端类型:包括Android客户端、IOS客户端、PC客户端、机顶盒客户端、智能电视客户端;S22终端厂家:终端设备硬件厂家;终端型号:终端设备硬件型号;S23终端测试参数:是否执行主动爬测测试并上报还是只需要将终端被动采集数据上报即可;S24入口测试协议:终端类型新媒体业务测试的入口资源类型协议配置;S25是否下载图片:新媒体业务涉及很多图片信息,但是图片占用带宽和存储空间较大,故需要的定义是否在测试过程中下载图片;
S26图片下载大小:单张图片下载大小上限设置;S27图片下载超时:单张图片下载超时时间设置。3.如权利要求1所述的基于新媒体业务的内容爬测分...

【专利技术属性】
技术研发人员:林桂云
申请(专利权)人:飞思达技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1