【技术实现步骤摘要】
一种基于新媒体业务的内容爬测分析方法
[0001]本专利技术属于电子信息
,涉及了一种基于新媒体业务的内容爬测分析方法。
技术介绍
[0002]新媒体是指相对传统媒体而言,通过数字压缩、无线网络技术为支撑,利用其大容量、 实时性和交互性等优点,跨越地理界线最终得以实现全球化的媒体。随着互联网技术、5G 技术、边缘技术、智能AI计算的快速发展,新媒体逐渐受到人们的关注,改变了我们的信 息环境,给我们提供了一个共享、互动的信息环境。
[0003]但是新媒体业务也是一把双刃剑,我们也要面对新媒体环境下给我们带来的信息安全 的挑战。新媒体业务的快速发展,既有利也有弊,这对于内容安全工作是一项全新的挑战。 新媒体在传播方式方面具有交互性、共享性、广泛性等特点,因此对于内容安全造成了很 大的困扰。近几年来,各种商业信息内容、网络信息内容、个人信息内容的泄露等现象层 出不穷,所以对于新媒体环境的内容安全保障研究是有迫切需求的。新媒体业务相对于传 统媒体业务,有更多元化的用户体验、更丰富的信息资源、更及时的资源更新,但是这种 便捷的信息传播接入方式,同时也存在着一定的安全隐患。
技术实现思路
[0004]本专利技术的目的旨在至少解决所述技术缺陷之一。
[0005]为此,本专利技术的目的在于提出一种基于新媒体业务的内容爬测分析方法,以解决背 景技术中所提到的问题,克服现有技术中存在的不足。
[0006]为了实现上述目的,本专利技术的实施例提供一种基于新媒体业务的内容爬测分析方法, 包括:< ...
【技术保护点】
【技术特征摘要】
1.一种基于新媒体业务的内容爬测分析方法,其特征在于,包括如下步骤:S1新媒体业务场景模板定义,包括:针对新媒体业务场景需要定义的内容包括新媒体业务类型、业务名称、厂家信息、入口URL、终端类型、爬测类,新媒体业务场景模板主要用于脚本关键信息的预配置,降低在实际应用中重复的脚本策略配置,提升新媒体业务内容爬测分析方法的适配效率;S2接入终端类型定义,包括:接入终端的类型配置主要用于在新媒体业务测试过程中,通过不同的终端载体新媒体业务版面和内容回有差异,通过本项参数的定义让新媒体业务内容测试覆盖更多的测试终端类型,为不同的终端类型定义不同的处理逻辑流程;S3基于终端和业务类型的执行脚本录制,包括定义新媒体业务内容爬测的主要流程,需要基于每种新媒体业务单独录制脚本,录制步骤包括:S31输入终端类型,如果输入的终端类型不在已有的终端类型列表中,需要新增终端类型;S32输入新媒体业务场景,如果输入的新媒体业务场景不在已有的新媒体业务场景中需要新增新媒体业务场景;S33输入终端IP地址和端口,确认网络是否可以正常连接,如果不能正常连接需要排查网络问题,修复网络连通性;S34加载终端界面,远程播放和操控终端界面;S35录制遍历脚本的关键步骤;S36预执行已录制的脚本步骤,脚本执行正常则流程结束,脚本执行异常则需要排查脚本的错误步骤并修复,重新执行脚本;S4脚本自适应策略配置,其中,采用Jump Point Search跳点搜索算法;S5脚本任务管理策略;S6新媒体业务内容数据分层关联分析,其中,基于S1~S5完成了新媒体业务内容爬测任务后,将所有的新媒体业务数据上传到平台侧进行数据多层关联分析的过程,数据多层关联分析主要采用凝聚式层次聚类算法;S7新媒体业务详细爬测数据存储,包括:将上述S1
‑
S5的脚本任务执行后爬测下来的详细新媒体业务内容数据和S6基于多层关联分析后得出的新媒体业务分层关联数据进行存储,用户直接通过平台WEB界面查询和导出新媒体业务相关的内容爬测数据,也可基于系统的存储数据进行二次计算。2.如权利要求1所述的基于新媒体业务的内容爬测分析方法,其特征在于,在所述步骤S2中,接入终端类型的定义主要包括:S21终端类型:包括Android客户端、IOS客户端、PC客户端、机顶盒客户端、智能电视客户端;S22终端厂家:终端设备硬件厂家;终端型号:终端设备硬件型号;S23终端测试参数:是否执行主动爬测测试并上报还是只需要将终端被动采集数据上报即可;S24入口测试协议:终端类型新媒体业务测试的入口资源类型协议配置;S25是否下载图片:新媒体业务涉及很多图片信息,但是图片占用带宽和存储空间较大,故需要的定义是否在测试过程中下载图片;
S26图片下载大小:单张图片下载大小上限设置;S27图片下载超时:单张图片下载超时时间设置。3.如权利要求1所述的基于新媒体业务的内容爬测分...
【专利技术属性】
技术研发人员:林桂云,
申请(专利权)人:飞思达技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。