【技术实现步骤摘要】
本专利技术属于数据处理和信息,尤其涉及一种海量网络直播批量数据采集方法及系统。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、随着互联网技术的快速发展,网络直播已成为电子商务、娱乐、教育等领域的重要传播方式。特别是在直播带货场景下,海量的直播内容给市场监管带来了巨大挑战。传统的直播内容监管技术主要存在以下问题:
3、(1)单路采集效率低下。传统音视频采集技术(如电视广告监测)通常采用“一路采集卡对应一路信号”的方式,无法应对网络直播的海量并发特性。在人人均可成为主播的直播环境下,传统方法在人力、设备和成本上均难以实现有效覆盖,导致监管盲区大量存在。
4、(2)反爬机制限制数据获取。现有网络爬虫技术在面对直播平台的动态加密、ip封禁、验证码等反爬机制时,采集成功率低,稳定性差。部分技术尝试通过模拟器多开实现多路采集,但受限于平台安全策略,模拟器环境常被识别并限制访问,导致数据采集失败。
5、(3)内容分析能力不足。当前直播监管主要依赖人工审核
...【技术保护点】
1.一种海量网络直播批量数据采集方法,其特征在于,包括:
2.如权利要求1所述的一种海量网络直播批量数据采集方法,其特征在于,所述通过群控系统模块集中管控多个移动终端设备,实现多平台直播APP的同步运行,包括:
3.如权利要求1所述的一种海量网络直播批量数据采集方法,其特征在于,所述基于Appium框架构建自动化采集模块,模拟真实用户交互行为,抓取直播间元数据,包括:
4.如权利要求1所述的一种海量网络直播批量数据采集方法,其特征在于,利用Scrapy-Redis框架构建分布式爬虫引擎,实时解析直播流媒体源地址,对直播视频流进行分块
...【技术特征摘要】
1.一种海量网络直播批量数据采集方法,其特征在于,包括:
2.如权利要求1所述的一种海量网络直播批量数据采集方法,其特征在于,所述通过群控系统模块集中管控多个移动终端设备,实现多平台直播app的同步运行,包括:
3.如权利要求1所述的一种海量网络直播批量数据采集方法,其特征在于,所述基于appium框架构建自动化采集模块,模拟真实用户交互行为,抓取直播间元数据,包括:
4.如权利要求1所述的一种海量网络直播批量数据采集方法,其特征在于,利用scrapy-redis框架构建分布式爬虫引擎,实时解析直播流媒体源地址,对直播视频流进行分块存储和格式转换,包括:
5.如权利要求4所述的一种海量网络直播批量数据采集方法,其特征在于,所述分析直播平台的网络请求,确定直播视频流的url结构与请求参数,包括:
6.如权利要求1所述的一种海量网络直播...
【专利技术属性】
技术研发人员:顾丽旺,梁娜,沈文婷,郑婕,徐风,
申请(专利权)人:山东省市场监管监测中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。