【技术实现步骤摘要】
网页中多媒体地址的获取方法和装置
本专利技术涉及互联网
,尤其涉及一种网页中多媒体地址的获取方法和装置。
技术介绍
随着多媒体技术的迅速发展,用户对多媒体的需求也不断的提升,比如用户有时不满足于仅在网页上浏览或者观看,希望将所需要的多媒体文件下载到终端设备中,因此,需要获取多媒体的多媒体地址。在网页中提取多媒体地址时,目前,主要通过抓取主链、分析关键字,然后使用人工策略的方式来提取多媒体地址,但是,主要存在以下问题:(1)采用人工策略的方式来提取多媒体地址,所支持的多媒体站点的数目较少,目前,仅支持几个主要的多媒体大站;(2)由于不同的多媒体站点所采用的算法不同,采用人工策略的方式来提取多媒体地址,对于不同的多媒体站点不具有通用性;(3)当多媒体站点的算法更换后,提取多媒体地址所使用的人工策略也需要随之修改,影响技术方案的执行效率且具有滞后性。
技术实现思路
本专利技术旨在至少解决上述技术问题之一。为此,本专利技术的第一个目的在于提出一种网页中多媒体地址的获取方法。该方法通过在虚拟机中模拟多媒体的播放事件来获取多媒体地址,使覆盖的多媒体站点数目大大增加,且对于不同的多媒体站点具有通用性,提升了用户体验。本专利技术的第二个目的在于提出一种网页中多媒体地址的获取装置。为了实现上述目的,本专利技术第一方面实施例的网页中多媒体地址的获取方法包括以下步骤:云端服务器抓取多媒体网页;所述云端服务器建立所述多媒体网页的文件对象模型DOM,并根据所述DOM执行所述多媒体网页中的脚本指令以生成多媒体播放插件;所述云端服务器启动虚拟机,并在所述虚拟机中运行所述多媒体播放插件 ...
【技术保护点】
一种网页中多媒体地址的获取方法,其特征在于,包括:云端服务器抓取多媒体网页;所述云端服务器建立所述多媒体网页的文件对象模型DOM,并根据所述DOM执行所述多媒体网页中的脚本指令以生成多媒体播放插件;所述云端服务器启动虚拟机,并在所述虚拟机中运行所述多媒体播放插件以模拟多媒体的播放事件;以及所述云端服务器通过所述播放事件获取所述多媒体的多媒体地址。
【技术特征摘要】
1.一种网页中多媒体地址的获取方法,其特征在于,包括:云端服务器抓取多媒体网页;所述云端服务器建立所述多媒体网页的文件对象模型DOM,并根据所述DOM执行所述多媒体网页中的脚本指令以生成多媒体播放插件;所述云端服务器启动虚拟机,并在所述虚拟机中运行所述多媒体播放插件以模拟多媒体的播放事件;以及所述云端服务器通过所述播放事件获取所述多媒体的多媒体地址。2.根据权利要求1所述的方法,其特征在于,所述在所述虚拟机中运行所述多媒体播放插件以模拟多媒体的播放事件具体包括:S1、获取所述多媒体播放插件的配置参数;S2、当所述虚拟机进入运行状态后,所述虚拟机根据所述配置参数实例化网络数据流组件NetStream;以及S3、所述虚拟机调用所述NetStream的播放方法NetStream.play以模拟所述播放事件。3.根据权利要求2所述的方法,其特征在于,所述云端服务器通过所述播放事件获取所述多媒体的多媒体地址具体包括:S4、在调用所述NetStream的播放方法NetStream.play的同时记录所述NetStream.play被调用时的参数,其中,记录的所述NetStream.play被调用时的参数为所述多媒体地址。4.根据权利要求2所述的方法,其特征在于,所述虚拟机调用所述NetStream的播放方法NetStream.play以模拟所述播放事件具体包括:S31、所述虚拟机调用所述NetStream.play;S32、所述NetStream.play发送网络请求以获取所述多媒体的元信息;S33、当所述NetStream获取所述元信息后,所述NetStream先后发送元信息事件和播放完成事件至所述虚拟机;S34、所述虚拟机根据所述元信息事件和所述播放完成事件判断所述多媒体文件是否被正确模拟;S35、如果被正确模拟,则修改所述NetStream中的属性参数;S36、所述虚拟机监听所述多媒体是否播放完毕;S37、如果未播放完毕,则根据修改后的所述NetStream的属性参数继续执行步骤S31;以及S38、如果播放完毕,则获取记录的所述NetStream.play被调用时的参数为所述多媒体地址。5.根据权利要求4所述的方法,其特征在于,所述虚拟机监听所述多媒体是否播放完毕,具体包括:判断所述虚拟机是否进入闲置状态;如果进入闲置状态,则进一步判断记录的所述NetStream.play被调用时的参数的个数是否大于0;以及如果大于0,则所述虚拟机监听所述多媒体播放完毕。6.根据权利要求4-5任一项所述的方法,其特征在于,所述元信息包括时长、预设帧数、总字数。7.根据权利要求5所述的方法,其特征在于,所述闲置状态为所述虚拟机的多媒体帧数等于所述元信息的预设帧数时的状态。8.根据权利要求6所述的方法,其特征在于,当所述虚拟机接收到所述播放完成事件时,获取所述播放完成事件中的播放时长,如果所述播放时长和所述元信息事件中的所述元信息的时长一致,则确定所述多媒...
【专利技术属性】
技术研发人员:梁涛,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。