多媒体网页协议信息转换方法、装置及系统制造方法及图纸

技术编号:36297256 阅读:21 留言:0更新日期:2023-01-13 10:11
本发明专利技术公开了一种多媒体网页协议消息转换方法、装置及系统,该方法包括:接收用户提交的URL地址;根据所述URL地址访问多媒体网页;对所述多媒体网页进行元素抓取,得到多媒体数据;将所述多媒体数据转换为5G消息;将所述5G消息返回给所述用户。可以使现有的多媒体网页信息业务平台快捷、方便地使用5G消息系统,实现多媒体网页协议信息与5G消息的转换及发送。现多媒体网页协议信息与5G消息的转换及发送。现多媒体网页协议信息与5G消息的转换及发送。

【技术实现步骤摘要】
多媒体网页协议信息转换方法、装置及系统


[0001]本专利技术涉及通信
,具体涉及一种多媒体网页协议信息转换方法、装置及系统。

技术介绍

[0002]目前,移动运营商都在加大力度建设各自的5G消息系统,手机终端厂商也在逐渐发布支持5G消息的手机终端。5G消息与短信相比较,具有丰富的媒体资源展示,菜单操作,强交互能力的优势,更有利于消息内容的丰富和推广效果。
[0003]在5G消息出现之前,各企业和应用对多媒体消息已有多种展现形式,例如PC端网站、移动终端HTML5(Hyper Text Mark

up Language 5,超文本标记语言规范5,是构建Web内容的一种语言描述方式)、公众号。各企业和应用在使用5G消息发送同样的内容时,需要先从源网站复制下载图片视频等多媒体资源,再重新按照5G消息的格式和要求进行编辑,这需要增加额外的工作量,也有一定的操作技术门槛,且信息一致性方面也可能产生偏差。各企业和应用如果重新开发5G消息功能,面临开发工作量,而且开发周期很长,不利于目前市场上做消息推广的企业和平台快速使用新型的5G消息形式。而且,当5G消息协议发生变化时,各企业的5G消息编辑系统还需要重新开发和升级,造成重复开发工作。
[0004]为此,如何使现有的多媒体网页信息业务平台快捷、方便地适用5G消息系统是业界亟待解决的一个问题。

技术实现思路

[0005]本专利技术提供一种多媒体网页协议信息转换方法、装置及系统,可以使现有的多媒体网页信息业务平台快捷、方便地使用5G消息系统,实现多媒体网页协议信息与5G消息的转换及发送。
[0006]为此,本专利技术提供如下技术方案:
[0007]一种多媒体网页协议信息转换方法,所述方法包括:
[0008]接收用户提交的URL地址;
[0009]根据所述URL地址访问多媒体网页;
[0010]对所述多媒体网页进行元素抓取,得到多媒体数据;
[0011]将所述多媒体数据转换为5G消息;
[0012]将所述5G消息返回给所述用户。
[0013]可选地,所述对所述多媒体网页进行元素抓取,得到多媒体数据包括:
[0014]利用爬虫分析器对所述多媒体网页进行元素抓取,得到多媒体数据。
[0015]可选地,所述对所述多媒体网页进行元素抓取,得到多媒体数据包括以下任意一种或多种:
[0016]从所述多媒体网页对应的HTML文档获取静态信息;
[0017]从所述多媒体网页对应的JavaScript对象数据获取变量信息;
[0018]从加载渲染后页面的数据节点获取XHR动态渲染信息;
[0019]抓取动态数据。
[0020]可选地,所述根据所述URL地址访问多媒体网页包括:
[0021]采用躲避反爬虫方式访问所述多媒体网页。
[0022]可选地,所述采用躲避反爬虫方式访问所述多媒体网页包括:
[0023]设置伪头部用户代理信息,以绕开反爬虫检测。
[0024]可选地,所述方法还包括:
[0025]设置IP代理池和代理服务器,所述IP代理池包括多个IP代理;
[0026]所述采用躲避反爬虫方式访问所述多媒体网页包括:
[0027]向代理服务器发送任务请求,所述任务请求中包括所述URL地址;
[0028]所述代理服务器接收到所述任务请求后,从所述IP代理池中选择一个IP代理,并通过所述IP代理访问所述多媒体网页。
[0029]可选地,所述采用躲避反爬虫方式访问所述多媒体网页还包括:
[0030]利用图片识别库识别滑块及所述滑块的位置;
[0031]利用程序模拟拖动所述滑块到目标位置。
[0032]一种多媒体网页协议信息转换装置,所述装置包括:
[0033]用户接口模块,用于接收用户提交的URL地址;
[0034]网页访问模块,用于根据所述URL地址访问多媒体网页;
[0035]数据抓取模块,用于对所述多媒体网页进行元素抓取,得到多媒体数据;
[0036]转换模块,用于将所述多媒体数据转换为5G消息;
[0037]所述用户接口模块,还用于将所述5G消息返回给所述用户。
[0038]可选地,所述数据抓取模块,具体用于利用爬虫分析器对所述多媒体网页进行元素抓取,得到多媒体数据。
[0039]可选地,所述装置还包括:
[0040]躲避反爬虫处理模块,用于设置躲避反爬虫方式;
[0041]所述网页访问模块,采用所述躲避反爬虫方式访问所述多媒体网页。
[0042]一种多媒体网页协议信息转换系统,所述系统包括:多媒体网页信息业务平台、以及前面所述的多媒体网页协议信息转换装置;
[0043]所述多媒体网页信息业务平台,用于登录所述多媒体网页协议信息转换装置,提交URL地址;
[0044]所述多媒体网页协议信息转换装置,用于将所述URL地址对应的多媒体网页中的信息转换为5G消息,将所述5G消息返回给所述多媒体网页信息业务平台。
[0045]本专利技术提供的多媒体网页协议消息转换方法、装置及系统,接收用户提交的URL地址;根据所述URL地址访问多媒体网页;对所述多媒体网页进行元素抓取,得到多媒体数据;将所述多媒体数据转换为5G消息并返回给所述用户。整个过程中用户只需要提供多媒体资源的URL地址,即可实现相应5G消息的生成,而不需额外复制下载多媒体资源重新上传处理,节省了操作时间和成本。
附图说明
[0046]图1是本专利技术实施例提供的多媒体网页协议信息转换方法的一种流程图;
[0047]图2是本专利技术实施例提供的多媒体网页协议信息转换装置的一种结构示意图;
[0048]图3是本专利技术实施例提供的多媒体网页协议信息转换装置的另一种结构示意图;
[0049]图4是本专利技术实施例提供的多媒体网页协议信息转换系统的一种结构示意图。
具体实施方式
[0050]为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。
[0051]5G消息基于HTTPS(Hypertext Transfer Protocol Secure,安全的超文本传输协议)协议,通过SSL(Secure Sockets Layer,安全套接层)保证数据传输安全和完整性。5G消息支持发送文本、图片、音视频、地理位置等消息;还可与商户的聊天机器人进行交互,获取一定时间的智能服务。
[0052]5G消息包括请求头和消息体,其中:
[0053]请求头包括以下各字段:HTTP头域(用于保存鉴权信息)、请求时间戳、请求流水号、平台鉴权身份ID(即各平台唯一标识)。
[0054]消息体包括表1中所示的各元素:
[0055]表1
[0056][0057]针对现有的多媒体网页信息业务平台在使用5G消息发送同样内容本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体网页协议信息转换方法,其特征在于,所述方法包括:接收用户提交的URL地址;根据所述URL地址访问多媒体网页;对所述多媒体网页进行元素抓取,得到多媒体数据;将所述多媒体数据转换为5G消息;将所述5G消息返回给所述用户。2.根据权利要求1所述的方法,其特征在于,所述对所述多媒体网页进行元素抓取,得到多媒体数据包括:利用爬虫分析器对所述多媒体网页进行元素抓取,得到多媒体数据。3.根据权利要求2所述的方法,其特征在于,所述对所述多媒体网页进行元素抓取,得到多媒体数据包括以下任意一种或多种:从所述多媒体网页对应的HTML文档获取静态信息;从所述多媒体网页对应的JavaScript对象数据获取变量信息;从加载渲染后页面的数据节点获取XHR动态渲染信息;抓取动态数据。4.权利要求2或3所述的方法,其特征在于,所述根据所述URL地址访问多媒体网页包括:采用躲避反爬虫方式访问所述多媒体网页。5.根据权利要求4所述的方法,其特征在于,所述采用躲避反爬虫方式访问所述多媒体网页包括:设置伪头部用户代理信息,以绕开反爬虫检测。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:设置IP代理池和代理服务器,所述IP代理池包括多个IP代理;所述采用躲避反爬虫方式访问所述多媒体网页包括:向代理服务器发送任务请求,所述任务请求中包括所述URL地址;所述代理服务器接收到所述任务请求后,从所述IP代理池中选择一个IP代...

【专利技术属性】
技术研发人员:张晓明刘春明王思纬刘潇阳靖旭初李桂娴邹开举刘杉李冉赵艳华
申请(专利权)人:卓望信息技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1