【技术实现步骤摘要】
互联网上多媒体信息识别方法、装置及电子设备
[0001]本专利技术涉及流量识别
,尤其涉及一种互联网上多媒体信息识别方法、装置及电子设备。
技术介绍
[0002]多媒体技术是目前信息
发展最快、应用最广、变化最快的技术。随着5G网络的普及,互联网中多媒体数据急剧增加。同时,多媒体数据具有更强的隐蔽性。
[0003]为了对互联网中的多媒体数据进行有效监测,首先需要从海量互联网数据中识别出多媒体数据。所以,如何提出一种有效的互联网上多媒体信息识别方案,能够便于从海量互联网数据中识别出多媒体数据,是业界亟需解决的重要课题。
技术实现思路
[0004]针对现有技术存在的问题,本专利技术提供一种互联网上多媒体信息识别方法、装置及电子设备。
[0005]第一方面,本专利技术提供一种互联网上多媒体信息识别方法,包括:
[0006]对互联网数据进行采集,获取待识别数据集;
[0007]对所述待识别数据集进行数据预处理,得到预处理数据集;
[0008]根据多媒体规律规则库对所 ...
【技术保护点】
【技术特征摘要】
1.一种互联网上多媒体信息识别方法,其特征在于,包括:对互联网数据进行采集,获取待识别数据集;对所述待识别数据集进行数据预处理,得到预处理数据集;根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别,所述多媒体规律规则库包括多媒体魔术字节库、多媒体内容类型Content
‑
Type对应关系库和多媒体后缀名对应关系库。2.根据权利要求1所述的互联网上多媒体信息识别方法,其特征在于,所述根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别,包括:获取所述预处理数据集中每个预处理数据的头部字节,与所述多媒体魔术字节库中的魔术字节进行匹配。3.根据权利要求1或2所述的互联网上多媒体信息识别方法,其特征在于,所述根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别,包括:获取预处理数据集中每个预处理数据对应的超文本传输协议HTTP报文中包含的Content
‑
Type字段,与所述多媒体Content
‑
Type对应关系库中的Content
‑
Type字段进行匹配。4.根据权利要求1或2所述的互联网上多媒体信息识别方法,其特征在于,所述根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别,包括:获取预处理数据集中每个预处理数据对应的统一资源定位符URL或超文本传输协议HTTP报文中包含的后缀名,与所述多媒体后缀名对应关系库中的后缀名进行匹配。5.根据权利要求...
【专利技术属性】
技术研发人员:叶明,张琦,
申请(专利权)人:武汉虹旭信息技术有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。