【技术实现步骤摘要】
HTTPS业务内容识别方法、装置和设备
[0001]本专利技术实施例涉及移动互联网
,具体涉及一种HTTPS业务内容识别方法、装置和设备。
技术介绍
[0002]HTTPS是以安全为目标的HTTP通道,在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性。目前在网络中,常常需要对用户访问内容进行分析,以便统计网络的流量分布情况。
[0003]现有技术中,通常采用HTTPS网页的指纹提取和指纹识别的方法,根据待处理HTTPS网页的数据流,获得待处理HTTPS网页的多个对象各自的密文长度和加密方式;根据待处理HTTPS网页的多个对象各自的密文长度和加密方式,获得多个对象各自的明文长度区间,以确定每个对象的信息,其中每个对象的信息包括该对象对应的最大长度、最小长度和平均长度;以及利用待处理HTTPS网页的多个对象各自的信息,构建待处理HTTPS网页的指纹。指纹识别方法包括:通过提取待识别HTTPS网页的对象信息,与HTTPS网页指纹库中的信息进行匹配,完成识别。
[0004]在研究过程中,本申请的专 ...
【技术保护点】
【技术特征摘要】
1.一种HTTPS业务内容识别方法,其特征在于,包括:获取用户的业务访问记录;根据所述用户的业务访问记录提取所述用户的用户面控制信息;根据预先建立的业务信息特征库从所述用户面控制信息中提取HTTPS业务记录,所述HTTPS业务记录包括HOST信息和页面大小信息;根据所述HOST信息确定所述HTTPS业务记录的类型,并根据所述页面大小信息计算所述HTTPS业务记录对应的流量信息;根据所述HTTPS业务记录对应的流量信息和预设的流量信息阈值,确定所述HTTPS业务记录对应的业务内容。2.如权利要求1所述的HTTPS业务内容识别方法,其特征在于,所述获取用户的业务访问记录包括:在用户业务访问节点布署DPI镜像分光点;通过所述DPI镜像分光点将所述用户的业务访问记录进行镜像;将所述镜像数据存储在共享层服务器中。3.如权利要求1所述的HTTPS业务内容识别方法,其特征在于,所述根据预先建立的业务信息特征库从所述用户面控制信息中提取HTTPS业务记录之前,进一步包括:根据用户面控制信息建立业务信息特征库,所述业务信息特征库包括多个特征码,所述特征码至少包括用户号码、HOST、URL和页面大小信息。4.如权利要求3所述的HTTPS业务内容识别方法,其特征在于,所述根据所述HOST信息确定所述HTTPS业务记录的类型,包括:根据所述HOST信息获取HTTPS信令消息;对所述HTTPS信令消息进行解析得到所述HTTPS业务记录的类型。5.如权利要求4所述的HTTPS业务内容识别方法,其特征在于,所述根据所述HOST信息确定所述HTTPS业务记录的类型,进一步包括:根据所述URL信息获取所述HTTPS业务记录对应的多级域名信息;对所述多级域名信息进行解析得到所述HTTPS业务记录的类型。6.如权利要求1所述的HTTPS业务内容识别方法,其特征在于,所述预设的流量信息阈值为根据预设的神经网络模型进行训练后生成的,包括:向所述预设的神经网络模型输入训练数据,所述训练数据包括HTTPS业务类型和流量信息;所述神经网络模型根据所述HTTPS业务类型和流量信息输出各HTT...
【专利技术属性】
技术研发人员:王伟,程思霖,王磊,卢阳,
申请(专利权)人:中国移动通信集团设计院有限公司中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。