The embodiment of the invention includes service identification method, discloses a mobile Internet: for a single business from the test data to obtain the original uniform resource locator URL data; multiple group split of the original URL data, at least two tuple; the at least two tuple of eligible elements according to the preset merger rules are merged to obtain at least one integration rule; at least one of third party integration rules do not belong to the single business from the at least one integration rule out at least one integration rule to be optimized. An embodiment of the invention also discloses a service identification device for the mobile Internet.
【技术实现步骤摘要】
移动互联网的业务识别方法及装置
本专利技术涉及移动通信的数据分析技术,尤其涉及一种移动互联网的业务识别方法及装置。
技术介绍
在移动互联网时代,移动互联网的绝大部分应用服务,如即时通信、搜索、网络视频、网络音乐等,目前在移动终端中的渗透比例非常大,相对于传统互联网,移动互联网更加贴近用户生活;由于其贴近用户生活的特点,移动互联网网络流中包含着大量的用户使用习惯、网站访问统计及应用服务使用情况等大量业务数据,这些业务数据对于优化网络服务、病毒防治、精确服务推送等有着巨大的潜在价值。对于移动互联网业务识别是规则的建立,现有技术方案是根据工作人员的经验通过测试装置拨测,利用抓包工具进行抓包来研究移动网络流量,截取数据包和会话协议,针对单个业务提取出多次拨测均出现的规则。由于现有技术依赖测试人员的经验,局限性大,对测试人员的个人水平要求高,也无法灵活扩展识别规则,且移动业务种类繁多,同时具有业务流量大、网络请求复杂、识别方法复杂多样等特点,所以在快速响应目前移动互联网复杂性的业务需求的过程中,现有技术容易造成业务识别的质量低下而影响工作效率。
技术实现思路
有鉴于此,本专利技 ...
【技术保护点】
一种移动互联网的业务识别方法,其特征在于,所述方法包括:针对单一业务从拨测数据中获取原始统一资源定位符URL数据;对所述原始URL数据进行多元组拆分,得到至少两个元组;将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并,得到至少一个整合规则;将不属于所述单一业务的至少一个第三方整合规则从所述至少一个整合规则中剔除,得到优化后的至少一个整合规则。
【技术特征摘要】
1.一种移动互联网的业务识别方法,其特征在于,所述方法包括:针对单一业务从拨测数据中获取原始统一资源定位符URL数据;对所述原始URL数据进行多元组拆分,得到至少两个元组;将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并,得到至少一个整合规则;将不属于所述单一业务的至少一个第三方整合规则从所述至少一个整合规则中剔除,得到优化后的至少一个整合规则。2.根据权利要求1所述的方法,其特征在于,所述将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并之前,所述方法还包括:根据所述元组中的每个元素的访问数量得到在所述元组中的每个元素的可信度;判断所述元素的可信度是否大于等于所在元组的可信度阈值,若所述元素的可信度大于等于所在元组的可信度阈值,则将所述元素确定为符合条件的元素。3.根据权利要求1所述的方法,其特征在于,所述将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并,得到至少一个整合规则,包括:判断所述至少两个元组中的下一级元组中的符合条件的元素是否是由上一级元组中的符合条件的元素派生的,若下一级元组中的符合条件的元素是由上一级元组中的符合条件的元素派生的,则将所述下一级元组中的符合条件的元素通过整合工具整合成所述上一级元组中的符合条件的元素,直至所述上一级元组中的符合条件的元素为域名信息为止;判断所述域名信息中的主体是否相同,且所述域名信息中是否仅包括有不同的数字,若所述域名信息中的主体相同,且所述域名信息中仅包括有不同的数字,则将所述域名信息合并,得到所述至少一个整合规则。4.根据权利要求1、2或3所述的方法,其特征在于,所述针对单一业务从拨测数据中获取多个原始统一资源定位符URL数据,包括:针对单一业务从拨测数据中筛选出属于所述单一业务的URL数据,剔除不属于所述单一业务的URL数据。5.根据权利要求4所述的方法,其特征在于,所述对所述原始URL数据进行多元组拆分,得到至少两个元...
【专利技术属性】
技术研发人员:黄昭文,叶家恒,全俊斌,
申请(专利权)人:中国移动通信集团广东有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。