一种针对数据对象的数据信息获取和分析的方法及装置制造方法及图纸

技术编号:3554303 阅读:126 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种针对数据对象的数据信息获取和分析的方法和装置,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包含如下步骤:接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。本发明专利技术由于采用了网络行为数据信息结合电话行为数据信息作为综合分析的基础,因此能有效的降低误识别率,有效的提高识别效率。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别是针对数据对象的数据信息获取和分析的方法及装置
技术介绍
目前随着互联网技术应用的越来越广泛,人们很多的日常工作和娱乐都在网络上进行,互联网也为了满足人民日益增长的各种需求,提供了各种各样的服务,这些服务在互联网上以数据对象的形式存在,比如新闻、多媒体内容、网络广告等,人民为了享受这些服务,都需要对所提供的数据对象进行各种各样的操作,这些操作行为我们称之为针对数据对象的行为,这样既方便了广大互联网用户,也为各种服务提供商带来了无限商机,但随着互联网技术的发展,产生了越来越多阻碍其进步的因素,比如针对数据对象的操作,许多互联网用户出于各种目的会产生大量的无效的针对数据对象的操作,这些无效的针对数据对象的操作不仅消耗互联网资源,也给那些服务提供者带了大量的困扰,下面以互联网上最常见的网络广告为例来分析。目前,互联网已经成为一种非常直接、有效的广告媒介,但令广告客户感到困扰的是,网络广告受到的点击有很大一部分都属于欺诈点击。在常规搜索模式下,当用户搜索某个关键字时,搜索结果页面中就会出现一些相关公司的广告。如果用户点击广告,广告客户就需要向搜索服务提供商支付一定的费用。通过这一模式,广告客户可以更有针对性地接触潜在用户,搜索服务提供商也可以获得丰厚的利润。但不幸的是,搜索服务提供商的网络广告系统成为了滋生点击欺诈的温床,因为欺骗该系统非常容易。如Google、雅虎和其它搜索服务提供商在第三方网站上投放了大量广告,并依据广告点击次数同相关网站共享部分营收。为了获得更多营收,很多缺乏道德感的网站会通过各种途径重复点击自己网站上的广告,而这些点击对于广告客户没有任何意义。此外,还有很多公司重复点击竞争对手的网络广告,目的是消耗竞争对手的广告预算。目前,点击欺诈已经成为阻碍网络广告市场健康发展的一大顽疾,各搜索厂商一直都致力于通过技术和服务等来防止减少点击欺诈的发生。雅虎公司发布的-->全新反点击欺诈技术就是在这方面的有力探索,它以点击分析过滤、历史行为分析过滤、AI模式识别过滤、雅虎趋势分析平台等四大技术特点有效防止和减少了点击欺诈的发生。凭借全球领先的搜索智能识别技术,雅虎公司的反点击欺诈系统可以对每一次点击的用户端信息、以及其他几十种常用的点击参数进行分析,智能判断其中的欺诈点击并进行直接过滤。其次,通过综合分析每一个浏览用户在一段时间内的点击行为,雅虎公司的反点击欺诈系统可以主动过滤其中存在的欺诈点击。尤其值得一提的是该反欺诈点击系统先进的AI模式识别过滤功能,它利用雅虎在各国家的反欺诈点击小组进行密切联系,共同建立了一个庞大的欺诈点击样例库。通过AI模式识别系统,对来自全球的样例库进行训练,使得AI模式识别系统可以综合多种特征准确识别出欺诈点击。除此之外,该反欺诈点击系统还建立了雅虎趋势分析平台,综合收集来自雅虎搜索引擎和雅虎搜索竞价的明细信息,基于历史采样统计,进行点击趋势分析,可以更加有效的防御一些未知的作弊方式,凭借领先的反点击欺诈技术,雅虎已经识别了数十亿次恶意点击,避免了广告客户的利益损失。虽然像雅虎这一类的反欺诈点击技术能在一定程度上识别出点击欺诈,但由于它只是单纯的从点击网络广告的网络行为分析的基础上进行的识别,这样的技术具有以下一些缺陷:首先,该类技术由于完全从用户的网络行为进行分析,不能真正完全地识别点击欺诈,因为欺诈者在网络上是可以完全按照真实用户的操作行为进行模拟广告点击的,这个是该类技术无法识别出来的。其次,运算方法复杂,需要积累大量用户数据进行分析,成本很高,例如雅虎公司的反欺诈系统中的核心技术AI模式识别过滤功能,需要在全球建立一个庞大的欺诈点击/无效点击样例库,对来自全球的样例库进行训练,使得AI模式识别系统可以综合多种特征准确识别出欺诈点击/无效点击,这样的系统需要大量的数据为基础,花费大量的人力物力才能做到。最后,误识别率高,常常会将一些真实的广告行为识别为欺诈行为,这样会使广告提供商承担大量的损失。总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够准确、有效的识别出针对数据对象的行为是有效、无效行为等类别。
技术实现思路
-->本专利技术所要解决的技术问题是提供一种能够有效的识别出针对数据对象的行为是有效行为、无效行为的类别,从而可以真正完全地识别出互联网用户针对网络上的数据对象的行为哪些是有效的,哪些是无效的,并且运算方法简单,成本低,误码率低,从而更加准确的排除无效行为。为此,根据本专利技术的一实施例,公开了一种针对数据对象的数据信息获取和分析的方法,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包括如下步骤:接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。优选的,所述方法还可以包括:当某个IP地址用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP地址在预置时间段为无效IP地址,该无效IP地址在预置时间段对应的触发行为均无效。优选的,所述电话行为数据信息的获取为:通话结束后,接收通信网络实时返回的针对该数据对象的电话行为数据信息。优选的,所述的IP地址、电话号码、有效通话时长对应存储在展示数据对象的网站的数据库中。优选的,所述方法还可以包括:将分散的针对同一数据对象的数据信息汇集后集中存储至一数据库中;所述同一数据对象分散在多个网站中进行展示。优选的,所述的数据对象为网站上展示的网络广告。其中,所述获取的数据对象的电话行为的数据信息为通信网络提供给网站的通话记录,所述的通话记录包括:呼叫终端客户的电话号码和网络广告厂商的电话号码、呼叫终端客户的IP、来源网址URL、有效通话开始时间、有效通话结束时间、有效通话时长、通话次数。优选的,所述方法还可以包括:获取用户的IP地址、通话记录;分析每个IP用户对应的通话记录,如果某个IP的用户的有效通话时间小于预设时间,或者某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,-->则该IP用户为无效用户。优选的,所述方法还可以包括:获取用户的通话记录;分析不同电话号码的通话记录,如果某个电话号码的通话次数超过预设频率或者有效通话时长小于预设时间,则该电话用户为无效用户。进一步,当IP用户为无效用户或者电话用户为无效用户时,确定该用户的本次点击行为无效,或者确定该用户之后的所有点击行为无效。根据本专利技术的另一实施例,还公开了一种针对数据对象的数据信息获取和分析的装置,包含:第一信息获取模块,用于接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;第二信息获取模块,用于发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;以及,获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;第一分析模块,用于分析IP地址对应的电话号码,当某个IP地址用户的有效通话时长小于预设时间,则本文档来自技高网
...

【技术保护点】
一种针对数据对象的数据信息获取和分析的方法,其特征在于,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包含如下步骤:接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。

【技术特征摘要】
1、一种针对数据对象的数据信息获取和分析的方法,其特征在于,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包含如下步骤:接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。2、根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,还包括:当某个IP地址用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP地址在预置时间段为无效IP地址,该无效IP地址在预置时间段对应的触发行为均无效。3、根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,所述电话行为数据信息的获取为:通话结束后,接收通信网络实时返回的针对该数据对象的电话行为数据信息。4、根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,所述的IP地址、电话号码、有效通话时长对应存储在展示数据对象的网站的数据库中。5、根据权利要求4所述的一种数据信息获取和分析的方法,其特征在于,还包括:将分散的针对同一数据对象的数据信息汇集后集中存储至一数据库中;所述同一数据对象分散在多个网站中进行展示。6、根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,所述的数据对象为网站上展示的网络广告。7、根据权利要求6所述的一种数据信息获取和分析的方法,其特征在于,所述获取的数据对象的电话行为的数据信息为通信网络提供给网站的通话记录,所述的通话记录包括:呼叫终端客户的电话号码和网络广告厂商的电话号码、呼叫终端客户的IP、来源网址URL、有效通话开始时间、有效通话结束时间、有效通话时长、通话次数。8、根据权利要求7所述的一种数据信息获取和分析的方法,其特征在于,还包括:获取用户的IP地址、通话记录;分析每个IP用户对应的通话记录,如果某个IP的用户的有效通话时间小于预设时间,或者某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP用户为无效用户。9、根据权利要求7所述的一种数据获取和分析的方法,其特征在于,还包括:获取用户的通话记录;分析不同电话号码的通话记录,如果某个电话号码的通话次数超过预设频率或者有效通话时长小于预设时间,则该电话用户为无效用户。10、根据权利要求8或9所述的...

【专利技术属性】
技术研发人员:田军陈永斌郭庆李俊
申请(专利权)人:北京互联易通信息技术有限公司
类型:发明
国别省市:11[]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利