一种信息处理方法及装置、设备制造方法及图纸

技术编号:15763040 阅读:264 留言:0更新日期:2017-07-05 23:48
本发明专利技术公开了一种信息处理方法,所述方法包括:确定待分类的第一触发事件;从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;获取所述分类模型输出的所述第一触发事件的分类结果;输出所述分类结果。本发明专利技术同时还公开了一种信息处理方法及设备。

Information processing method, device and equipment

The invention discloses an information processing method, the method comprises: a first trigger event to determine the classification; get the user from the first trigger event in the identification information and the first trigger operation attribute information; according to the identification information of the user to access the first feature parameters of user behavior feature description of the users in the first time period; according to the determined for second characteristic parameters, the characteristics of user behavior description of the user in the second period of the attribute information of the first trigger operation in which the first time in the second time period; the first feature parameters and the classification model the second characteristic parameters of input preset, the classification model with the first parameter and the second characteristic parameters for classification parameters; obtaining the classification model of the output A classification result of the first triggering event; outputting the classification result. The invention also discloses an information processing method and equipment.

【技术实现步骤摘要】
一种信息处理方法及装置、设备
本专利技术涉及信息技术,尤其涉及一种信息处理方法及装置、设备。
技术介绍
中国移动互联网行业的发展推升着移动广告行业的发展,而广告业务被认为是互联网经济中最活跃的引擎,其中移动互联网广告(简称移动广告)作为互联网广告中最重要的组成部分,是一类基于无线通信技术以移动设备为载体的一种广告形式,移动广告近年来得到了蓬勃的发展,2014年移动广告市场规模飙升至125亿美元。图1A为相关技术中互联网广告的产业链示意图,如图1A所示,互联网广告的产业链10中包括广告主11、广告平台12、流量主(例如媒体等)13和受众(用户)14;其中广告平台12是广告主11与流量主13之间的中介,当广告主11有广告需要曝光的时候,广告主会付出经济上的代价以将待曝光的广告挂在广告平台12上,其中,广告主11在挂待曝光广告的时候往往会选择一些投放条件,例如受众、播放方式、计费方式、广告需要投放的流量主等。广告平台12根据广告主11设置的投放条件确定待投放的流量主13,然后将待曝光的广告挂在流量主上。当用户15使用流量主的产品(例如观看视频)时,用户15通过如手机、平板电脑、个人电脑等终端14接收广告,从而完成广告主的广告的曝光。从上述广告的产业链可以看出:广告主一般会付出真金白银来提高自己产品的知名度,而流量主通过消耗自身的流量来收取广告费用,一般来说广告平台会根据广告的实际曝光向广告主收取费用,然后通过协议向流量主分配收益。目前互联网广告中广告费用的收取都是借助于一些数据,例如广告费用是按照按点击计价(CPC)来收费,如果广告平台或流量主采用作弊手段来进行大量点击,这样就会形成作弊流量(虚假数据),进而向广告主收费。一般来说,作弊手段包括:利用大量测试机或者模拟器直接发送点击事件,也有一些是雇佣或者激励式诱导用户来进行大量点击,从而形成作弊流量。由此可见,广告主是互联网广告链条里最大的受害者,所以许多广告主都在想方设法的进行作弊防护。随着互联网广告市场的健全,第三方监测平台应运而生,第三方监测平台凭借技术方面的专业性和第三方的中立性,兼顾全平台的数据进行作弊防护,可以很好的保护广告主的利益。然而,互联网广告中的作弊不但会损害广告主的经济利益,还会损害广告平台的声誉,因为第三方监测平台会向广告主返回一个接近于真实的数据(该数据剔除由于作弊而产生的虚假数据),如果广告平台向广告主提供的数据虚高,那么就会让广告主对广告平台失去信任,从而造成广告平台的声誉下降。综上所述,如何防止互联网广告中作弊成为亟需解决的问题。
技术实现思路
有鉴于此,本专利技术实施例为解决现有技术中存在的至少一个问题而提供一种信息处理方法及装置、设备,能够防止互联网中的作弊操作,从而得出正确的效果点击结果。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供一种信息处理方法,其特征在于,所述方法包括:确定待分类的第一触发事件,所述第一触发事件用于描述第一触发操作;从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;获取所述分类模型输出的所述第一触发事件的分类结果;输出所述分类结果。第二方面,本专利技术实施例提供一种信息处理装置,所述装置包括第一确定单元、第一获取单元、第二获取单元、第二确定单元、输入单元、第三获取单元和输出单元,其中:所述第一确定单元,用于确定待分类的第一触发事件,所述第一触发事件用于描述第一触发操作;所述第一获取单元,用于从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;所述第二获取单元,用于根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;所述第二确定单元,用于根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;所述输入单元,用于将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;所述第三获取单元,用于获取所述分类模型输出的所述第一触发事件的分类结果;所述输出单元,用于输出所述分类结果。第三方面,本专利技术实施例提供一种信息处理设备,所述设备包括显示装置和处理装置,其中:所述显示装置,用于显示所述处理装置输出的分类结果;所述处理装置,用于:确定待分类的第一触发事件,所述第一触发事件用于描述第一触发操作;从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;获取所述分类模型输出的所述第一触发事件的分类结果;输出所述分类结果。本专利技术实施例提供的一种信息处理方法及装置、设备,其中确定待分类的第一触发事件;从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;获取所述分类模型输出的所述第一触发事件的分类结果;输出所述分类结果,如此,能够防止互联网中的作弊操作,从而得出正确的效果点击结果。附图说明图1A为相关技术中互联网广告的产业链示意图;图1B为本专利技术实施例中进行信息交互的各方硬件实体的示意图;图2为本专利技术实施例一信息处理方法的实现流程示意图;图3A为专利技术实施例三分类模型的训练过程示意图;图3B为本专利技术实施例三抽取样本的框架示意图;图3C为本专利技术实施例三GBDT的分类模型中回归树的示意图;图3D为本专利技术实施例中基于规则的判罚方式对作弊流量进行实时过滤的方法的实现流程示意图;图4为本专利技术实施例四信息处理方法的实现流程示意图;图5A为本专利技术实施例各实体的硬件组成结构示意图;图5B为本专利技术实施例五信息处理装置的组成结构示意图;图6为本专利技术实施例六信息处理设备的组成结构示意图。具体实施方式为了更好地介绍和理解本专利技术的各实施例,下面介绍一下本专利技术的各实施例中可能涉及的一些专业词汇,具体包括:广告请求:用户侧用广告请求拉取广告,用于展现;广告曝光:广告在用户侧进行一次实际展示让用户看到算作一次曝光;广告点击:用户通过点击广告而访问广告主的网页,称一次点击;广告转化:用户通过点击广告本文档来自技高网
...
一种信息处理方法及装置、设备

【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:确定待分类的第一触发事件,所述第一触发事件用于描述第一触发操作;从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;获取所述分类模型输出的所述第一触发事件的分类结果;输出所述分类结果。

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:确定待分类的第一触发事件,所述第一触发事件用于描述第一触发操作;从所述第一触发事件中获取用户的标识信息和所述第一触发操作的属性信息;根据所述用户的标识信息获取用于描述所述用户在第一时间段内的用户行为特征的第一特征参数;根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,其中,所述第一时间段大于所述第二时间段;将所述第一特征参数和所述第二特征参数输入预设的分类模型,所述分类模型以所述第一特征参数和所述第二特征参数为分类参数;获取所述分类模型输出的所述第一触发事件的分类结果;输出所述分类结果。2.根据权利要求1所述的方法,其特征在于,所述第一触发操作的属性信息至少包括所述第一触发事件的触发时刻,所述第二时间段包括从预设的第一时刻至所述第一触发事件的触发时刻之间的时间段。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一触发操作的属性信息确定用于描述所述用户在第二时间段内的用户行为特征的第二特征参数,包括:根据所述用户的标识信息获取第二触发事件的第三特征参数,所述第二触发事件包括距离所述第一触发操作的点击时刻之间的时间差最短的触发事件,所述第三特征参数用于所述用户从所述第一时刻至所述第二触发事件的触发时刻之间的时间段内的用户行为特征;根据所述第一触发操作的属性信息和所述第三特征参数确定所述第二特征参数。4.根据权利要求1所述的方法,其特征在于,所述确定待分类的第一触发事件,包括:接收在线的触发流,从所述触发流中分离出所述第一触发事件;或者,获取触发操作的日志,从所述操作日志中提取出所述第一触发事件。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:按照预设的配置比例获取正样本和负样本;提取所述正样本的不同维度的特征参数和所述负样本的不同维度的特征参数;将所述正样本或所述负样本的不同维度的特征参数输入设置的第一训练模型,得到第一训练结果,所述第一训练模型以具有预设权重的不同维度的特征参数为分类参数;如果所述第一训练结果不满足预设的条件,则逐一调整每一所述不同维度的特征参数的权重直至所述训练结果满足所述条件,将所述第一训练结果满足所述条件的第一训练模型作为所述分类模型输出;如果所述第一训练结果满足预设的条件,则将所述第一训练模型作为所述分类模型输出。6.根据权利要求5所述的方法,其特征在于,所述调整每一所述不同维度的特征参数的权重,包括:利用从所述不同维度的特征参数中筛选出所述第一特征参数和所述第二特征参数;其中,D表示作为训练数据集的正样本和负样本,A表示所述不同维度的中一个维度的特征参数,g(D,A)表示特征参数A在训练数据集D下获得的权重,P(D)i表示训练数据集D分类为i的概率,P(D/A)i表示在给定特征参数A的前提下,训练数据集D分类为i的条件概率。7.根据权利要求1至4任一项所述的方法,其特征在于,所述第一特征参数包括在第一时间段内的点击数,所述第二特征参数包括在第二时间段内的点击数和点击频率或点击的时间间隔。8.根据权利要求6所述的方法,其特征在于,所述分类模型为采用梯度提升决策树而形成的模型fM(x),其中T(x;Θm)表示第m棵回归树分类的结果,Θm表示第m棵回归树,M表示回归树的总数目,x表示待分类的第一触发事件;其中M=1,Θ1包括:以在第一时间段内的点击数为第一根节点,以在第二时间段内的点击数为所述第一根节点的第一子节点和第一叶节点,所述第一子节点包括第二叶节点和第三叶节点;Θ2包括:以在第二时间内的点击频率...

【专利技术属性】
技术研发人员:彭作杰李益群
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1