The invention discloses a method of processing network access data based on the convolution network, including: Step 1) training the convolution neural network model; step 2) obtaining the display, clicking and converting data of the advertisement on the client side; step 3) encoding the display, click and conversion data, and aiming at each user number. The corresponding matrix tensor is generated; step 4) the above matrix tensor is fed into step 1, and the output vectors are obtained in the trained convolution neural network. This method uses CNN network processing, which directly acts as a high dimension vector, and then directly passes an input vector after CNN processing, and then it is introduced to follow up classifier for subsequent processing. This solves the problem of using dummy variables too much for subsequent classifiers. Instead, we can reduce the high dimensional data to low dimensional data through the CNN network without reducing the amount of information.
【技术实现步骤摘要】
一种基于卷积网络进行网络访问数据进行处理的方法
本专利技术属于一种基于卷积网络进行网络访问数据进行处理的方法。
技术介绍
在进行数据分类之前的数据处理中,分类变量和连续变量不同,无法作为一个变量进行数据的分析处理,需要将一个分类变量变成多个dummy变量例如性别变量则变为(0,1)这样表示,同时在使用该变量时候,需要产生2个dummy变量,则最终的分类器表示也是基于dummy变量的。当分类变量的值比较多的时候,则计算量会暴增。因此出现了许多的处理方式。例如使用hash方式。该种方法的原理是将一个变量表示为(0,1,0,0,0,。。。。)后使用hash函数,将所有的数据维度都hash处理,生成一个固定维度的向量,这种方法具有以下的缺点:1,对字段值的处理(分段,聚合),对字段间的关系,都需要人工干预太多,然后在进行分析,主观性太强,且由于字段比较多,取值比较复杂,导致很多其他的字段无法发挥本来的作用,且干预字段过度发挥效果。2,如果使用hash方法,则会损失掉一些有效的信息,虽然使用方便,但是最终分类效果会有影响。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于卷积网络进行网络访问数据进行处理的方法。本专利技术解决上述技术问题所采取的技术方案如下:一种基于卷积网络进行网络访问数据进行处理的方法,包括:步骤1)训练卷积神经网络模型,包括:获取样本数据,该样本数据中包括:用户的性别、客户端ID、广告ID以及访问时间;按照以下的卷积公式进行数据处理:·x(t)和h(t)函数是卷积的变量,p是积分变量,t是使函数h(-p)位移的量,星号*表示卷积;针对本文,卷 ...
【技术保护点】
1.一种基于卷积网络进行网络访问数据进行处理的方法,其特征在于,包括:步骤1)训练卷积神经网络模型,包括:获取样本数据,该样本数据中包括:用户的性别、客户端ID、广告ID以及访问时间;按照以下的卷积公式进行数据处理:
【技术特征摘要】
1.一种基于卷积网络进行网络访问数据进行处理的方法,其特征在于,包括:步骤1)训练卷积神经网络模型,包括:获取样本数据,该样本数据中包括:用户的性别、客户端ID、广告ID以及访问时间;按照以下的卷积公式进行数据处理:x(t)和h(t)函数是卷积的变量,p是积分变量,t是使函数h(-p)位移的量,星号*表示卷积;选择一个y(t)包含的数据编码信息量最大的卷积公式,以此作为训练好的卷积神经网络模型;步骤2)获取广告在用户客户端的展示、点击和转换数据;步骤3)对展示、点击和转换数据进行编码,并针对每一条用户数据,生成对应的矩阵张量;步骤4)将以上矩阵张量送入步骤1)中训练好的卷积神经网络中,得到其输出向量。2.根据权利要求1所述的基于卷积网络进行网络访问数据进行处理的方法,其特征在于,步骤3)中,所述矩阵张量中,包括:用户的性别、客户端ID、广告、ID以及访问时间,其格式选择:{(a广告,偏好大小),(b广告,偏好大小)....}。3.根据权利要求1或2所述的基于卷积网络进行网络访问数据进行处理的方法,...
【专利技术属性】
技术研发人员:郭威,
申请(专利权)人:北京掌阔移动传媒科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。