一种基于卷积网络进行网络访问数据进行处理的方法技术

技术编号：18445722 阅读：32 留言：0更新日期：2018-07-14 10:42

本发明专利技术公开了一种基于卷积网络进行网络访问数据进行处理的方法，包括：步骤1)训练卷积神经网络模型；步骤2)获取广告在用户客户端的展示、点击和转换数据；步骤3)对展示、点击和转换数据进行编码，并针对每一条用户数据，生成对应的矩阵张量；步骤4)将以上矩阵张量送入步骤1)中训练好的卷积神经网络中，得到其输出向量。该方法使用cnn网络处理，将其直接作为高维度向量处理，直接将一次输入的向量经过cnn处理后在传入到后续分类器做后续处理。这样解决了后续分类器使用dummy变量过多的问题。而是通过cnn网络将高维度的数据降为低维度的数据，同时不减少信息量。

A method for processing network access data based on convolution network

The invention discloses a method of processing network access data based on the convolution network, including: Step 1) training the convolution neural network model; step 2) obtaining the display, clicking and converting data of the advertisement on the client side; step 3) encoding the display, click and conversion data, and aiming at each user number. The corresponding matrix tensor is generated; step 4) the above matrix tensor is fed into step 1, and the output vectors are obtained in the trained convolution neural network. This method uses CNN network processing, which directly acts as a high dimension vector, and then directly passes an input vector after CNN processing, and then it is introduced to follow up classifier for subsequent processing. This solves the problem of using dummy variables too much for subsequent classifiers. Instead, we can reduce the high dimensional data to low dimensional data through the CNN network without reducing the amount of information.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积网络进行网络访问数据进行处理的方法
本专利技术属于一种基于卷积网络进行网络访问数据进行处理的方法。
技术介绍
在进行数据分类之前的数据处理中，分类变量和连续变量不同，无法作为一个变量进行数据的分析处理，需要将一个分类变量变成多个dummy变量例如性别变量则变为(0,1)这样表示，同时在使用该变量时候，需要产生2个dummy变量，则最终的分类器表示也是基于dummy变量的。当分类变量的值比较多的时候，则计算量会暴增。因此出现了许多的处理方式。例如使用hash方式。该种方法的原理是将一个变量表示为(0,1,0,0,0,。。。。)后使用hash函数，将所有的数据维度都hash处理，生成一个固定维度的向量，这种方法具有以下的缺点：1，对字段值的处理(分段，聚合)，对字段间的关系，都需要人工干预太多，然后在进行分析，主观性太强，且由于字段比较多，取值比较复杂，导致很多其他的字段无法发挥本来的作用，且干预字段过度发挥效果。2，如果使用hash方法，则会损失掉一些有效的信息，虽然使用方便，但是最终分类效果会有影响。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于卷积网络进行网络访问数据进行处理的方法。本专利技术解决上述技术问题所采取的技术方案如下：一种基于卷积网络进行网络访问数据进行处理的方法，包括：步骤1)训练卷积神经网络模型，包括：获取样本数据，该样本数据中包括：用户的性别、客户端ID、广告ID以及访问时间；按照以下的卷积公式进行数据处理：·x(t)和h(t)函数是卷积的变量，p是积分变量，t是使函数h(-p)位移的量，星号*表示卷积；针对本文，卷...

【技术保护点】
1.一种基于卷积网络进行网络访问数据进行处理的方法，其特征在于，包括：步骤1)训练卷积神经网络模型，包括：获取样本数据，该样本数据中包括：用户的性别、客户端ID、广告ID以及访问时间；按照以下的卷积公式进行数据处理：

【技术特征摘要】
1.一种基于卷积网络进行网络访问数据进行处理的方法，其特征在于，包括：步骤1)训练卷积神经网络模型，包括：获取样本数据，该样本数据中包括：用户的性别、客户端ID、广告ID以及访问时间；按照以下的卷积公式进行数据处理：x(t)和h(t)函数是卷积的变量，p是积分变量，t是使函数h(-p)位移的量，星号*表示卷积；选择一个y(t)包含的数据编码信息量最大的卷积公式，以此作为训练好的卷积神经网络模型；步骤2)获取广告在用户客户端的展示、点击和转换数据；步骤3)对展示、点击和转换数据进行编码，并针对每一条用户数据，生成对应的矩阵张量；步骤4)将以上矩阵张量送入步骤1)中训练好的卷积神经网络中，得到其输出向量。2.根据权利要求1所述的基于卷积网络进行网络访问数据进行处理的方法，其特征在于，步骤3)中，所述矩阵张量中，包括：用户的性别、客户端ID、广告、ID以及访问时间，其格式选择：{(a广告,偏好大小),(b广告,偏好大小)....}。3.根据权利要求1或2所述的基于卷积网络进行网络访问数据进行处理的方法，...

【专利技术属性】
技术研发人员：郭威，
申请(专利权)人：北京掌阔移动传媒科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人