一种SEM投放数据分类系统及其分类方法技术方案

技术编号:19424909 阅读:29 留言:0更新日期:2018-11-14 10:32
本发明专利技术公开了一种SEM投放数据分类系统,包括数据库模块,用于存储投放数据信息;数据投放模拟模块,用于模拟数据投放过程并收集投放反馈信息;特征提取模块,用于在收集的反馈信息中进行特征提取;特征处理模块,用于对提取的特征进行关联性处理;分类模块,用于根据处理后的特征对数据进行分类;标记模块,用于对分类后的数据进行标记,建立分类映射关系。本发明专利技术能够改进现有技术的不足,提高数据分类的准确率和速度。

【技术实现步骤摘要】
一种SEM投放数据分类系统及其分类方法
本专利技术涉及SEM投放分析
,尤其是一种SEM投放数据分类系统及其分类方法。
技术介绍
搜索引擎是指一种基于Internet上的信息查询系统,包括信息存取、信息管理和信息检索。搜索引擎营销正是根据消费者使用搜索引擎的方式,通过一整套的技术和策略系统,利用用户检索信息的机会尽可能将营销信息传递给目标群体。搜索引擎营销(SEM)作为一种网络营销模式,目的在于推广网站,提高知名度,通过搜索引擎返回的结果来获得更好的销售或者推广渠道,对塑造网络品牌、网站推广、在线销售及产品推广等方面具有较为明显的效果。为了提高SEM投放信息的效果,需要对投放数据进行分类,现有的SEM投放数据分类系统都是针对数据的某个(或多个)特征进行直接对比,然后进行分类,这种分类方式不仅计算量大,而且无法挖掘到数据不同特征之间的关联性,导致分类准确率低。
技术实现思路
本专利技术要解决的技术问题是提供一种SEM投放数据分类系统及其分类方法,能够解决现有技术的不足,提高数据分类的准确率和速度。为解决上述技术问题,本专利技术所采取的技术方案如下。一种SEM投放数据分类系统,包括,数据库模块,用于存储投放数据信息;数据投放模拟模块,用于模拟数据投放过程并收集投放反馈信息;特征提取模块,用于在收集的反馈信息中进行特征提取;特征处理模块,用于对提取的特征进行关联性处理;分类模块,用于根据处理后的特征对数据进行分类;标记模块,用于对分类后的数据进行标记,建立分类映射关系。一种上述的SEM投放数据分类系统的分类方法,包括以下步骤:A、将用于投放的数据存入数据库模块,并通过数据投放模拟模块进行投放模拟;B、特征提取模块对反馈信息中的特征进行提取;C、特征处理模块对提取的特征进行关联性处理;D、分类模块根据处理后的特征对数据进行分类;E、根据分类的结果,标记模块对分类后的数据进行标记,建立分类映射关系,并存储在数据库模块中。作为优选,所述步骤A中,随机使用若干个关键词进行投放模拟,对模拟过的关键词在数据投放模拟模块中进行记录,并删除与已记录关键词相关度超过阈值的待模拟关键词;关键词的相关度以关键词所属领域为基准,相关度与所属领域重叠度成正比。作为优选,步骤B中,提取的特征包括展现成本、展现量、点击量、转化率、投放区域、投放时间、频度。作为优选,步骤B中,将属于同一反馈信息的不同类特征值进行提取,形成基于反馈信息的第一特征矩阵;将属于不同反馈信息中的同一类特征值进行提取,形成基于特征值的第二特征矩阵。作为优选,步骤C中,对提取的特征进行关联性处理包括以下步骤,C1、依次求取第二特征矩阵的转置矩阵,将第二特征矩阵和其对应的转置矩阵所代表的线性空间进行对比,两个线性空间的相似度与其对应的这一类特征值的权重值成正比;C2、使用每一类特征值的权重值对第一特征矩阵中对应的特征值进行修正;C3、求取修正后的第一特征矩阵的特征向量,使用非线性变换函数对特征向量组成的向量空间进行非线性变换处理,以降低向量空间维度,将消失维度的本征函数进行归一化,合并入剩余的特征向量中。作为优选,步骤D中,对数据进行分类包括以下步骤,D1、求取数据对应的降维后的向量空间在每个维度上的投影;D2、根据在同一维度上投影的相似度对数据进行分类。采用上述技术方案所带来的有益效果在于:本专利技术可以缩减数据分类过程的运算量,加大了对与不同特征之间相关度的挖掘,提高数据分类的准确度,改善SEM投放信息的效果。附图说明图1是本专利技术的硬件原理图。图中:1、数据库模块;2、数据投放模拟模块;3、特征提取模块;4、特征处理模块;5、分类模块;6、标记模块。具体实施方式参照图1,一种SEM投放数据分类系统,其特征在于:包括,数据库模块1,用于存储投放数据信息;数据投放模拟模块2,用于模拟数据投放过程并收集投放反馈信息;特征提取模块3,用于在收集的反馈信息中进行特征提取;特征处理模块4,用于对提取的特征进行关联性处理;分类模块5,用于根据处理后的特征对数据进行分类;标记模块6,用于对分类后的数据进行标记,建立分类映射关系。一种上述的SEM投放数据分类系统的分类方法,包括以下步骤:A、将用于投放的数据存入数据库模块1,并通过数据投放模拟模块2进行投放模拟;B、特征提取模块3对反馈信息中的特征进行提取;C、特征处理模块4对提取的特征进行关联性处理;D、分类模块5根据处理后的特征对数据进行分类;E、根据分类的结果,标记模块6对分类后的数据进行标记,建立分类映射关系,并存储在数据库模块1中。步骤A中,随机使用若干个关键词进行投放模拟,对模拟过的关键词在数据投放模拟模块2中进行记录,并删除与已记录关键词相关度超过阈值的待模拟关键词;关键词的相关度以关键词所属领域为基准,相关度与所属领域重叠度成正比。阈值根据关键词的平均相关度和投放要求进行具体选择。步骤B中,提取的特征包括展现成本、展现量、点击量、转化率、投放区域、投放时间、频度。步骤B中,将属于同一反馈信息的不同类特征值进行提取,形成基于反馈信息的第一特征矩阵;将属于不同反馈信息中的同一类特征值进行提取,形成基于特征值的第二特征矩阵。步骤C中,对提取的特征进行关联性处理包括以下步骤,C1、依次求取第二特征矩阵的转置矩阵,将第二特征矩阵和其对应的转置矩阵所代表的线性空间进行对比,两个线性空间的相似度与其对应的这一类特征值的权重值成正比;C2、使用每一类特征值的权重值对第一特征矩阵中对应的特征值进行修正;C3、求取修正后的第一特征矩阵的特征向量,使用非线性变换函数对特征向量组成的向量空间进行非线性变换处理,以降低向量空间维度,将消失维度的本征函数进行归一化,合并入剩余的特征向量中。步骤D中,对数据进行分类包括以下步骤,D1、求取数据对应的降维后的向量空间在每个维度上的投影;D2、根据在同一维度上投影的相似度对数据进行分类。其中,在步骤D1中,首选对向量空间进行迭代处理,T′=T·KT为向量空间,K为迭代矩阵,K为非满秩矩阵。通过迭代,可以有效增加向量空间内特征信息和非特征信息的区别度,便于区分。步骤E中,对建立的分类映射关系进行二次分类,统计不同映射之间的路径交叉点,将交叉点数量大于阈值的分类映射关系归为一类。阈值根据映射之间交叉点的平均数量和投放要求具体确定。通过对分类映射关系的二次分类,可以提高对于分类后投放数据的检索速度。本专利技术适用于大数据量的SEM投放数据的分类,分类速度快,投放效果好。在本专利技术的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。以上显示和描述了本专利技术的基本原理和主要特征和本专利技术的优点。本行业的技术人员应该了解,本专利技术不受上述实施例的限制,上述实施例和说明书中描述的只是说明本专利技术的原理,在不脱离本专利技术精神和范围的前提下,本专利技术还会有各种变化和改进,这些变化和改进都落入要求保护的本专利技术范围内。本专利技术要求保护范围由所附的权利要求书及其等效物界定本文档来自技高网...

【技术保护点】
1.一种SEM投放数据分类系统,其特征在于:包括,数据库模块(1),用于存储投放数据信息;数据投放模拟模块(2),用于模拟数据投放过程并收集投放反馈信息;特征提取模块(3),用于在收集的反馈信息中进行特征提取;特征处理模块(4),用于对提取的特征进行关联性处理;分类模块(5),用于根据处理后的特征对数据进行分类;标记模块(6),用于对分类后的数据进行标记,建立分类映射关系。

【技术特征摘要】
1.一种SEM投放数据分类系统,其特征在于:包括,数据库模块(1),用于存储投放数据信息;数据投放模拟模块(2),用于模拟数据投放过程并收集投放反馈信息;特征提取模块(3),用于在收集的反馈信息中进行特征提取;特征处理模块(4),用于对提取的特征进行关联性处理;分类模块(5),用于根据处理后的特征对数据进行分类;标记模块(6),用于对分类后的数据进行标记,建立分类映射关系。2.一种权利要求1所述的SEM投放数据分类系统的分类方法,其特征在于包括以下步骤:A、将用于投放的数据存入数据库模块(1),并通过数据投放模拟模块(2)进行投放模拟;B、特征提取模块(3)对反馈信息中的特征进行提取;C、特征处理模块(4)对提取的特征进行关联性处理;D、分类模块(5)根据处理后的特征对数据进行分类;E、根据分类的结果,标记模块(6)对分类后的数据进行标记,建立分类映射关系,并存储在数据库模块(1)中。3.根据权利要求2所述的SEM投放数据分类系统的分类方法,其特征在于:步骤A中,随机使用若干个关键词进行投放模拟,对模拟过的关键词在数据投放模拟模块(2)中进行记录,并删除与已记录关键词相关度超过阈值的待模拟关键词;关键词的相关度以关键词所属领域为基准,相关度与所属领域重叠度成正比。4.根据权利要求2...

【专利技术属性】
技术研发人员:林正春梁文庆
申请(专利权)人:广东原昇信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1