关键词聚类方法及装置制造方法及图纸

技术编号:18367385 阅读:22 留言:0更新日期:2018-07-05 08:38
本发明专利技术公开了一种关键词聚类方法及装置,可以根据待聚类的关键词集合中各关键词的多个聚类指标的指标值对关键词集合中的关键词进行聚类分析,得到多个关键词组;然后,确定各关键词组对应的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。由于本发明专利技术通过聚类指标的指标值对关键词进行聚类分析,因此得到的关键词组具有不同的聚类指标特征,可以根据聚类指标特征向用户推荐更有用的关键词。

Key word clustering method and device

The invention discloses a key word clustering method and device, which can be used to cluster the key words in the keyword set according to the index values of the key words in the key words set to be clustered, and get several key phrases. Then, we can determine the index value of the cluster index of each key word group. The index values of the cluster index of the phrases are stored correspondingly with the keyword group. Since this invention is used to cluster analysis of key words by the index value of clustering index, the key words group has different clustering index features, and can recommend more useful keywords to users according to the characteristics of clustering index.

【技术实现步骤摘要】
关键词聚类方法及装置
本专利技术涉及关键词聚类
,尤其涉及一种关键词聚类方法及装置。
技术介绍
搜索引擎营销(SEM,SearchEngineMarketing)业务是一种营销方式,它可以在搜索引擎平台上投放关键词,用户通过搜索词触发关键词,点击广告创意,进而进入广告主网站,达成流量或转化。为了向广告主提供更多的关键词,需要对大量的关键词进行分类,然后向广告主提供某一类别的关键词供其使用。现有技术使用关键词含义对关键词进行分类,将含义相同/相近的关键词分为一组并提供给用户。但本申请专利技术人研究发现:通过关键词含义的方式对关键词进行分类的方式虽然可以向用户提供大量关键词,但这些关键词中有大量的转化率低的关键词。这也就使得现有技术无法向用户精准提供更有用的关键词。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的关键词聚类方法及装置。一种关键词聚类方法,包括:获得待聚类的关键词集合中各关键词的多个聚类指标的指标值,所述聚类指标为用于评价关键词的投放效果的评价指标;根据所述聚类指标的指标值对待聚类的所述关键词集合中的关键词进行聚类分析,得到多个关键词组;确定各关键词组对应的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。可选的,所述确定各关键词组对应的词组聚类指标的指标值,包括:确定每个关键词组中关键词的每个聚类指标的平均值/中间值,将聚类指标的所述平均值/中间值作为与其对应的关键词组的词组聚类指标的指标值。可选的,在所述确定各关键词组对应的词组聚类指标的指标值后,所述方法还包括:根据各关键词组对应的词组聚类指标的指标值,为各关键词组分配匹配的聚类标签。可选的,在所述获得待聚类的关键词集合中各关键词的多个聚类指标的指标值前,所述方法还包括:记录各关键词的多个评价指标的指标值。可选的,在所述记录各关键词的多个评价指标的指标值后,所述获得待聚类的关键词集合中各关键词的多个聚类指标的指标值前,所述方法还包括:确定本次聚类所需的评价指标,将本次聚类所需的评价指标作为聚类指标。一种关键词聚类装置,包括:指标获得单元、聚类分析单元和存储单元,所述指标获得单元,用于获得待聚类的关键词集合中各关键词的多个聚类指标的指标值,所述聚类指标为用于评价关键词的投放效果的评价指标;所述聚类分析单元,用于根据所述聚类指标的指标值对待聚类的所述关键词集合中的关键词进行聚类分析,得到多个关键词组;所述存储单元,用于确定各关键词组对应的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。可选的,所述存储单元具体用于:确定每个关键词组中关键词的每个聚类指标的平均值/中间值,将聚类指标的所述平均值/中间值作为与其对应的关键词组的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。可选的,所述装置还包括:标签分配单元,用于在所述存储单元确定各关键词组对应的词组聚类指标的指标值后,根据各关键词组对应的词组聚类指标的指标值,为各关键词组分配匹配的聚类标签。可选的,所述装置还包括:指标记录单元,用于在所述指标获得单元获得待聚类的关键词集合中各关键词的多个聚类指标的指标值前,记录各关键词的多个评价指标的指标值。可选的,所述装置还包括:评价指标确定单元,用于在所述指标记录单元记录各关键词的多个评价指标的指标值后,所述指标获得单元获得待聚类的关键词集合中各关键词的多个聚类指标的指标值前,确定本次聚类所需的评价指标,将本次聚类所需的评价指标作为聚类指标。借由上述技术方案,本专利技术提供的一种关键词聚类方法及装置,可以根据待聚类的关键词集合中各关键词的多个聚类指标的指标值对关键词集合中的关键词进行聚类分析,得到多个关键词组;然后,确定各关键词组对应的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。由于本专利技术通过聚类指标的指标值对关键词进行聚类分析,因此得到的关键词组具有不同的聚类指标特征,可以根据聚类指标特征向用户推荐更有用的关键词。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种关键词聚类方法的流程图;图2示出了本专利技术实施例提供的另一种关键词聚类方法的流程图;图3示出了本专利技术实施例提供的另一种关键词聚类方法的流程图;图4示出了本专利技术实施例提供的一种关键词聚类装置的结构示意图;图5示出了本专利技术实施例提供的另一种关键词聚类装置的结构示意图;图6示出了本专利技术实施例提供的另一种关键词聚类装置的结构示意图;图7示出了本专利技术实施例提供的关键词聚类原理的示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本专利技术实施例提供的一种关键词聚类方法,可以包括:S100、获得待聚类的关键词集合中各关键词的多个聚类指标的指标值。其中,所述聚类指标可以为用于评价关键词的投放效果的评价指标,如:展现量、点击率、平均点击价格、投资回报率等。举例1、设所述待聚类的关键词集合中有四个关键词,分别为关键词a、关键词b、关键词c和关键词d。步骤S100中的聚类指标有两个,分别为点击率和投资回报率,则步骤S100获得的聚类指标的指标值如表1所示。表1S200、根据所述聚类指标的指标值对待聚类的所述关键词集合中的关键词进行聚类分析,得到多个关键词组;其中,可以使用Mean-Shift、K-means、混合高斯模型等聚类分析算法选取所述聚类指标的指标值作为特征对待聚类的所述关键词集合中的关键词进行聚类分析,得到多个关键词组。可以理解的是,由于使用了聚类指标的指标值进行聚类分析,因此聚类后得到的多个关键词组将具有不同的聚类指标特征,如投资回报率不同。这样,就可以根据向用户推荐具有更好的聚类指标特征的关键词组。仍以举例1为例进行说明:通过聚类分析可知,关键词a与关键词b的点击率、投资回报率相近;关键词c与关键词d的点击率、投资回报率相近,因此将关键词a和关键词b聚类为一个关键词组a,将关键词c和关键词d聚类为一个关键词组b。为了方便了解聚类分析的原理,本专利技术还提供了根据表1数据绘制的二维图,如图7所示,从该二维图中可以看出本专利技术的聚类原理。当然,在实际应用中,由于聚类指标可以有更多,因此并不一定均可以通过二维图的方式进行表示。可以理解的是,由于每个关键词组中的关键词的聚类指标的指标值都相近,因此可以确定各关键词组对应的词组聚类指标的特征,如:关键词组a对应的词组聚类指标具有:低点击率高投资回报率的特征,关键词组b对应的词组聚类指标具有本文档来自技高网...
关键词聚类方法及装置

【技术保护点】
1.一种关键词聚类方法,其特征在于,包括:获得待聚类的关键词集合中各关键词的多个聚类指标的指标值,所述聚类指标为用于评价关键词的投放效果的评价指标;根据所述聚类指标的指标值对待聚类的所述关键词集合中的关键词进行聚类分析,得到多个关键词组;确定各关键词组对应的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。

【技术特征摘要】
1.一种关键词聚类方法,其特征在于,包括:获得待聚类的关键词集合中各关键词的多个聚类指标的指标值,所述聚类指标为用于评价关键词的投放效果的评价指标;根据所述聚类指标的指标值对待聚类的所述关键词集合中的关键词进行聚类分析,得到多个关键词组;确定各关键词组对应的词组聚类指标的指标值,将所述词组聚类指标的指标值与所述关键词组进行对应存储。2.根据权利要求1所述的方法,其特征在于,所述确定各关键词组对应的词组聚类指标的指标值,包括:确定每个关键词组中关键词的每个聚类指标的平均值/中间值,将聚类指标的所述平均值/中间值作为与其对应的关键词组的词组聚类指标的指标值。3.根据权利要求1或2所述的方法,其特征在于,在所述确定各关键词组对应的词组聚类指标的指标值后,所述方法还包括:根据各关键词组对应的词组聚类指标的指标值,为各关键词组分配匹配的聚类标签。4.根据权利要求1所述的方法,其特征在于,在所述获得待聚类的关键词集合中各关键词的多个聚类指标的指标值前,所述方法还包括:记录各关键词的多个评价指标的指标值。5.根据权利要求4所述的方法,其特征在于,在所述记录各关键词的多个评价指标的指标值后,所述获得待聚类的关键词集合中各关键词的多个聚类指标的指标值前,所述方法还包括:确定本次聚类所需的评价指标,将本次聚类所需的评价指标作为聚类指标。6.一种关键词聚类装置,其特征在于,包括:指标获得单元、聚类分析单元和存储单元,所述指标获得单元,用于获得待聚类的...

【专利技术属性】
技术研发人员:王天祎
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1