The invention discloses a method and a device for clustering search words in a website, which relates to the field of information technology, and can reduce the clustering error of the search words in the website and improve the clustering accuracy of the search words in the website. The method comprises the following steps: firstly, to obtain the corresponding web site content information; then search word clustering algorithm based on the initial adjustment of the web site content information corresponding to the last, according to the initial adjusted station search word clustering algorithm on the web search word classification. The invention is applicable to the classification of search words in a web site.
【技术实现步骤摘要】
网站内搜索词的聚类方法及装置
本专利技术涉及信息
,特别是涉及一种网站内搜索词的聚类方法及装置。
技术介绍
随着互联网技术的不断发展,企业自身对信息架构、管理、发布的需求,以及用户对信息的组织、查询、可寻性的要求越来越高,于是站内搜索出现了。尤其在内容丰富的网站中,当用户有目的地寻找目标内容但又无法直接从首页或导航页中直接找到时,这时用户就会求助于站内搜索。为了让用户可以更好地进行站内搜索,通常将站内搜索词进行聚类,聚类的作用是将意义相同或相近的站内搜索词放在同一个组内。这样就可以实现站内搜索词的聚类分析,能够更好地分析用户群体,用户需求等。目前,在对站内搜索词进行聚类时,通常是根据以往聚类过程的经验来改进站内搜索词聚类的算法,最终完成站内搜索词聚类。然而采用现有方式进行搜索词聚类时,由于在最初聚类时系统还没有进行过聚类,即不存在聚类过程的经验,从而使得调整后的初始搜索词聚类算法误差较大,进而导致前期站内搜索词聚类的结果将会与预期的聚类结果相比产生很大的差异,而前期聚类结果的不准确将会导致后续的聚类结果发生更大的差异,最终造成网站内搜索词的聚类误差较大,精度较低。
技术实现思路
有鉴于此,本专利技术提供一种网站内搜索词的聚类方法及装置,主要目的在于减少网站内搜索词的聚类误差,提高网站内搜索词的聚类精度。依据本专利技术一方面,提供了一种网站内搜索词的聚类方法:包括:获取网站对应的网站内容信息;根据所述网站内容信息调整所述网站对应的初始搜索词聚类算法;根据调整后的搜索词聚类算法对所述网站的站内搜索词进行分类。依据本专利技术另一方面,提供一种网站内搜索词的聚类 ...
【技术保护点】
一种网站内搜索词的聚类方法,其特征在于,包括:获取网站对应的网站内容信息;根据所述网站内容信息调整所述网站对应的初始搜索词聚类算法;根据调整后的初始搜索词聚类算法对所述网站的站内搜索词进行分类。
【技术特征摘要】
1.一种网站内搜索词的聚类方法,其特征在于,包括:获取网站对应的网站内容信息;根据所述网站内容信息调整所述网站对应的初始搜索词聚类算法;根据调整后的初始搜索词聚类算法对所述网站的站内搜索词进行分类。2.根据权利要求1所述的网站内搜索词的聚类方法,其特征在于,所述根据所述网站内容信息调整所述网站对应的初始搜索词聚类算法之前,所述还包括:根据预置过滤规则对所述网站内容信息进行过滤;所述根据所述网站内容信息调整所述网站对应的初始搜索词聚类算法包括:根据过滤后的网站内容信息调整所述网站对应的初始搜索词聚类算法。3.根据权利要求1所述的网站内搜索词的聚类方法,其特征在于,所述根据所述网站内容信息调整所述网站对应的搜索词聚类算法包括:按照预置机器学习算法对所述网站内容信息进行学习;根据所述学习结果调整所述网站对应的初始搜索词聚类算法。4.根据权利要求1所述的网站内搜索词的聚类方法,其特征在于,所述获取网站对应的网站内容信息包括:根据预置爬虫程序获取所述网站对应的网站内容信息。5.根据权利要求1所述的网站内搜索词的聚类方法,其特征在于,所述方法还包括:根据预置监测代码获取所述网站对...
【专利技术属性】
技术研发人员:张鹏霄,冯鸳鹤,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。