检索词分类方法及装置制造方法及图纸

技术编号:16700728 阅读:31 留言:0更新日期:2017-12-02 13:04
本发明专利技术公开了一种检索词分类方法及装置。该方法包括:接收用户输入的检索词,并根据检索词获取对应的检索结果;获取检索结果的点击数据,并根据点击数据提取对应的数据特征;训练数据特征,以生成分类器;以及根据分类器对检索词进行分类。本发明专利技术实施例提供的检索词分类方法及装置,通过接收用户输入的检索词,并根据检索词获取对应的检索结果,再获取检索结果的点击数据,并根据点击数据提取对应的数据特征,训练数据特征,以生成分类器,以及根据分类器对检索词进行分类,能够丰富检索结果,提高检索结果的多样性和扩展性。

Classification method and device of retrieval words

The invention discloses a classification method and a device for the retrieval words. The method includes: receiving user input to search words, and according to the retrieval word to obtain the corresponding access; click data retrieval results according to the data, and click on the corresponding data feature extraction; feature to generate training data, and are classified according to the classification; classifier for word retrieval. Key words classification method and device of the embodiment of the invention, by receiving the search terms, and according to the retrieval word acquisition corresponding to access, click data retrieval results according to the data, and click on the corresponding data feature extraction, training data characteristics, to generate a classifier, and according to the classifier to classify retrieval words can enrich the search results, increase the diversity of search results and scalability.

【技术实现步骤摘要】
检索词分类方法及装置
本专利技术涉及计算机
,尤其涉及一种检索词分类方法及装置。
技术介绍
随着互联网的迅速发展,智能手机等移动终端越来越普及,在使用智能手机的过程中,用户可根据需求安装具有各种功能的应用程序(APP,Application)。目前,用户可以通过应用商店,输入检索词来搜索所需的APP。但是,通过该方式获取的结果仅与检索词相关,比较单一,不够丰富。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种检索词分类方法,该方法能够丰富检索结果,提高检索结果的多样性和扩展性。本专利技术的第二个目的在于提出一种检索词分类装置。为达上述目的,本专利技术第一方面实施例提出了一种检索词分类方法,包括:接收用户输入的检索词,并根据所述检索词获取对应的检索结果;获取所述检索结果的点击数据,并根据所述点击数据提取对应的数据特征;训练所述数据特征,以生成分类器;以及根据所述分类器对所述检索词进行分类。本专利技术实施例的检索词分类方法,通过接收用户输入的检索词,并根据所述检索词获取对应的检索结果,再获取所述检索结果的点击数据,并根据所述点击数据提取对应的数据特征,训练所述数据特征,以生成分类器,以及根据所述分类器对所述检索词进行分类,能够丰富检索结果,提高检索结果的多样性和扩展性。为达上述目的,本专利技术第二方面实施例提出了一种检索词分类装置,包括:获取模块,用于接收用户输入的检索词,并根据所述检索词获取对应的检索结果;提取模块,用于获取所述检索结果的点击数据,并根据所述点击数据提取对应的数据特征;训练模块,用于训练所述数据特征,以生成分类器;以及分类模块,用于根据所述分类器对所述检索词进行分类。本专利技术实施例的检索词分类装置,通过接收用户输入的检索词,并根据所述检索词获取对应的检索结果,再获取所述检索结果的点击数据,并根据所述点击数据提取对应的数据特征,训练所述数据特征,以生成分类器,以及根据所述分类器对所述检索词进行分类,能够丰富检索结果,提高检索结果的多样性和扩展性。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1是本专利技术一个实施例的检索词分类方法的流程图。图2是本专利技术一个实施例的检索词分类装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的检索词分类方法及装置。图1是本专利技术一个实施例的检索词分类方法的流程图。该实施例的检索词分类方法可以应用在移动终端中,其中,该实施例中所说的移动终端可以是手机、平板电脑、智能便携式设备等具有各种操作系的硬件设备。如图1所示,该检索词分类方法可以包括以下几个步骤:S1,接收用户输入的检索词,并根据检索词获取对应的检索结果。举例来说,用户可进入应用商店,在应用商店的搜索栏中输入检索词“鲜花”,则可根据检索词“鲜花”对应用商店进行搜索,从而获取与“鲜花”相关的应用程序APP,如鲜花网、鲜花连连看等。S2,获取检索结果的点击数据,并根据点击数据提取对应的数据特征。在获取检索结果后,可接收用户对检索结果的点击操作,记录下点击操作对应的点击数据。然后可根据点击数据提取对应的数据特征。其中,数据特征可包括检索结果的名称、类别、关键字、版本、文件大小、下载次数、开发者姓名等。例如:被点击的APP是鲜花连连看,则可提取出鲜花连连看APP对应的名称“鲜花连连看”,类别“游戏”,版本“6.0”,文件大小“30M”,下载次数500次等。S3,训练数据特征,以生成分类器。在提取数据特征之后,可采用机器学习模型对数据特征进行训练,以生成分类器。其中,机器学习模型可包括朴素贝叶斯模型、支持向量机模型、神经网络等。举例来说,可使用APP的类别这一数据特征,采用朴素贝叶斯模型进行训练,从而生成分类器。或者,可使用APP的类别和关键字,采用支持向量机模型进行训练,从而生成分类器。S4,根据分类器对检索词进行分类。在训练好分类器后,可利用分类器对检索词进行分类。例如:检索词“鲜花”,可利用分类器将其分类为游戏类。当用户再次以检索词“鲜花”进行搜索时,可向用户推荐更多属于游戏类的APP,从而丰富检索结果。当然,检索词的分类不仅限于一类,可以属于多个类别。可优先向用户推荐点击次数多的类别。本专利技术实施例的检索词分类方法,通过接收用户输入的检索词,并根据检索词获取对应的检索结果,再获取检索结果的点击数据,并根据点击数据提取对应的数据特征,训练数据特征,以生成分类器,以及根据分类器对检索词进行分类,能够丰富检索结果,提高检索结果的多样性和扩展性。为了实现上述实施例,本专利技术还提出了一种检索词分类装置。图2是本专利技术一个实施例的检索词分类装置的结构示意图。如图2所示,该检索词分类装置包括获取模块110、提取模块120、训练模块130和分类模块140,其中:获取模块110用于接收用户输入的检索词,并根据检索词获取对应的检索结果。举例来说,用户可进入应用商店,在应用商店的搜索栏中输入检索词“鲜花”,则可根据检索词“鲜花”对应用商店进行搜索,从而获取与“鲜花”相关的应用程序APP,如鲜花网、鲜花连连看等。提取模块120用于获取检索结果的点击数据,并根据点击数据提取对应的数据特征。在获取检索结果后,可接收用户对检索结果的点击操作,记录下点击操作对应的点击数据。然后可根据点击数据提取对应的数据特征。其中,数据特征可包括检索结果的名称、类别、关键字、版本、文件大小、下载次数、开发者姓名等。例如:被点击的APP是鲜花连连看,则可提取出鲜花连连看APP对应的名称“鲜花连连看”,类别“游戏”,版本“6.0”,文件大小“30M”,下载次数500次等。训练模块130用于训练数据特征,以生成分类器。在提取数据特征之后,可采用机器学习模型对数据特征进行训练,以生成分类器。其中,机器学习模型可包括朴素贝叶斯模型、支持向量机模型、神经网络等。举例来说,可使用APP的类别这一数据特征,采用朴素贝叶斯模型进行训练,从而生成分类器。或者,可使用APP的类别和关键字,采用支持向量机模型进行训练,从而生成分类器。分类模块140用于根据分类器对检索词进行分类。在训练好分类器后,可利用分类器对检索词进行分类。例如:检索词“鲜花”,可利用分类器将其分类为游戏类。当用户再次以检索词“鲜花”进行搜索时,可向用户推荐更多属于游戏类的APP,从而丰富检索结果。当然,检索词的分类不仅限于一类,可以属于多个类别。可优先向用户推荐点击次数多的类别。本专利技术实施例的检索词分类装置,通过接收用户输入的检索词,并根据检索词获取对应的检索结果,再获取检索结果的点击数据,并根据点击数据提取对应的数据特征,训练数据特征,以生成分类器,以及根据分类器对检索词进行分类,能够丰富检索结果,提高检索结果的多样性和扩展性。对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性本文档来自技高网...
检索词分类方法及装置

【技术保护点】
一种检索词分类方法,包括:接收用户输入的检索词,并根据所述检索词获取对应的检索结果;获取所述检索结果的点击数据,并根据所述点击数据提取对应的数据特征;训练所述数据特征,以生成分类器;以及根据所述分类器对所述检索词进行分类。

【技术特征摘要】
1.一种检索词分类方法,包括:接收用户输入的检索词,并根据所述检索词获取对应的检索结果;获取所述检索结果的点击数据,并根据所述点击数据提取对应的数据特征;训练所述数据特征,以生成分类器;以及根据所述分类器对所述检索词进行分类。2.如权利要求1所述的方法,其中,所述数据特征包括所述检索结果的名称、类别、关键字、版本、文件大小、下载次数、开发者姓名中的一种或多种。3.如权利要求1所述的方法,其中,训练所述数据特征,以生成分类器,包括:采用机器学习模型对所述数据特征进行训练,以生成分类器。4.如权利要求3所述的方法,其中,所述机器学习模型包括朴素贝叶斯模型、支持向量机模型、神经网络中的一种。5.一种检索词分类...

【专利技术属性】
技术研发人员:马守玉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1