应用检索的优化方法和装置制造方法及图纸

技术编号:10151943 阅读:138 留言:0更新日期:2014-06-30 18:56
本发明专利技术提出一种应用检索的优化方法和装置,其中,应用检索的优化方法包括:获得当前特征;将当前特征与正排表进行匹配,根据匹配结果确定当前特征的属性,根据属性对与当前特征相关的应用进行归一化处理;以及根据归一化处理结果对应用进行排序,以便根据排序后的结果进行检索。本发明专利技术实施例的应用检索的优化方法,通过获得当前特征,并根据当前特征对相关的应用进行归一化处理,使相关的应用的正排表加入了更多的特征,并以此优化了相关的应用的相关度,使得用户在搜索应用时,能够获得更合理的搜索结果,提升了用户体验。

【技术实现步骤摘要】
【专利摘要】本专利技术提出一种应用检索的优化方法和装置,其中,应用检索的优化方法包括:获得当前特征;将当前特征与正排表进行匹配,根据匹配结果确定当前特征的属性,根据属性对与当前特征相关的应用进行归一化处理;以及根据归一化处理结果对应用进行排序,以便根据排序后的结果进行检索。本专利技术实施例的应用检索的优化方法,通过获得当前特征,并根据当前特征对相关的应用进行归一化处理,使相关的应用的正排表加入了更多的特征,并以此优化了相关的应用的相关度,使得用户在搜索应用时,能够获得更合理的搜索结果,提升了用户体验。【专利说明】应用检索的优化方法和装置
本专利技术涉及移动搜索
,特别涉及一种应用检索的优化方法和装置。
技术介绍
随着科技的不断进步,各式各样的移动应用层出不穷,为用户提供了丰富的信息资源。目前,搜索移动应用可通过进入搜索引擎网站,输入关键词对移动应用进行搜索;也可以通过安装第三方软件如:手机助手等,在手机助手中对移动应用进行搜索。但是,在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:多数移动应用的描述信息不够详细,用户在不知道应用的关键词的情况下,很难搜索到理想的应用;或者用户通过点击关键词进行移动应用搜索,获得的结果相关度并不高,导致用户体验差。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题。为此,本专利技术的第一个目的在于提出一种应用检索的优化方法,该方法通过获得当前特征,并根据当前特征对相关的应用进行归一化处理,能够优化相关的应用的相关度,使得用户在搜索应用时获得更合理的搜索结果,提升用户体验。为达上述目的,根据本专利技术第一方面实施例提出了一种应用检索的优化方法,包括:获得当前特征;将所述当前特征与正排表进行匹配,根据匹配结果确定所述当前特征的属性,根据所述属性对与所述当前特征相关的应用进行归一化处理;以及根据归一化处理结果对所述应用进行排序,以便根据排序后的结果进行检索。本专利技术实施例的应用检索的优化方法,通过获得当前特征,并根据当前特征对相关的应用进行归一化处理,使相关的应用的正排表加入了更多的特征,并以此使相关的应用的正排表加入了更多的特征,并以此优化了相关的应用的相关度,使得用户在搜索应用时,能够获得更合理的搜索结果,提升了用户体验。本专利技术第二方面实施例提出了一种应用检索的优化装置,包括:获得模块,用于获得当前特征;处理模块,用于将所述当前特征与正排表进行匹配,根据匹配结果确定所述当前特征的属性,根据所述属性对与所述当前特征相关的应用进行归一化处理;以及排序模块,用于根据归一化处理结果对所述应用进行排序,以便根据排序后的结果进行检索。本专利技术实施例的应用检索的优化装置,通过获得当前特征,并根据当前特征对相关的应用进行归一化处理,使相关的应用的正排表加入了更多的特征,并以此优化了相关的应用的相关度,使得用户在搜索应用时,能够获得更合理的搜索结果,提升了用户体验。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。【专利附图】【附图说明】本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的应用检索的优化方法的流程图;图2为根据本专利技术另一个实施例的应用检索的优化方法的流程图;图3为根据本专利技术一个实施例的应用检索的优化装置的结构示意图;图4为根据本专利技术另一个实施例的应用检索的优化装置的结构示意图。【具体实施方式】下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述根据本专利技术实施例的应用检索的优化方法和装置。为了使用户在搜索应用时,能够获得更合理的搜索结果。为此,本专利技术的实施例提出一种应用检索的优化方法。图1为根据本专利技术一个实施例的应用检索的优化方法的流程图。如图1所示,该应用检索的优化方法包括:S101,获得当前特征。在本专利技术的实施例中,当前特征可以是用户选择的特征词,也可以是应用的相关信息。其中,应用的相关信息包括:应用的功能描述、使用说明和更新日志中的一种或多种。服务器可通过用户在客户端点击选择的特征词,获得当前特征;或通过搜索应用的功能描述、使用说明、更新日志中的特征词,获得当前特征,以使服务器将当前特征与正排表进行匹配。S102,将当前特征与正排表进行匹配,根据匹配结果确定当前特征的属性,根据属性对与当前特征相关的应用进行归一化处理。在获得当前特征后,服务器可将当前特征与正排表进行匹配,若匹配不成功,即当前特征不在相关的应用的特征集中,则确定当前特征为新特征;若匹配成功,即当前特征在相关的应用的特征集中,则确定当前特征为已有特征。其中,正排表是描述一篇文本分词后统计信息的索引表格。正排表也称为正排索引或前向索引。具体由以下字段组成:(l)docId: —个文档的局部编号。(2)WordId:表示文档分词后的编号,也可称为"索引词编号"。(3)nHits:表示某个索引词在文档中出现的次数。(4) offset:表示某个索引词在文档中出现的位置,即相对于正文的偏移量。具体地,在本实施例中,特征词对应为解释中的索引词。在确定当前特征的属性后,服务器可根据属性对当前特征相关的应用进行归一化处理。当当前特征为新特征时,首先计算当前特征相对于对应应用的词频和对应应用的反文档频率,然后根据正排表中的所有特征和当前特征的词频及反文档频率获得对应应用的相关度。具体地,可通过公式(I)获得词频:TF=M/N 公式(I)其中,TF表示词频,M表示当前特征词搜索到的对应应用的次数,N表示对应应用的特征词总数。再通过公式(2)获得对应应用的反文档频率:IDF=1g (I/N) 公式(2)其中,IDF表示反文档频率,I表示通过当前特征词搜索到的应用的总数,N表示对应应用的特征词总数。然后可根据公式(3)获得当前特征词对于对应应用的重要程度:a=TF*IDF 公式(3)其中,α表示当前特征词对于对应应用的重要程度,TF表示词频,IDF表示反文档频率。最后,可根据公式(4)获得对应应用的相关度:β !=α + β 公式(4)其中,α表示当前特征词对于对应应用的重要程度;β为已知参数,其表示已有特征词对于对应应用的重要程度。举例来说,假设某应用的正排表中的特征数量总数为η个,则该应用的相关度β =TFfIDFJTF2^IDF2+......TFn*IDFn。如果当前特征为新特征,即第η+1个特征,则该应用的相关度 P1=TF1WDFJTFdIDF2+ ......TFn*IDFn+TFn+1*IDFn+1。其中,TFn+1*IDFn+1 为新特征对于对应应用的重要程度。当当前特征为已有特征时,首先计算当前特征相对于对应应用的词频和对应应用的反文档频率,然后根据当前特征和正排表中除当前特征之外的特征的词频及反文档频率词频获得对应应用的相关度。举例来说,假设某应用的正排表中的特征数量总数为η个,则该应用的相关度β =Tf^idfjTf2Wdf2+......TFn*iDFn。如果当前特征为已有特征本文档来自技高网...
应用检索的优化方法和装置

【技术保护点】
一种应用检索的优化方法,其特征在于,包括:获得当前特征;将所述当前特征与正排表进行匹配,根据匹配结果确定所述当前特征的属性,根据所述属性对与所述当前特征相关的应用进行归一化处理;以及根据归一化处理结果对所述应用进行排序,以便根据排序后的结果进行检索。

【技术特征摘要】

【专利技术属性】
技术研发人员:邱鑫张凯勇洪庚伟
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1