信息建议方法及系统技术方案

技术编号:8883221 阅读:144 留言:0更新日期:2013-07-04 02:04
本发明专利技术涉及一种信息建议方法及系统,所述方法包括:记录用户选择的每个查询词及对应的结果信息,并设置该结果信息的特征值;根据所述特征值从每个查询词对应的结果信息中选取前N个结果信息,其中N为自然数,且N>=2;根据所述特征值从每个查询词的前N个结果信息中选取前M个结果信息,其中M为自然数,且M<N;将每个查询词切分为多个分词单元,并建立每个分词单元与多个查询词的对应关系;根据每个分词单元与多个查询词的对应关系分别建立每个分词单元与多个查询词的前M个结果信息的对应关系。本发明专利技术能够在检索过程中为用户直接提供每个查询词的前M个优质的结果信息,直接满足用户的需求,降低了检索成本。

【技术实现步骤摘要】

本专利技术涉及信息检索领域,特别涉及一种信息建议方法及系统
技术介绍
查询建议,又称为Query Suggestion,图1为现有的查询建议系统(搜索引擎)的界面示意图,如图1所示,当用户在搜索引擎的输入区域输入“还珠”的检索词时,搜索引擎会自动以下拉表的形式提供多个查询词11如“还珠格格”、“还珠格格这燕儿翩翩飞”等,以提高用户检索信息的效率,目前查询建议系统已经成为了减少用户获取信息成本的重要方式,例如百度的30%的搜索流量来源于建议系统,查询建议系统是不是做得好,将直接影响到用户体验。然而,传统的查询建议系都统以文本展示为主,其存在信息有限,交互不够友好,而且用户还需要通过搜索页才能找到想要的页面的问题,据此,业界出现了一些创新的做法,例如将实体库(电视库信息,电影库信息)与查询建议系统相结合,图2为现有的结合了实体库信息的查询建议系统界面图,如图2所示,如果查询建议系统中的查询词在实体库中有所匹配,则在查询建议系统界面的右侧会展示相应的信息12,虽然,这种结合了实体库信息的建议系统可以展示了更多的信息,使交互更为丰富,但是其缺点是只有在用户输入的检索词与查询建议系统预设的标准查询词完全匹配的情况下,实体库中相应的信息12才能展示出来,如果用户输入的是与标准查询词类似的检索词,那么就无法展示相应的信息12,这种情况下就存在着一方面召回不够,一方面也给用户带来了困惑的问题,另外,实体库中的相应的信息12通常与标准查询词是一对一匹配的,因此,当前的结合了实体库信息的查询建议系统无法向用户展示多条相应的信息12。
技术实现思路
本专利技术的目的在于提供一种信息建议方法及系统,对用户历史的查询词及结果信息进行挖掘,实现线下收集前M个优质的结果信息,避免了用户在检索过程中产生延迟、影响体验,在检索过程中为用户直接提供每个查询词的前M个优质的结果信息,直接满足用户的需求,降低检索成本。为解决上述问题,本专利技术提供一种信息建议方法,包括:记录用户选择的每个查询词及对应的结果信息,并设置该结果信息的特征值;根据所述特征值从每个查询词对应的结果信息中选取前N个结果信息,其中N为自然数,且N>= 2 ;根据所述特征值从每个查询词的前N个结果信息中选取前M个结果信息,其中M为自然数,且M < N ;将每个查询词切分为多个分词单元,并建立每个分词单元与多个查询词的对应关系;根据每个分词单元与多个查询词的对应关系分别建立每个分词单元与多个查询词的前M个结果信息的对应关系。进一步的,在上述方法中,所述结果信息包括标题、摘要、标签、播放地址和缩略图地址中的一种或任意组合。进一步的,在上述方法中,所述特征值包括反映每条结果信息与对应的查询词的相关性的相关权值。进一步的,在上述方法中,所述特征值还包括根据用户对结果信息的选择次数确定的点击率值。进一步的,在上述方法中,所述特征值还包括根据用户选择对结果信息的关注程度确定的关注率值。进一步的,在上述方法中,所述关注程度包括用户对所述结果信息的浏览时间和/或翻页情况。进一步的,在上述方法中,根据所述特征值从每个查询词对应的结果信息中选取前N个结果信息步骤中,从每个查询词对应的结果信息中选取点击率值靠前的N个结果信肩、O进一步的,在上述方法中,根据所述特征值从每个查询词的前N个结果信息中选取前M个结果信息步骤中,根据所述点击率值、相关权值及关注率值获取一综合权值,从每个查询词的前N个结果信息中选取所述综合权值靠前的M个结果信息。进一步的,在上述方法中,将所述点击率值、相关权值及关注率值分别按不同权值进行加权累加获取所述综合权值。进一步的,在上述方法中,将所述点击率值、相关权值及关注率值分别按20%、30%和50%的权值进行加权累加。根据本专利技术的另一面,提供一种信息建议系统,包括:日志记录模块,用于记录用户选择的每个查询词及对应的结果信息,并设置该结果信息的特征值;结果选取模块,用于根据所述特征值从每个查询词对应的结果信息中选取前M个结果信息,其中M为自然数;检索模块,用于将每个查询词切分为多个分词单元,并分别建立每个分词单元与多个查询词的前M个结果信息的对应关系。进一步的,在上述系统中,所述结果选取模块包括:第一结果单元,用于根据所述特征值从每个查询词对应的结果信息中选取前N个结果信息,其中N为自然数,且N >= 2 ;第二结果单元,用于根据所述特征值从每个查询词的前N个结果信息中选取前M个结果信息,其中M为自然数,且M < No进一步的,在上述系统中,所述检索模块包括:第一索引单元,用于将每个查询词切分为多个分词单元,并建立每个分词单元与多个查询词的对应关系;第二索引单元,用于根据每个分词单元与多个查询词的对应关系分别建立每个分词单元与多个查询词的前M个结果信息的对应关系。进一步的,在上述系统中,所述日志记录模块记录的结果信息包括标题、摘要、标签、播放地址和缩略图地址中的一种或任意组合。进一步的,在上述系统中,所述日志记录模块设置的特征包括反映每条结果信息与对应的查询词的相关性的相关权值、根据用户对结果信息的选择次数确定的点击率值或据用户选择对结果信息的关注程度确定的关注率值中的一项或任意组合。进一步的,在上述系统中,所述第一结果单元从每个查询词对应的结果信息中选取点击率值靠前的N个结果信息。进一步的,在上述系统中,所述第二结果单元根据所述点击率值、相关权值及关注率值获取一综合权值,从每个查询词的前N个结果信息中选取所述综合权值靠前的M个结果息。进一步的,在上述系统中,所述第二结果单元将所述点击率值、相关权值及关注率值分别按不同权值进行加权累加获取所述综合权值。进一步的,在上述系统中,所述第二结果单元将所述点击率值、相关权值及关注率值分别按20%、30%和50%的权值进行加权累加。与现有技术相比,本专利技术通过记录用户选择的每个查询词及对应的结果信息,并设置该结果信息的特征值,对用户历史的查询词及结果信息进行挖掘,可以保证最终得到的结果信息更能满足用户需求。另外,本专利技术根据所述特征值从每个查询词对应的结果信息中选取前N个结果信息,其中N为自然数,且N >= 2,再根据所述特征值从每个查询词的前N个结果信息中选取前M个结果信息,其中M为自然数,且M < N,实现了在检索过程中为用户直接提供每个查询词的前M个优质的结果信息,直接满足用户的需求,降低了检索成本。 此外,本专利技术通过将每个查询词切分为多个分词单元,并建立每个分词单元与多个查询词的对应关系,最后根据每个分词单元与多个查询词的对应关系分别建立每个分词单元与多个查询词的前M个结果信息的对应关系,可以实现线下收集前M个优质的结果信肩、 O附图说明图1是现有的查询建议系统的界面示意图;图2是现有的结合了实体库信息的查询建议系统界面图;图3是本专利技术一实施例的信息建议方法的流程图;图4是本专利技术一实施例的信息建议系统的功能模块示意图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。如图1所示,本专利技术提供一种信息建议方法,包括:步骤SI,记录用户选择的每个查询词及对应的结果信息,并设置该结果信息的特征值,这里通过对用户历史的查询词及结果信本文档来自技高网...

【技术保护点】
一种信息建议方法,其特征在于,包括:记录用户选择的每个查询词及对应的结果信息,并设置该结果信息的特征值;根据所述特征值从每个查询词对应的结果信息中选取前N个结果信息,其中N为自然数,且N>=2;根据所述特征值从每个查询词的前N个结果信息中选取前M个结果信息,其中M为自然数,且M<N;将每个查询词切分为多个分词单元,并建立每个分词单元与多个查询词的对应关系;根据每个分词单元与多个查询词的对应关系分别建立每个分词单元与多个查询词的前M个结果信息的对应关系。

【技术特征摘要】

【专利技术属性】
技术研发人员:程恒奇胡凯
申请(专利权)人:盛乐信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1