信息搜索方法及装置制造方法及图纸

技术编号:8717072 阅读:127 留言:0更新日期:2013-05-17 19:23
本发明专利技术公开了一种信息搜索方法及装置,该信息搜索方法包括步骤:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。采用本发明专利技术技术方案,解决了采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低的问题。

【技术实现步骤摘要】
信息搜索方法及装置
本专利技术涉及信息处理
,尤其涉及一种信息搜索方法及装置。
技术介绍
现有技术中,当用户需要解决某个问题时,可以在搜索引擎中输入该问题,搜索引擎搜索与该问题相关的问题,然后再查找这些相关的问题的答案,用户可以通过查找到的这些答案找到解决问题的途径。在信息搜索
中,将用户在搜索引擎中输入的问题称为当前搜索信息,搜索引擎中存储有之前各用户输入的搜索问题,这些问题称为历史搜索信息,每个历史搜索信息都对应至少一个反馈信息(即历史搜索信息的答案),搜索引擎接收到用户输入的当前搜索信息后,分别计算该当前搜索信息与存储的各历史搜索信息之间的相似度,然后选取出相似度较大的一些历史搜索信息,并将选取出的这些历史搜索信息提供给用户。由上可见,现有技术是根据当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息的。用户输入的当前搜索信息一般为短文本,而短文本包含的词量较少,若用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,那么这个历史搜索信息的反馈信息很可能会对用户有帮助,但是如果当前搜索信息和这个历史搜索信息所共同具有的单词较少,那么搜索引擎计算出的相似度就较低,搜索引擎可能不会将该历史搜索信息提供给用户,例如,用户输入的当前搜索信息为“我如何在互联网上下载音乐”,而搜索引擎中存储有历史搜索信息“从网络获取MP3歌曲最便捷的途径”,这两个搜索信息的涵义非常接近,那么“从网络获取MP3歌曲最便捷的途径”这个历史搜索信息的反馈信息很可能会对用户解决问题有帮助,但是这两个搜索信息共同具有的单词只有一个“网”字,那么搜索引擎针对这两个搜索信息计算出的相似度就非常低,从而不会将该历史搜索信息提供给用户,用户也就无法通过该历史搜索信息的答案找到解决问题的途径。因此采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低。
技术实现思路
本专利技术实施例提供一种信息搜索方法及装置,用以解决采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低的问题。本专利技术实施例技术方案如下:一种信息搜索方法,该方法包括步骤:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户;其中,所述针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,具体包括:获得根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练得到的模型参数矢量;所述物理模型为贝叶斯逻辑回归模型;针对每个历史搜索信息,分别根据获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;其中,根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练,具体包括:针对预设的每个历史搜索信息以及该历史搜索信息的每个反馈信息,分别执行:获取该历史搜索信息与该反馈信息之间的特征信息;并根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;根据确定出的各特征向量,对预设的物理模型进行训练;其中,通过下述方式确定所述当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度:其中,Rel(qr,BAi)为当前搜索信息qr与最佳反馈信息BAi之间的关联度;Θ为所述模型参数矢量;为当前搜索信息qr与最佳反馈信息BAi之间的特征向量。一种信息搜索装置,包括:当前搜索信息获得单元,用于获得用户输入的当前搜索信息;关联度确定单元,用于针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;历史搜索信息选取单元,用于根据关联度确定单元确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;历史搜索信息提供单元,用于将历史搜索信息选取单元选取出的历史搜索信息提供给用户;还包括:模型训练单元,用于预先根据预设的各历史搜索信息及对应的各反馈信息,对物理模型进行训练,得到模型参数矢量;其中,所述物理模型为贝叶斯逻辑回归模型;其中,关联度确定单元具体包括:参数矢量获得子单元,用于获得模型训练单元得到的模型参数矢量;关联度计算子单元,用于针对每个历史搜索信息,分别根据参数矢量获得子单元获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;其中,模型训练单元具体包括:特征信息获取子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别获取该历史搜索信息与该反馈信息之间的特征信息;特征向量确定子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征信息获取子单元获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;模型训练子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征向量确定子单元确定出的各特征向量,对预设的物理模型进行训练;其中,关联度确定单元通过下述方式确定所述当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度:其中,Rel(qr,BAi)为当前搜索信息qr与最佳反馈信息BAi之间的关联度;Θ为所述模型参数矢量;为当前搜索信息qr与最佳反馈信息BAi之间的特征向量。本专利技术实施例技术方案中,首先获得用户输入的当前搜索信息,然后针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,并将选取出的历史搜索信息提供给用户。由上可见,本专利技术实施例技术方案在为用户搜索信息时,不再根据用户输入的当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息,若当用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,即使共同具有的单词较少,那么该历史搜索信息对应的最佳反馈信息和当前搜索信息也是非常关联的,因此本专利技术实施例根据当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度来选取历史搜索信息,从而能够全面的为用户搜索历史搜索信息,且有效地提高了搜索的准确性。附图说明图1为本专利技术实施例一中,信息搜索方法流程示意图;图2为本专利技术实施例一中,信息搜索方法原理示意图;图3为本专利技术实施例三中,信息搜索装置结构示意图。具体实施方式下面结合各个附图对本专利技术实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。实施例一如图1所示,为本专利技术实施例一提出的信息搜索方法流程示意图,其原理如图2所示,具体处理流程如下:步骤11,获得用户输入的当前搜索信息。用户输入的当前搜索信息一般为短文本信息。步骤12,针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。本专利技术实施例一提出,可以预先根据预设的各历史搜索信息及对应的反馈信息,对物理模型进本文档来自技高网
...
信息搜索方法及装置

【技术保护点】
一种信息搜索方法,其特征在于,包括:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。

【技术特征摘要】
1.一种信息搜索方法,其特征在于,包括:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户;其中,所述针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,具体包括:获得根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练得到的模型参数矢量;所述物理模型为贝叶斯逻辑回归模型;针对每个历史搜索信息,分别根据获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;其中,根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练,具体包括:针对预设的每个历史搜索信息以及该历史搜索信息的每个反馈信息,分别执行:获取该历史搜索信息与该反馈信息之间的特征信息;并根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;根据确定出的各特征向量,对预设的物理模型进行训练;其中,通过下述方式确定所述当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度:其中,Rel(qr,BAi)为当前搜索信息qr与最佳反馈信息BAi之间的关联度;Θ为所述模型参数矢量;为当前搜索信息qr与最佳反馈信息BAi之间的特征向量。2.如权利要求1所述的方法,其特征在于,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,具体包括:在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息;将选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。3.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括:按照对应的最佳反馈信息的关联度由大到小的顺序,将选取出的历史搜索信息进行排序;并将排序后的结果提供给用户。4.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括:针对选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度,并根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度;按照相似度由大到小的顺序,将选取出的历史搜索信息进行排序;并将排序后的结果提供给用户。5.如权利要求4所述的方法,其特征在于,通过下述方式确定当前搜索信息与历史搜索信息之间的相似度:其中,RelSim(qr,Qi)为当前搜索信息qr与历史搜索信息Qi之间的相似度;Rel(qr,BAi)为当前搜索信息qr与历史搜索信息Qi对应的最佳反馈信息BAi之间的关联度;Rel(Qi,BAi)为历史搜索信息Qi与对应的最佳反馈信息BAi之间的关联度。6.一种信息搜索装置,其特征在于,包括:当前搜...

【专利技术属性】
技术研发人员:凌俊民刘晓峰梁耿陈阳徐俊
申请(专利权)人:中国移动通信集团广西有限公司
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1