【技术实现步骤摘要】
信息搜索方法及装置
本专利技术涉及信息处理
,尤其涉及一种信息搜索方法及装置。
技术介绍
现有技术中,当用户需要解决某个问题时,可以在搜索引擎中输入该问题,搜索引擎搜索与该问题相关的问题,然后再查找这些相关的问题的答案,用户可以通过查找到的这些答案找到解决问题的途径。在信息搜索
中,将用户在搜索引擎中输入的问题称为当前搜索信息,搜索引擎中存储有之前各用户输入的搜索问题,这些问题称为历史搜索信息,每个历史搜索信息都对应至少一个反馈信息(即历史搜索信息的答案),搜索引擎接收到用户输入的当前搜索信息后,分别计算该当前搜索信息与存储的各历史搜索信息之间的相似度,然后选取出相似度较大的一些历史搜索信息,并将选取出的这些历史搜索信息提供给用户。由上可见,现有技术是根据当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息的。用户输入的当前搜索信息一般为短文本,而短文本包含的词量较少,若用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,那么这个历史搜索信息的反馈信息很可能会对用户有帮助,但是如果当前搜索信息和这个历史搜索信息所共同具有的单词较少,那么搜索引擎计算出的相似度就较低,搜索引擎可能不会将该历史搜索信息提供给用户,例如,用户输入的当前搜索信息为“我如何在互联网上下载音乐”,而搜索引擎中存储有历史搜索信息“从网络获取MP3歌曲最便捷的途径”,这两个搜索信息的涵义非常接近,那么“从网络获取MP3歌曲最便捷的途径”这个历史搜索信息的反馈信息很可能会对用户解决问题有帮助,但是这两个搜索信息共同具有的单词只有一个“网”字,那么搜索引擎针对这两个搜索信息 ...
【技术保护点】
一种信息搜索方法,其特征在于,包括:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。
【技术特征摘要】
1.一种信息搜索方法,其特征在于,包括:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户;其中,所述针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,具体包括:获得根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练得到的模型参数矢量;所述物理模型为贝叶斯逻辑回归模型;针对每个历史搜索信息,分别根据获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;其中,根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练,具体包括:针对预设的每个历史搜索信息以及该历史搜索信息的每个反馈信息,分别执行:获取该历史搜索信息与该反馈信息之间的特征信息;并根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;根据确定出的各特征向量,对预设的物理模型进行训练;其中,通过下述方式确定所述当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度:其中,Rel(qr,BAi)为当前搜索信息qr与最佳反馈信息BAi之间的关联度;Θ为所述模型参数矢量;为当前搜索信息qr与最佳反馈信息BAi之间的特征向量。2.如权利要求1所述的方法,其特征在于,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,具体包括:在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息;将选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。3.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括:按照对应的最佳反馈信息的关联度由大到小的顺序,将选取出的历史搜索信息进行排序;并将排序后的结果提供给用户。4.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括:针对选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度,并根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度;按照相似度由大到小的顺序,将选取出的历史搜索信息进行排序;并将排序后的结果提供给用户。5.如权利要求4所述的方法,其特征在于,通过下述方式确定当前搜索信息与历史搜索信息之间的相似度:其中,RelSim(qr,Qi)为当前搜索信息qr与历史搜索信息Qi之间的相似度;Rel(qr,BAi)为当前搜索信息qr与历史搜索信息Qi对应的最佳反馈信息BAi之间的关联度;Rel(Qi,BAi)为历史搜索信息Qi与对应的最佳反馈信息BAi之间的关联度。6.一种信息搜索装置,其特征在于,包括:当前搜...
【专利技术属性】
技术研发人员:凌俊民,刘晓峰,梁耿,陈阳,徐俊,
申请(专利权)人:中国移动通信集团广西有限公司,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。