一种获取具有对比效果的图片搜索结果的方法及装置制造方法及图纸

技术编号:9462873 阅读:124 留言:0更新日期:2013-12-19 00:16
本发明专利技术提供了一种获取具有对比效果的图片搜索结果的方法及装置,其中所述方法包括:利用预设的种子词从搜索日志中挖掘关键词模板;利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;确定所述歧义词相关联的需求词;当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示。通过上述方式,本发明专利技术能够根据用户的搜索需求获取全面的图片搜索结果。

【技术实现步骤摘要】
一种获取具有对比效果的图片搜索结果的方法及装置
本专利技术涉及图片搜索技术,特别涉及一种获取具有对比效果的图片搜索结果的方法和装置。
技术介绍
目前的图片搜索引擎根据用户输入的关键词,查找图片周围文本中包含该关键词的图片作为搜索结果返回给用户,如果用户输入的关键词反映多个搜索需求,现有的图片搜索引擎将对此无法判断,其返回的结果很可能只反映其中的一个搜索需求,如果该搜索需求正好不符合用户的意图,则用户可能需要经过多次搜索,才能获得自己满意的图片。请参考图1,图1是现有的图片搜索引擎用户搜索“东方不败”时的返回结果。假设用户在搜索“东方不败”时,由演员“陈乔恩”扮演的“东方不败”正处于电视台的热播阶段,则用户得到的图片搜索结果就很可能如图1所示,即用户在搜索结果中很可能只能得到“陈乔恩”扮演的“东方不败”这一种搜索需求的结果。但事实上用户搜索“东方不败”有可能想要演员“林青霞”扮演的结果,又或者用户搜索“东方不败”时,并不是想得到特定演员扮演的结果,而是希望分别得到不同演员扮演的结果。
技术实现思路
本专利技术所要解决的技术问题是提供一种获取具有对比效果的图片搜索结果的方法及装置,以解决现有的图片搜索引擎不能根据用户的搜索需求返回全面的搜索结果的问题。本专利技术为解决技术问题而采用的技术方案是提供一种获取具有对比效果的图片搜索结果的方法,包括:利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。根据本专利技术之一优选实施例,所述步骤A包括:从搜索日志中提取包含种子中心词及种子限定词的历史搜索词;将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。根据本专利技术之一优选实施例,所述步骤B包括:针对搜索日志的历史搜索词中与模板槽匹配的中心词,根据该中心词匹配到的各个关键词模板的置信度之和确定该中心词的歧义分值,其中一个关键词模板的置信度等于该关键词模板的模板槽匹配的相异种子中心词个数与预设的种子中心词总数之比;将歧义分值超过预设第一阈值的中心词确定为具有一个以上搜索需求的歧义词。根据本专利技术之一优选实施例,所述步骤C包括:以会话为单位对搜索日志进行切分;当切分得到的同一个会话中存在一个搜索动作包含歧义词,且另一搜索动作不仅包含该歧义词,还包括设定类别词时,将所述设定类别词作为该歧义词相关联的候选需求词;计算歧义词的候选需求词的需求热度,并将需求热度高于预设第二阈值的候选需求词作为最终的需求词。根据本专利技术之一优选实施例,所述步骤D在对各类图片搜索结果对比展示时,根据匹配词相关联的需求词的需求热度,确定各类图片搜索结果的排列顺序。本专利技术还提供了一种获取具有对比效果的图片搜索结果的装置,包括:模板挖掘单元,用于利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;歧义词挖掘单元,用于利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;需求词挖掘单元,用于确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;展示单元,用于当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。根据本专利技术之一优选实施例,所述模板挖掘单元包括:提取子单元,用于从搜索日志中提取包含种子中心词及种子限定词的历史搜索词;泛化子单元,用于将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。根据本专利技术之一优选实施例,所述歧义词挖掘单元包括:计算子单元,用于针对搜索日志的历史搜索词中与模板槽匹配的中心词,根据该中心词匹配到的各个关键词模板的置信度之和确定该中心词的歧义分值,其中一个关键词模板的置信度等于该关键词模板的模板槽匹配的相异种子中心词个数与预设的种子中心词总数之比;歧义词确定子单元,用于将歧义分值超过预设第一阈值的中心词确定为具有一个以上搜索需求的歧义词。根据本专利技术之一优选实施例,所述需求词挖掘单元包括:切分子单元,用于以会话为单位对搜索日志进行切分;候选需求词确定子单元,用于当切分得到的同一个会话中存在一个搜索动作包含歧义词,且另一搜索动作不仅包含该歧义词,还包括设定类别词时,将所述设定类别词作为该歧义词相关联的候选需求词;最终需求词确定子单元,用于计算歧义词的候选需求词的需求热度,并将需求热度高于预设第二阈值的候选需求词作为最终的需求词。根据本专利技术之一优选实施例,所述展示单元在对各类图片搜索结果对比展示时,根据匹配词相关联的需求词的需求热度,确定各类图片搜索结果的排列顺序。由以上技术方案可以看出,本专利技术首先通过搜索日志挖掘到关键词模板,然后通过关键词模板从搜索日志中挖掘歧义词,再通过歧义词确定相关联的需求词,从而能够准确确定用户的哪些搜索行为具有多个搜索需求,并在线上用户的搜索中,对具有多个搜索需求的图片搜索行为进行有针对性的反馈,产生对比效果的图片搜索结果,由于本专利技术能够根据用户的搜索需求返回全面的搜索结果,因此减少了用户搜索次数,提高了搜索效率。【附图说明】图1为现有的图片搜索结果返回结果的实施例的示意图;图2为本专利技术中获取具有对比效果的图片搜索结果的方法的实施例的流程示意图;图3为本专利技术中具有对比效果的图片搜索结果的一个实施例的示意图;图4为本专利技术中具有对比效果的图片搜索结果的又一个实施例的示意图;图5为本专利技术中获取具有对比效果的图片搜索结果的装置的实施例的结构示意框图;图6为本专利技术中模板挖掘单元的实施例的结构示意框图;图7为本专利技术中歧义词挖掘单元的实施例的结构示意框图;图8为本专利技术中需求词挖掘单元的实施例的结构示意框图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。请参考图2,图2为本专利技术中获取具有对比效果的图片搜索结果的方法的实施例的流程示意图。如图2所示,本实施例包括线下实施部分和线上实施部分,其中线下实施部分包括步骤S1至步骤S3,线上实施部分为步骤S4。下面将对本实施例的线下实施部分和线上实施部分分别进行介绍。具体地,步骤S1包括步骤S11和步骤S12。步骤S11:从搜索日志中提取包含种子中心词及种子限定词的历史搜索词。步骤S12:将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。步骤S11中的种子词是预先由人工设定的,并且种子词可分为种子中心词及种子限定词。其中种子中心词在相同类目下反映一个以上的搜索需求,种子限定词决定了上述相同类目的范围。例如本文档来自技高网...
一种获取具有对比效果的图片搜索结果的方法及装置

【技术保护点】
一种获取具有对比效果的图片搜索结果的方法,包括:A.利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;B.利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;C.确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;D.当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。

【技术特征摘要】
1.一种获取具有对比效果的图片搜索结果的方法,包括:A.利用预设的种子词从搜索日志中挖掘关键词模板,包括:从搜索日志中提取包含种子中心词及种子限定词的历史搜索词,将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板;其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;B.利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;C.确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;D.当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。2.根据权利要求1所述的方法,其特征在于,所述步骤B包括:针对搜索日志的历史搜索词中与模板槽匹配的中心词,根据该中心词匹配到的各个关键词模板的置信度之和确定该中心词的歧义分值,其中一个关键词模板的置信度等于该关键词模板的模板槽匹配的相异种子中心词个数与预设的种子中心词总数之比;将歧义分值超过预设第一阈值的中心词确定为具有一个以上搜索需求的歧义词。3.根据权利要求1所述的方法,其特征在于,所述步骤C包括:以会话为单位对搜索日志进行切分;当切分得到的同一个会话中存在一个搜索动作包含歧义词,且另一搜索动作不仅包含该歧义词,还包括设定类别词时,将所述设定类别词作为该歧义词相关联的候选需求词;计算歧义词的候选需求词的需求热度,并将需求热度高于预设第二阈值的候选需求词作为最终的需求词。4.根据权利要求3所述的方法,其特征在于,所述步骤D在对各类图片搜索结果对比展示时,根据匹配词相关联的需求词的需求热度,确定各类图片搜索结果的排列顺序。5.一种获取具有对比效果的图片搜索结果的装置,包括:模板挖掘单元,用于利用预设的种子词从搜索日志中挖掘关键词模板,其...

【专利技术属性】
技术研发人员:黄际洲
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1