建立需求分析模板的方法、搜索需求识别的方法及装置制造方法及图纸

技术编号:8489788 阅读:270 留言:0更新日期:2013-03-28 10:36
本发明专利技术提供了一种建立需求分析模板的方法、搜索需求识别的方法及装置,其中建立需求分析模板的方法包括:获取需求类型的种子query集合;确定种子query集合的所有n元词组(n-gram),n为预设的一个或多个正整数;根据统计得到的各n-gram在需求类型的种子集合中的出现次数,将种子query集合的各种子query中N1个出现次数最低的n-gram替换为通配符,得到候选需求分析模板,N1为预设的正整数;对各候选需求分析模板进行置信度评分,选择置信度评分排在前N2个的候选需求分析模板作为需求类型的需求分析模板,N2为预设的正整数。通过本发明专利技术能够节约人力成本,扩大适用面以及提高召回率和识别准确率。

【技术实现步骤摘要】
建立需求分析模板的方法、搜索需求识别的方法及装置
本专利技术涉及计算机
,特别涉及一种建立需求分析模板的方法、搜索需求识别的方法和装置。
技术介绍
随着互联网在全球范围内的迅速发展与成熟,网络上的信息资源不断丰富,信息数据量也在飞速膨胀,通过搜索引擎获取信息已经成为现代人获取信息的主要方式。为了向用户提供更加便捷、准确地查询服务是搜索引擎技术在当今和未来的发展方向。在搜索引擎技术中,对用户的搜索需求进行识别是提高搜索准确性和有效性的重要一环,特别在结构化搜索(即垂直搜索)中作用显著。经分析发现,用户在使用query表述搜索需求时,表达方式通常体现出一定的规律性。比如用户在查询小说类需求时,可能会输入如下query 男主角很帅的小说”、“男主角是同性恋的小说”、“男主角是武林高手的小说”等,这些query都遵循一种特定的表达模式,即男主角W+的小说,其中W+为通配符。如果将这一表达模式作为小说类需求的一种,则可以很容易识别出“男主角失恋的小说”、“男主角很man的小说”等query为小说类需求。因此,便衍生出了基于需求分析模板的需求识别方式,而现有的需求分析模板是通过观察常用qu本文档来自技高网...

【技术保护点】
一种建立需求分析模板的方法,其特征在于,分别针对预设的需求类型执行以下步骤:S1、获取所述需求类型的种子query集合;S2、确定所述种子query集合的所有n元词组n?gram,所述n为预设的一个或多个正整数;S3、根据统计得到的各n?gram在所述需求类型的种子集合中的出现次数,将所述种子query集合的各种子query中N1个出现次数最低的n?gram替换为通配符,得到候选需求分析模板,所述N1为预设的正整数;S4、对各候选需求分析模板进行置信度评分,选择置信度评分排在前N2个的候选需求分析模板作为所述需求类型的需求分析模板,所述N2为预设的正整数。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄际洲
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1