【技术实现步骤摘要】
本专利技术涉及涉及自然语言处理技术,尤其涉及用于确定查询序列的查询类别的技 术。
技术介绍
在现有技术中,对用户的查询序列进行查询分类时,往往通过静态专有名词词典 结合查询类别需求后缀来简单识别。然而,该分类方法过多地依赖于词典中专有名词挖掘 的准确率和召回率,加上专有名词相对比较固定,并不能真正满足用户查询分类的要求。此 处的召回率和准确率是广泛应用于信息检索和统计学分类领域的两个度量值,用于评价检 索或统计结果的质量,召回率是指检索出的相关文档数和文档库中所有的相关文档数的比 率,其主要用于衡量检索系统的查全率;而准确率是指检索出的相关文档数与检索出的文 档总数的比率,其主要用于衡量检索系统的精度。此外,上述传统的分类方法无法实时添加互联网上的新增词,当用户输入新的查 询序列时,与这些新增词相对应的相关搜索资源可能无法提供给用户,极大地影响了检索 的召回率。有鉴于此,如何对查询序列进行扩展,并根据扩展后的查询序列来确定所述查询 序列的查询类别,提高检索的准确率和召回率,是相关技术人员亟待解决的一项课题。
技术实现思路
本专利技术的目的是提供。根据本专利技术的一个 ...
【技术保护点】
一种计算机实现的用于确定查询序列的查询类别的方法,其中,该方法包括以下步骤:a获取待确定查询类别的查询序列;b对所述查询序列进行扩展,以获取与所述查询序列相对应的扩展向量;c将所述扩展向量与多个查询分类进行匹配,以获取所述扩展向量与所述查询分类的相关度;d根据所述相关度,确定所述查询序列的查询类别。
【技术特征摘要】
【专利技术属性】
技术研发人员:吴中勤,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。