【技术实现步骤摘要】
本专利技术涉及信息搜索和检索领域,尤其涉及一种搜索引擎的质量评估方法和装 置。
技术介绍
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序搜集互 联网上的信息,在对信息进行组织和处理后,将处理后的信息显示给用户,即,搜索引擎是 为用户提供检索服务的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引 擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。 搜索引擎的质量评估一直受到产业界和研究人员的广泛关注。目前,Cranfield评 价体系被广泛地应用于搜索引擎的质量评估,该评价体系是由查询样例集、正确答案集、评 测指标这三个部分构成的完整评测方案。使用Cranfield评价体系进行搜索引擎的质量评 估时,包含以下三个环节:首先,抽取代表性的查询词(query),将抽取出的查询词组成一个 规模适当的查询样例集;然后,针对该查询样例集,从搜索引擎的语料库中寻找与其相对应 的结果,即进行人工标注;最后,将抽取出的查询词和带有标注信息的语料库输入检索系 统,检索系统反馈结果,再针对搜索引擎反馈的结果,使用预先定义的评价计 ...
【技术保护点】
一种搜索引擎的质量评估方法,所述搜索引擎用于搜索多媒体资源,其特征在于,所述质量评估方法包括:从用户日志获取单一查询词的用户深度停留数据,其中,所述单一查询词的用户深度停留数据包括:查询词、被点击多媒体资源集合、多媒体资源播放完成比集合、以及所述被点击多媒体资源集合到所述多媒体资源播放完成比集合的映射函数;根据所述单一查询词的用户深度停留数据,获得全量查询词的用户深度停留数据,其中,所述全量查询词的用户深度停留数据包括:全量查询词、当前查询词下的被点击多媒体资源、当前查询词下的被点击多媒体资源的被点击次数、以及当前查询词下的被点击多媒体资源的综合播放完成比;以及根据所述全量 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:魏博,齐志兵,李力行,邹敏,唐广宇,顾思斌,潘柏宇,王冀,
申请(专利权)人:合一网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。