用于搜索内容的方法和装置以及数据处理系统制造方法及图纸

技术编号:16837441 阅读:42 留言:0更新日期:2017-12-19 19:56
根据一个实施方案,基于与内容项目相关联的内容关键字(CK)来确定内容关键字元素(CKE)。基于与搜索查询相关联的查询关键字(QK)来确定查询关键字元素(QKE)。识别第一搜索查询,该第一搜索查询具有由第一QKE表示的一个或多个查询关键字。识别第一内容关键字,该第一内容关键字由匹配第一QKE的第一CKE来表示。在查询‑CK(查询/CK)白名单表中创建新条目以将第一搜索查询映射到第一内容关键字。所述查询/CK白名单表包括多个条目,每个条目将搜索查询映射到一个或多个内容关键字。所述查询/CK白名单表被利用来响应于后续搜索查询来识别内容项目。

Methods and devices used to search for content and data processing systems

Based on an implementation, the content key element (CKE) is determined based on the content keyword (CK) associated with the content item. The query key element (QK) is based on the search query associated with the search query to determine the query keyword element (QKE). The first search query is identified with one or more query keywords represented by the first QKE. Identify the first content keyword, which is represented by the first CKE matching the first QKE. In the query CK (/CK query) white list to create a new entry to the first search query is mapped to the first content keyword. The querying /CK white list table includes multiple entries, each item mapping the search query to one or more content keywords. The query /CK white list table is used to respond to subsequent search queries to identify content items.

【技术实现步骤摘要】
用于搜索内容的方法和装置以及数据处理系统
本专利技术的实施方案总体涉及对内容进行搜索。更具体地,本专利技术的实施方案涉及响应于搜索查询使用匹配的关键字白名单来对内容进行搜索。
技术介绍
大多数搜索引擎通常在其操作期间从运行于客户端装置上的浏览器对网页进行搜索。搜索引擎接收由用户输入的搜索词,并检索与所述搜索词相关联的网页搜索结果列表。搜索引擎基于某些标准将搜索结果显示为搜索列表的一系列子集。在搜索操作期间使用的一般标准是搜索词是完整地还是部分地出现在给定网页上、搜索字串出现在搜索结果中的次数、字母次序等。此外,用户可以通过点击鼠标按钮来决定打开链接以打开并浏览。可由搜索引擎来监控和收集用户与搜索结果的一些互动和/或用户信息,以随后提供更好的搜索。通常,响应于搜索查询,执行搜索以识别和检索内容项目列表。接着将内容项目传回到搜索请求器。常规搜索引擎将照原样传回大多数内容项目而不作修改。搜索结果中的一些内容项目仅仅是纯文本或描述,这是无吸引力的或令人厌烦的。有时候,如果内容项目准备有与所述内容项目有关的某些图像,那么搜索结果中的内容将更得体或更具吸引力。然而,使适当图像与内容项目匹配是相当本文档来自技高网...
用于搜索内容的方法和装置以及数据处理系统

【技术保护点】
一种用于搜索内容的计算机实施方法,所述方法包括:基于与多个内容项目相关联的多个内容关键字(CK)来确定多个内容关键字元素(CKE);基于与多个搜索查询相关联的多个查询关键字(QK)来确定多个查询关键字元素(QKE);识别第一搜索查询,所述第一搜索查询具有由第一QKE表示的一个或多个查询关键字;识别第一内容关键字,所述第一内容关键字由匹配所述第一QKE的第一CKE来表示;以及在查询‑CK(查询/CK)白名单表中创建新条目以将所述第一搜索查询映射到所述第一内容关键字,所述查询/CK白名单表包括多个条目,每个条目将搜索查询映射到一个或多个内容关键字,其中所述查询/CK白名单表用于响应于后续搜索查询来...

【技术特征摘要】
2016.06.13 US 15/181,3141.一种用于搜索内容的计算机实施方法,所述方法包括:基于与多个内容项目相关联的多个内容关键字(CK)来确定多个内容关键字元素(CKE);基于与多个搜索查询相关联的多个查询关键字(QK)来确定多个查询关键字元素(QKE);识别第一搜索查询,所述第一搜索查询具有由第一QKE表示的一个或多个查询关键字;识别第一内容关键字,所述第一内容关键字由匹配所述第一QKE的第一CKE来表示;以及在查询-CK(查询/CK)白名单表中创建新条目以将所述第一搜索查询映射到所述第一内容关键字,所述查询/CK白名单表包括多个条目,每个条目将搜索查询映射到一个或多个内容关键字,其中所述查询/CK白名单表用于响应于后续搜索查询来识别内容项目。2.根据权利要求1所述的方法,其中基于多个内容关键字(CK)来确定多个内容关键字元素(CKE)包括:将所述内容关键字分割成多个内容子关键字的列表,每个内容子关键字表示内容关键字元素;对所述内容子关键字执行词频-逆文档频率(TF-IDF)分析以移除频繁出现的一个或多个内容子关键字。3.根据权利要求2所述的方法,还包括:对所述内容子关键字执行潜在语义分析以识别一个或多个类似内容子关键字的集合;以及将所述一个或多个类似内容子关键字添加到待分析的所述内容子关键字的列表中。4.根据权利要求3所述的方法,还包括:针对每一个内容子关键字,创建CKE索引表,其中所述CKE索引表包括多个条目,每个条目将内容关键字元素映射到一个或多个内容关键字,其中所述CKE索引表用于基于内容关键字元素来识别内容关键字。5.根据权利要求1所述的方法,其中基于多个查询关键字(QK)来确定多个查询关键字元素(QKE)包括:将所述查询关键字分割成多个查询子关键字的列表,每个查询子关键字表示查询关键字元素;对所述查询子关键字执行词频-逆文档频率(TF-IDF)分析以移除频繁出现的一个或多个查询子关键字。6.根据权利要求5所述的方法,还包括:对所述查询子关键字执行潜在语义分析以识别一个或多个类似查询子关键字的集合;以及将所述一个或多个类似查询子关键字添加到待分析的所述查询子关键字的列表中。7.根据权利要求6所述的方法,还包括:针对每一个查询子关键字,创建QKE索引表,其中所述QKE索引表包括多个条目,每个条目将查询关键字元素映射到一个或多个查询关键字,其中所述QKE索引表用于基于查询关键字元素来识别查询关键字。8.根据权利要求1所述的方法,其中所述多个搜索查询是在过去的一段时间内从多个客户端接收的用于对内容项目进行搜索的一组已知搜索查询。9.根据权利要求1所述的方法,还包括:响应于接收到从客户端接收的第二搜索查询,在查询/CK白名单表中执行查找操作以定位与所述第二搜索查询匹配的第二条目;基于从所述第二条目获得的一个或多个内容关键字,识别一个或多个内容项目;以及将所识别的内容项目传输到所述客户端。10.一种对内容进行搜索装置,包括:基于与多个内容项目相关联的多个内容关键字(CK)来确定多个内容关键字元素(CKE)的装置...

【专利技术属性】
技术研发人员:朱帆孔旗杨光王京傲
申请(专利权)人:百度美国有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1