当前位置: 首页 > 专利查询>微软公司专利>正文

自动地生成训练数据制造技术

技术编号:6977761 阅读:271 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示了自动生成训练数据的技术。计算机可读介质、计算机系统,以及计算设备促进生成二进制分类器和实体提取器训练数据。选择种子URL,并标识种子URL内的URL模式。标识数据结构中的匹配URL,并将对应的查询以及它们的相关联的权重添加到从其中选择训练数据的潜在的训练数据集中。

【技术实现步骤摘要】

本专利技术涉及搜索技术,尤其涉及自动生成训练数据。
技术介绍
Web搜索已经变得用于查找信息的普通技术。流行的搜索引擎允许用户根据由用户在由搜索引擎所提供的用户界面(例如,在客户端设备上显示的搜索引擎网页)中输入的搜索项来执行广泛的基于web的搜索。广泛的搜索可以返回可包括来自各种域(其中, 域是指特定类别的信息)的结果。在某些情况下,用户可能希望搜索特定域所特定的信息。例如,用户可以试图执行音乐搜索或执行产品搜索。这样的搜索(被称为“域特定搜索”)是其中当执行搜索时(例如,搜索特定歌曲或记录歌星,搜索特定产品等等)用户在心中具有对于来自特定域的信息的特定查询意图。可以通过垂直搜索服务来提供域特定搜索,垂直搜索服务可以是由通用搜索引擎所提供的,或者可替换地,由垂直搜索引擎所提供的服务。垂直搜索服务提供来自特定域的搜索结果,并通常不从不与特定域相关的域返回搜索结果。一种特殊类型的垂直搜索服务的一个示例此处被称为即时应答服务。即时应答是指作为对在主要搜索结果网页上向用户提供的搜索查询的应答或响应的搜索结果。即,响应于查询,在搜索结果页面向用户呈现域特定内容,而用户可能需要以另外的方式本文档来自技高网...

【技术保护点】
1.在其上包含计算机可执行指令的一个或多个计算机可读介质,所述计算机可执行指令在由与搜索服务相关联的计算设备中的处理器执行时,使所述计算设备执行相对于内容域标识点击数据中的查询和统一资源定位符URL之间的正关联的方法;所述方法包括:接收将查询与由所述查询所标识的URL相关联的数据结构;标识与所述内容域相关联的第一URL模式;确定所述点击图中的第一URL的至少一部分与所述第一URL模式相匹配;标识与所述第一URL相关联的第一查询;以及确定所述第一查询和所述第一URL相对于所述内容域具有正关联。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:G·比勒P·沃拉A·麦克戈文S·阿哈里M·纳拉辛汉
申请(专利权)人:微软公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1