用于提供关于包括在内容页面中的语义实体的信息的系统和方法技术方案

技术编号:10390823 阅读:219 留言:0更新日期:2014-09-05 16:19
一种用于提供关于在内容页面上包括的语义实体的上下文信息的方法,包括以下步骤:将包括一个或多个语义实体的内容页面显示给用户;识别所包括的一个或多个语义实体;以及接收来自所述用户的输入,所述输入指示期望接收关于所识别的语义实体中的特定的一个语义实体的上下文信息。

【技术实现步骤摘要】
【国外来华专利技术】相关申请本申请要求2011年9月9日提交的名称为“SYSTEMS AND METHODS FOR PROVIDINGINFORMATION REGARDING SEMANTIC ENTITIES INCLUDED IN A PAGE OF CONTENT”的美国专利申请N0.13/229,245的权益和优先权,且要求2011年9月9日提交的名称为“SYSTEMSAND METHODS FOR RICH QUERY CONSTRUCTION” 的美国专利申请 N0.13/229,302 的权益和优先权,且要求2011年9月9日提交的名称为“SYSTEMS AND METHODS FOR CONTEXTUALSEARCHING OF SEMANTIC ENTITIES”的美国专利申请N0.13/229,311的权益和优先权,这三个美国专利申请都要求2011年7月28日提交的名称为“SYSTEMS AND METHODS FORCONTEXTUAL PERSONALIZED SEARCHING”的美国临时专利申请N0.61/512,826的权益和优先权,该美国临时专利申请的全部内容通过引用并入。
本专利技术的实施方式总体涉及搜索互联网和其它内容源(包括但不限于广告流)和计算机化的搜索的领域。尤其是,本文中所描述的系统和方法允许传统的网络内容基于消费者的特征以完全不同的方式进行消费。
技术实现思路
在一方面中,本专利技术涉及用于提供关于包括在内容页面中的语义实体的上下文信息的方法。包括一个或多个语义实体的内容页面显示给用户。识别包括在页面中的一个或多个语义实体。从用户接收输入,该输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。在另一方面中,本专利技术涉及提供关于包括在内容页面中的语义实体的上下文信息的系统。该系统包括用于向用户显示包括一个或多个语义实体的内容页面的装置、用于识别包括在页面中的一个或多个语义实体的装置、和用于接收来自用户的输入的装置,该输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。【附图说明】通过参照结合附图进行的下列描述,本专利技术的上述的和其它的目的、方面、特征和优点将变得更清楚且更好理解,在附图中:图1A是根据本专利技术的实施方式的系统的示意图;图1B是根据本专利技术的实施方式的图1的设备的分解图;图2是根据本专利技术的实施方式的传输信息的系统的示意图;图3A是示出根据本专利技术的实施方式的在上下文模式已被激活之前的网页的屏幕截图的示例性视图;图3B和图3C是示出根据本专利技术的一些实施方式的在上下文模式已被激活且各种搜索术语突出显示之后的网页的屏幕截图的示例性视图;图3D是示出根据本专利技术的实施方式的在已执行上下文搜索之后的叠加窗口和网页的屏幕截图的示例性视图;图4是根据本专利技术的实施方式的方法的流程图;图5A至图是根据本专利技术的实施方式的方法的更详细的流程图;图6是根据本专利技术的实施方式的包括关于样本用户配置文件的信息的数据结构的文本表示;图7A是示出用户已突出显示搜索实体的网页的屏幕截图的示例性视图;图7B是根据本专利技术的实施方式的基于图7A的搜索实体和网页的样本丰富查询的字符串;以及图7C是根据本专利技术的实施方式的包括通过已被提供以图7B的丰富查询字符串的服务器所返回的样本文本搜索结果的数据结构的文本表示。【具体实施方式】本专利技术的各种实施方式提供用于进行上下文搜索的方法或系统。用户观看网页、文档或其它内容。根据一些实施方式,上下文搜索服务接受来自用户的关于一个或多个搜索术语、词语、图像或其它指示感兴趣的话题的信息(下文称为“搜索实体”)的输入。根据一些实施方式,文档中的所有内容都是可搜索的。根据各种实施方式,服务选择与搜索实体相关的额外的输入,以确定搜索实体的上下文,从而进行搜索,该搜索相比于不涉及所述上下文的搜索,而更有可能相关。根据各种其它实施方式,服务使用搜索实体和可与该搜索实体相关的上下文,以进行搜索并获得搜索结果。根据各种实施方式,这些结果呈现给用户。图1A示出根据一些实施方式的网络化环境101,其中,提供上下文搜索服务。如图1A所示,网络化环境101包括一个或多个客户端机器102A-102N(在本文中通常称为“客户端机器102”或“客户端102”),该客户端机器102A-102N通过网络104与一个或多个服务器106A-106N (在本文中通常称为“服务器机器106”或“服务器106”)通信。在一些实施方式中,客户端机器102可以称为单个客户端机器102或一组客户端机器102,而服务器106可以称为单个服务器106或一组服务器106。尽管在图1A中示出三个客户端机器102和三个服务器机器106,但是任何数量的客户端102可以与任何数量的服务器106进行通信。在一些实施方式中,单个客户端机器102与多于一个服务器106进行通信,而在另一实施方式中,单个服务器106与多于一个客户端机器102进行通信。在另一实施方式中,单个客户端机器102与单个服务器106进行通信。此外,尽管示出将客户端机器102连接至服务器机器106的单个网络104,但应当理解,根据一些实施方式,多个独立的网络将客户端机器102的子集连接至服务器机器106的子集。在一些实施方式中,计算环境101包括安装在服务器106和客户端机器102之间的装置(在图1A中未示出)。该装置可以管理客户端/服务器连接,且在一些情况下可以将客户端机器102进行的平衡连接加载至服务器机器106。由下列公司(但不限于这些公司)中的任何一个公司制造合适的装置:Citrix Systems公司的应用网络组;加利福尼亚州圣克拉拉的Silver Peak Systems公司;加利福尼亚州旧金山的Riverbed Technology公司;华盛顿州西雅图的F5Networks公司;或加利福尼亚州森尼韦尔的Juniper Networks公司。客户端102和服务器106可以被设置为计算设备100,在图1B中示出该计算设备100的【具体实施方式】。系统总线150包括在计算设备100内,该系统总线150与下列部件进行通信:中央处理单元121 (“处理器”);提供非暂时性存储的主存储器122 ;提供非暂时性存储的存储器128 ;输入/输出(I/O)控制器123 ;显示设备124A-124N ;安装设备116 ;和网络接口 118。在一些实施方式中,存储器128包括:操作系统、软件程序和客户端代理120。在一些实施方式中,I/O控制器123进一步连接至一个或多个输入设备。易失性计算机存储器、非易失性计算机存储器、以及易失性计算机存储器和非易失性计算机存储器的组合包括在非暂时性存储器的范围内。如图1B所示,I/O控制器123连接至摄像机125、键盘126、指向设备127 (诸如(但不限于)鼠标)和麦克风129。计算机器100的各种实施方式包括被下列部件配置中的任何一个所表征的中央处理单元121:对从主存储器单元122获取的指令作出响应并对其进行处理的逻辑电路;微处理器单元,诸如(但不限于):由Intel公司制造的微处理器单元、由Motorola公司制造的微处理器单元、由加利福尼亚州圣克拉拉的Transmeta公司制造的微处理本文档来自技高网...

【技术保护点】
一种用于提供关于包括在内容页面中的语义实体的上下文信息的方法,所述方法包括:将包括一个或多个语义实体的内容页面显示给用户;通过处理器识别所包括的一个或多个语义实体;以及接收来自所述用户的输入,所述输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。

【技术特征摘要】
【国外来华专利技术】2011.07.28 US 61/512,826;2011.09.09 US 13/229,302;1.一种用于提供关于包括在内容页面中的语义实体的上下文信息的方法,所述方法包括: 将包括一个或多个语义实体的内容页面显示给用户; 通过处理器识别所包括的一个或多个语义实体;以及 接收来自所述用户的输入,所述输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。2.根据权利要求1所述的方法,还包括突出显示所识别的语义实体。3.根据权利要求1所述的方法,其中,所接收的用户输入以触摸屏输入的形式接收。4.根据权利要求1所述的方法,还包括暂停所显示的页面的用户界面行为。5.根据权利要求4所述的方法,还包括响应于包括拖曳移动的用户输入,暂停所显示的页面的所述用户界面行为。6.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定局部上下文,以确定所述实体的边界。7.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定搜索字组合的频率超过预定的阈值。8.根据权利要求1所述的方法,其中,识别所述所包括的一个或多个语义实体包括确定搜索第一字和第二字的频率超出搜索第二字和第三字的频率。9.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定页面中的字的评估总额。10.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定页面中的HTML标签的存在。11.一种用于提供关于包括在内容页面中的语义实体的上下文信息的系统,所述方法包括: 用于将包括一个或多个语义实体的内容页面显示给用户的装置; 用于识别所包括的一个或多个语义实体的装置;以及 所述用户的输入的接收装置,所述输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。12.根据权利要求11所述的系统,还包括用于突出显示所识别的语义实体的装置。13.根据权利要求11所述的系统,其中,所述接收装置接收以触摸屏输入的形式的输入。14.根据权利要求11所述的系统,还包括用于暂停所显示的页面的用户界面行为的装置。15.根据权利要求11所述的系统,其中,暂停装置响应于包括拖曳移动的用户输入,来暂停所显示的页面的所述用户界面行为。16.根据权利要求11所述的系统,其中,识别装置通过确定局部上下文以确定所述实体的边界来识别所述所包括的一个或多个语义实体。17.根据权利要求11所述的系统,其中,识别装置通过确定搜索字组合的频率超出预定的阈值,来识别所包括的一个或多个语义实体。18.根据权利要求11所述的系统,其中,所述识别装置通过确定搜索第一字和第二字的频率超出搜索第二字和第三字的频率,来识别所包括的一个或多个语义实体。19.根据权利要求11所述的系统,其中,所述识别装置通过确定页面中的字的评估总额,来识别所包括的一个或多个语义实体。20.根据权利要求11所述的系统,其中,所述识别装置通过确定页面中的HTML标签的存在来识别所包括的一个或多个语义实体。21.一种用于从包括在页面中的所选择的语义实体构建丰富查询的方法,所述方法包括: a.接收识别语义实体的用户输入,对于所述语义实体,期望有上下文信息; b.识别与所述所选择的语义实体相关联的上下文信息; c.利用所述语义实体和所识别的上下文信息,编码统一资源定位符URL;以及 d.将所编码的URL发送给搜索服务器。22.根据权利要求21所述的方法,其中,用户输入通过触摸屏界面接收。23.根据权利要求21所述的方法,其中,利用包括所述语义实体的页面的 特征,识别上下文信息。24.根据权利要求23所述的方法,其中,利用下列中的一个来识别上下文信息:网页的标题、识别网页的URL、包括在网页中的META标签、以及识别包括所述语义实体的所述网页的字频率的信息。25.根据权利要求21所述的方法,其中,利用关于所述用户的浏览历史的信息,来识别上下文信息。26.根据权利要求25所述的方法,其中,所述关于所述用户的浏览历史的信息包括下列中的一个:所述用户的浏览历史、所述用户的喜爱的网站、所述用户保存的书签、所述用户请求的先前搜索以及频繁访问的网站。27.根据权利要求21所述的方法,其中,利用所述用户建立的配置文件,识别上下文信息。28.根据权利要求21所述的方法,其中,利用布隆过滤器识别上下文信息。29.根据权利要求21所述的方法,还包括利用所述语义实体和第一上下文信息编码第一 URL以及利用所述语义实体和第二上下文信息编码第二 URL。30.根据权利要求21所述的方法,其中,利用HTTPPOST命令发送编码的URL。31.一种用于从包括在页面中的所选择的语义实体构建丰富查询的系统,所述方法包括: 用于接收识别语义实体的用户输入的装置,对于所述语义实体,期望有上下文信息; 用于识别与所选择的语义实体相关联的上下文信息的装置; 用于利用所述语义实体和所识别的上下文信息来编码统一资源...

【专利技术属性】
技术研发人员:卡洛斯·博拉卢多维克·卡布里杰拉尔德·克罗普缇茨布莱恩·罗杰斯
申请(专利权)人:纪金有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1