当前位置: 首页 > 专利查询>邻客音公司专利>正文

用于索引电子内容的装置和方法制造方法及图纸

技术编号:10134389 阅读:107 留言:0更新日期:2014-06-16 13:10
提供了将服务于操作移动和/或固定通信和移动装置的用户的电子内容进行索引的装置和方法。索引由多个分片组成,每个分片能够存储多个条目,并且每个条目代表一个内容项目。用代表内容项目的目标受众的属性/值的对的整数值来填充内容项目的索引条目。用代表用户的属性/值的对来类似地格式化针对标识用于服务特定用户的内容项目的查询或请求。然后,在任意或全部的分片内,可跨任意或全部的索引条目快速地执行查询。在分片内,可通过值或分数来对条目进行分类,并且可对单个条目内的整数分量进行分类,以促进与查询的快速比较。

【技术实现步骤摘要】
【专利摘要】提供了将服务于操作移动和/或固定通信和移动装置的用户的电子内容进行索引的装置和方法。索引由多个分片组成,每个分片能够存储多个条目,并且每个条目代表一个内容项目。用代表内容项目的目标受众的属性/值的对的整数值来填充内容项目的索引条目。用代表用户的属性/值的对来类似地格式化针对标识用于服务特定用户的内容项目的查询或请求。然后,在任意或全部的分片内,可跨任意或全部的索引条目快速地执行查询。在分片内,可通过值或分数来对条目进行分类,并且可对单个条目内的整数分量进行分类,以促进与查询的快速比较。【专利说明】
本专利技术涉及计算机系统和数据处理。具体地,提供了用于有效地索引大量数据的方法和装置。
技术介绍
提供电子内容的计算机系统和服务通常使用特定于被提供的内容的类型的索引来索引内容。因此,用于网络服务器的索引将被设计,并且被优化以定位和提供网页(例如,html文件),用于广告服务器的索引将被优化,以选择和提供广告(例如,图片),文件服务器可被优化以定位并提供文件等。针对一种类型的内容而设计的索引不能用于其它类型的内容。专门的索引通常不允许同时读和写。因此,每当必须维护索引时(例如,添加或去除条目),全部索引可被暂时地锁定或离线,并且在维护中不能被用于定位和提供内容。根据用于写入的锁定时间,搜索可被延迟不可接收的时段。另外,当索引中的条目包括必须被读、解析并且与一些目标参数相比较以确定那些索引条目相关的一些或全部语义内容(例如,以文本格式存在)时,扫描和搜索专门的索引可相对地慢。具体地,代表网页、广告、新闻故事或其他类型的项目的索引条目可包括项目的文本内容或关于该项目的元数据。当对索引执行查询时,文本内容或元数据必须与查询相比较,可涉及用于比较文本的相对慢的模式匹配算法的执行。更进一步,用于提供仅一种类型的内容的专门的索引可能不被优化以首先发现最优或最有价值的内容。相反,这样的索引可被组织,以使全部索引可能需要被搜索,以确保最有价值的内容被定位。
技术实现思路
在本专利技术的一些实施方式中,提供了用于通过电子系统(例如,在线服务)有效地索引将用于用户的内容的方法和装置。服务可包括社交网络服务、网络服务、门户和/或其它类型的服务,并且内容可为多种类型(例如,广告、简历、更新状态、招聘启事)。在这些实施方式中,索引由多个“分片(slice)”组成,每个被格式化成包括多个索引条目,每个条目对应于内容的项目。在其它分片持续被读取并用于标识或选择内容以被提供的同时,一个分片可经维护(例如,添加新条目、改变或去除条目)。用于特定内容项目的条目包括列表、数组或代表内容项目的属性或特性的整数值的其它集。每个唯一的整数针对属性(例如,年龄、性别、位置)和对应值(例如,21?25,女性,北加利福尼亚)而映射到唯一的名称/值对。相似地,针对内容的查询或请求的目标属性或特性被格式化为整数。因此,当应用查询于索引时,它的整数值可与索引条目的整数值迅速比较。然后,对应于匹配索引条目的内容项目可被排序,以减小结果的数目(如果必要的话),并且获得提供的内容项目。在本专利技术的一些实施方式中,在每个条目内,排列代表对应于内容项目的属性的整数,以便应用查询时,代表最有区别的属性(匹配的可能性最小的属性)的整数首先被扫描。因此,如果给定条目的内容项目与查询的项目不相匹配,则将迅速地检测到不匹配,并且查询可跳到下一个条目。此外,在分片内,索引条目可根据它们对应于内容项目的值被排序。在一些实施方式中,内容项目的值反映当提供内容项目时被系统获得的收益(或预计获得)、内容项目的观察到的或估计的性能(例如,用户作用于内容项目的频率)和/或对有效性的其它测量。【专利附图】【附图说明】图1为描绘根据本专利技术的一些实施方式的用于索引电子内容的装置的框图。图2为描绘根据本专利技术的一些实施方式的用于索引电子内容的装置的框图。图3为说明根据本专利技术的一些实施方式维护电子内容的索引的方法的流程图。图4为说明根据本专利技术的一些实施方式使用电子内容的索引的方法的流程图。图5为根据本专利技术的一些实施方式用于索引电子内容的系统。【具体实施方式】呈现下面的说明以使本领域技术人员能够做出和使用本专利技术。对公开的实施方式的各种修改对被本领域技术人员来说是很显然的,并且文中定义的一般原理可应用于其它实施方式和应用,而不背离本专利技术的范围。因此,本专利技术不旨在限于显示的实施方式。在本专利技术的一些实施方式中,提供了用于索引电子内容的方法和装置。内容可为用于通过浏览器、应用程序或其它用户界面呈现的任何类型的格式化的电子数据。索引的内容可包括单独呈现的完整构成,例如网页、文档或视频,或可为可作为网页或其它成分呈现的组分,例如广告、招聘启事、通知、更新状态、新闻、文档、体育信息、图像、视频等。简言之,本专利技术的实施方式中索引的电子内容项目可包括可在通信装置或计算机装置上呈现给用户的任何类型的内容。因为文中提供的索引可包括多种类型的内容,每种类型不必需单独地索引。本专利技术的实施方式实现可为事实上提供数据的任何在线服务的一部分,无论是社交网络服务、网页服务器、门户网站、收缩引擎等。内容可在一个或多个计算机系统的集合上索引,并且可呈现给操作便携式和/或固定设备的用户。兎直在提供用于呈现给用户的电子内容的系统中,关于内容项目提供给的目标用户的一些信息经常作为查询或内容请求的一部分提供。例如,当社交网络服务的用户连接至服务网站并导航到网页时,网络浏览器或其它显示引擎可生成对网站操作的数据服务的查询,以标识和/或获得呈现给用户的内容。内容查询可包括或伴随一个或多个用户的属性或特性(例如,性别、年龄、位置、就业状况)。相似地,已经被存储并将提供给电子服务和应用的用户的内容项目可具有标识内容项目的目标受众的相关联属性。例如,设计用于促进特定商品的销售的广告、或关于新的职位空缺的招聘启示,用与标识项目应被呈现给的用户类型的信息(例如性别、年龄、位置、就业状态)来接收。响应于对将提供特定用户的内容的查询或请求,通过比较用户已知的属性与存储的内容项目的目标受众的记录的属性,数据服务器搜索合适的内容。标识一些数目的合适内容项目,并且为呈现给用户而传送。用于促进电子内容的提供的索引在本专利技术的一些实施方式中,用于表征内容项目和/或为表征内容项目的目标受众的属性作为整数(或整数标记)而非文本存储在索引中。例如,可用于选择针对提供给目标用户的内容项目的一个属性为年龄,并且内容项目的提供者可指定内容项目目标的人的年龄(或年龄范围)。当索引内容项目时,在索引中的内容条目中,存储特定的整数以表明年龄(或年龄范围)。因此,如果内容项目为针对年龄在21和25之间的人的广告,则年龄属性可存储为第一整数,例如“2045”。对于针对年龄在46和50之间的人的另一个内容项目,年龄属性可存储为第二整数,例如“8749”。另一个整数,例如“8”可代表具有“求职者”的值的“目的”属性,并且可在对应于提供者希望提供给找工作的人的内容项目的条目存储器储。这些实施方式中,索引中的内容项目的条目包括任何数目的代表具体的属性和针对这些属性的值的名字/值的对的整数。在一些实施中,每个独特的属性/值的对映射到独特的整数,并且反之亦然,这意味着在索引条目中给定的整数仅相本文档来自技高网
...

【技术保护点】
一种操作内容索引的方法,所述方法包括:对计算机系统存储器中的多个电子内容的集合进行索引,其中,通过在所述索引中存储对应的条目来索引每个电子内容的集合,所述条目包括:与所述电子内容的集合相关的元数据;以及一个或多个整数标记,每个整数标记代表所述电子内容的集合的目标受众的属性和所述属性的对应值;接收针对将用于目标用户的内容的请求,所述目标用户具有属性的集合和对应值;搜索所述索引中包括整数标记的条目,所述整数标记代表所述属性的集合的子集和所述目标受众的对应值;以及响应于针对内容的所述请求,传送一个或多个电子内容的集合的身份,所述一个或多个电子内容的集合具有与所述属性的集合的子集和所述目标用户的对应值相匹配的属性和对应值。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:S·S·迪贝N·N·梅塔V·D·兰杰内卡
申请(专利权)人:邻客音公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1