当前位置: 首页 > 专利查询>谷歌公司专利>正文

将实体与类别相关联制造技术

技术编号:7157677 阅读:229 留言:0更新日期:2012-04-11 18:40
除其它所公开的主题外,一种用于将实体与类别相关联的计算机实现的方法包括为多个类别中的至少子集中的每一个确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于实体的信息来确定。该方法包括使用概率值和基于训练数据的用于多个类别的规则集来为实体识别多个类别中的一个。

【技术实现步骤摘要】
【国外来华专利技术】
本文档涉及信息处理。
技术介绍
广告主可以在多个不同平台中的任何平台上运行广告活动,所述多个不同平台包括因特网、电视、无线电广播以及广告牌。在广告活动中所使用的广告可以覆盖产品和服务的范围,并且可以定向特定受众或更一般地定向更大人群。例如,运行网站的发布者可以向广告主提供空间用于呈现广告。呈现在网站上的广告有时基于网站的内容来选择。
技术实现思路
本专利技术涉及将实体与类别相关联。在第一方面中,一种用于将实体与类别相关联的计算机实现的方法包括为多个类别中的至少子集中的每一个确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于实体的信息来确定。该方法包括为实体记录多个类别中的一个类别,类别使用概率值和用于多个类别的规则集来识别。实施方式可以包括以下特征中的任何、全部特征或不包括以下特征。实体可以是被识别为加入在程序中的内容提供者,在所述程序中内容提供者提供待由至少一个发布者发布的内容,以及概率值可以使用与内容提供者相关联的至少一个关键词以及与内容提供者相关联的至少一个财务值来确定。确定概率值可以包括将至少一个关键词至少映射到多个类别的子集;用至少一个财务值对至少子集赋予权重,其中财务值已被分配给对应关键词;以及选择预定数量的类别作为子集。规则集可以基于训练数据。规则集可以包括决策树,其被配置用于通过处理包括在决策树中的多个决策中的至少部分来选择多个类别中的一个。该方法可以进一步包括使用训练数据来生成决策树,其中训练数据包括实体到多个类别中的一个或多个的映射。生成决策树可以进一步包括使用有关实体的财务数据对映射赋予权重。对映射赋予权重可以进一步包括基于与映射的至少子集相对应的财务数据来过采样(oversample)映射的所述子集。生成决策树可以包括选择用于决策树的结构;确定决策树的延伸区(extent),包括在选择多个类别中的一个之前待进行的多个决策中的决策数量;以及确定待在多个决策中使用的阈值。可以迭代生成决策树。内容提供者可以从事于广告,以及多个类别可以包括内容提供者待与之匹配的垂直元(vertical)。生成决策树可以进一步包括识别垂直元中的至少一个,对于其概率值的确定具有将垂直元不恰当地分配给内容提供者的倾向;以及选择阈值中的至少一个,使得降低所述倾向。该方法可以进一步包括基于已为实体识别的类别向用户呈现信息。信息可以指示与类别相关联的季节性。在第二方面中,一种计算机系统包括第一分类器,其为多个类别中的至少子集中的每一个类别确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于实体的信息来确定。该系统包括第二分类器,其使用概率值和用于多个类别的规则集来为实体识别多个类别中的一个类别。实施方式可以包括以下特征中的任何、全部特征或不包括以下特征。规则集可以基于训练数据。第一分类器在确定概率值时可以考虑与实体有关的财务值。规则集可以包括决策树,其被配置用于通过处理包括在决策树中的多个决策中的至少部分来选择多个类别中的一个,以及该计算机系统可以进一步包括使用训练数据来生成决策树的规则组件, 其中训练数据包括实体到多个类别中的一个或多个的映射。规则组件可以使用有关实体的财务数据对映射赋予权重,包括基于与映射的至少子集相对应的财务数据来过采样映射的所述子集。该系统可以进一步包括前端组件,其基于第二分类器已为实体识别了类别向用户呈现信息。在第三方面中,一种用于将内容提供者与类别相关联的计算机实现的方法包括将内容提供者识别为加入在程序中,在所述程序中内容提供者提供待由至少一个发布者发布的内容。该方法进一步包括接收有关内容提供者的至少一个关键词和有关关键词的至少一个财务值。该方法进一步包括接收多个类别,其中内容提供者待与类别中的至少一个相关联。该方法进一步包括基于类别的名称将至少一个关键词映射到类别的子集。该方法进一步包括将类别的至少子集中的每一个与概率值相关联,所述概率值表示内容提供者应当与相应类别相关联的可能性,所述概率值使用财务值被赋予权重。该方法进一步包括接收所生成的有关多个类别的规则集,所述规则集被配置用于在识别类别中的一个时使用。该方法进一步包括使用规则集来处理有关内容提供者的数据,所述数据至少包括(i)类别的至少子集中的每一个的概率值;(ii)有关内容提供者的财务数据;(iii)内容提供者与之相关联的地理区域。该方法进一步包括基于对数据的处理为内容提供者选择多个类别中的一个。该方法进一步包括将内容提供者与所选择的类别相关联。实施方式可以提供以下优势中的任何、全部优势或不提供以下优势。可以提供分成类别的改进的分类。基于概率的分类可以被赋予收益权重,以及可以由先前使用训练数据来训练的基于规则的分类进行进一步特定化。可以增加分类的灵活性。在附图和下面的描述中阐述了一个或多个实施例的细节。其它特征和优势从描述和附图、以及从权利要求将是显而易见的。附图说明图1示出了可以为实体识别类别的示例系统。图2示出了可以为实体识别类别的另一个示例系统。图3示出了可以基于已为实体识别的类别来呈现信息的示例用户界面。图4示出了可以执行来为实体识别类别的示例方法。图5是可以结合在本文档中描述的计算机实现的方法使用的计算系统的框图。各附图中相同的参考标记指示相同的元素。具体实施例方式图1示出了可以为实体识别类别的示例系统100。多个实体可以在系统100中操作,例如实体可以是以下形式的诸如广告主的内容提供者和诸如网页或其它内容的所有者的内容发布者。在一些实施方式中,内容提供者可以操作一个或多个内容提供者系统 102,以及内容发布者可以操作一个或多个内容发布者系统104。可以将任何种类的计算机设备、电子设备或系统包括在系统102和104中,诸如服务器计算机或个人计算机。系统 100中的组件可以使用诸如本地计算机网络或因特网的任何种类的网络106来相互通信。在一些实施方式中,系统100中的一个或多个实体可以参与事务,在所述事务中内容提供者提供待由至少一个发布者发布的内容。例如,诸如广告的内容可以通过网络106 从内容提供者系统102分发用于以内容发布者系统104中的一个或多个的名义发布。在一些实施方式中,内容可以由诸如内容分发者系统108(例如,广告服务器)的第三方暂时或永久保持,并且可以从系统108分发用于发布。例如,当用户系统110向发布者系统104请求媒体内容(例如,网页)时,内容分发者系统108可以将相关联的内容(例如,广告)提供给用户系统110用于连同所请求的内容一起呈现。在下面将描述其中诸如系统100中的内容提供者和/或内容发布者的一个或多个实体可以使用类别目录来进行分类的示例。这样的分类对涉及分类实体的任何人,例如管理在实体间分发内容的个人,可以是有用的。系统100可以包括一个或多个分类器。在一些实施方式中,系统100包括概率分类器112和基于规则的分类器114。这些和其它组件的名称在此被宽泛使用,而不是狭窄使用;例如,概率分类器112在其操作中可以使用一个或多个规则,以及基于规则的分类器 114在分类过程中可以确定或使用一个或多个概率。分类器112和114可以以任何形式,诸如使用软件、硬件、固件或以上组合,来实现。在一些实施方式中,可以使用分类器112和114,以使诸如操作系统10本文档来自技高网...

【技术保护点】
1.一种用于将实体与类别相关联的计算机实现的方法,所述方法包括:为多个类别中的至少子集中的每一个确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于所述实体的信息来确定;以及为所述实体记录所述多个类别中的一个类别,所述类别使用所述概率值和用于所述多个类别的规则集来识别。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:裴忠顺
申请(专利权)人:谷歌公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1