当前位置: 首页 > 专利查询>谷歌公司专利>正文

在没有人工干预的情况下算法上识别对儿童适合的内容制造技术

技术编号:16401364 阅读:72 留言:0更新日期:2017-10-17 21:35
实施方式公开了在没有人工干预的情况下算法上识别对儿童适合的内容。一种方法包括由处理设备识别对应于与儿童相关的话题的实体;由该处理设备,针对所识别的实体中的每个来确定儿童的亲和度分值;以及由所述处理设备,基于针对与内容相对应的所识别的实体的儿童的亲和度分值来选择内容。

In the absence of human intervention, the algorithm identifies the appropriate content for children

The implementation exposes the algorithm to identify appropriate content for children without human intervention. A method includes processing equipment identification corresponding to the child related topics entity; by the processing equipment, for each of the identified entity to determine the affinity scores of children; and processing equipment by the affinity scores for corresponding contents of the identified entity based on children choose the content.

【技术实现步骤摘要】
【国外来华专利技术】在没有人工干预的情况下算法上识别对儿童适合的内容
本公开涉及一种内容共享平台的领域,并且具体地涉及一种在没有人工干预的情况下算法上识别对儿童适合的内容。
技术介绍
在互联网上,社交网络允许用户互相连接并互相共享信息。许多社交网络包括内容共享的方面,其允许用户上传、观看、和共享诸如视频内容、图像内容、音频内容、文本内容等(其可以被统称为“媒体项”或“内容项”)的内容。这样的可观看并且可共享的媒体项可以包括音频片段、电影片段、电视片段、和音乐视频,以及诸如视频博客、原始短视频、图片、照片、其它多媒体内容等的业余内容。用户可以使用计算设备(诸如智能电话、蜂窝电话、膝上型计算机、台式计算机、上网本、平板计算机、联网电视),以使用、播放、和/或消费媒体项(例如,观看数字视频和/或收听数字音乐)。
技术实现思路
以下是本公开的简化
技术实现思路
,以便提供对本公开的一些方面的基本理解。这个
技术实现思路
不是本公开的扩展性概述。其无意表示本公开的关键或必要的要素,也无意本对本公开的具体实施方式的任何范围或权利要求的任何范围加以界定。本专利技术的唯一目的在于以简化方式呈现本公开的一些概念,从而作为稍后所呈现的更详细的描述的前叙。在本公开的一个方面中,一种方法包括由处理设备识别对应于与儿童相关的话题的实体;由该处理设备,针对所识别的实体中的每个来确定儿童的亲和度分值;以及由该处理设备,基于针对与该内容相对应的所识别的实体的儿童的亲和度分值来选择内容。在一个实施方式中,该实体可以包括人、地方、或事物中的至少一个。在另一个实施方式中,方法中的识别该实体进一步包括从知识图中选择实体,该知识图包括具有关于实体的库集的结构化信息和这些实体的库集之间的关系连接的知识库,其中该实体的库集包括该实体。此外,方法中的识别该实体可以进一步包括访问与针对儿童的内容相关的外部数据源,从该外部数据源提取针对儿童的话题,将所提取的话题与从该知识图确定的实体的库集协调,以及利用来自所提取的话题的协调的实体,从该知识图扩展该实体。在一个实施方式中,该外部数据源包括发布针对儿童安全的和儿童感兴趣的内容的评级和评论的受信网站。在另一个实施方式中,方法中的确定该儿童的亲和度分值进一步包括识别注释有该实体的内容项;基于共同收看信号和共同出现信号识别与所识别的内容项相关的其它内容项;将所识别的其它内容项与所识别内容项合并,以生成单个组的内容项;通过在该单个组的内容项中注释的该实体将该单个组的内容项分组,以形成针对每个实体的实体分组;以及针对具有实体分组的每个实体,基于该实体分组中的内容项的注释集中性、注释相关性、平均质量、受欢迎度、或平均相关度权重中的至少一个,计算针对该实体的儿童的亲和度分值。此外,该方法可以包括针对语言、质量、受欢迎度、或内容评级中的至少一个过滤所识别内容项。此外,方法中的选择该内容可以进一步包括基于内容的类别、上传状态,或与内容相关联的内容项的数量中的至少一个识别一组候选内容;针对每个候选内容:识别该候选内容中的每个内容项的实体注释;针对该候选内容中的每个内容项确定平均评级和观看计数;以及从通过所识别的实体注释加权的所述候选内容的所有内容项汇集平均评级和观看计数,以针对该候选内容生成汇集分值。此外,方法中的选择该内容可以包括归一化来自所有候选内容的汇集分值;以及基于该归一化的归总分值,排名该候选内容。在另外的实施例中,所选择的内容包括内容共享平台的频道。此外,所选择的内容可以包括该内容共享平台的播放列表。公开了一种用于执行以上描述的方法以及本文中描述的各种实施方式的操作的计算设备。还公开了存储用于执行与以上描述的方法以及本文中描述的各种实施方式相关联的操作的指令的计算机可读介质。附图说明在附图中的图中以示例的方式而不是以限制的方式图本公开示。图1是图示可以在其中实施本公开的实施方式的示例性网络架构的框图。图2是根据实施方式图示根据本公开一个实施方式的儿童的内容系统140的框图。图3A和图3B是根据实施方式图示用于识别与儿童相关的和/或令儿童感兴趣的所考虑实体的方法的流程图。图4是根据实施方式图示用于向内容共享平台的实体分配儿童的亲和度分值的方法的示图。图5是根据实施方式图示用于使用内容共享平台的实体的儿童的亲和度分值而针对儿童的内容界面策划儿童的内容的方法的流程图。图6图示根据本公开实施方式的来自内容共享平台、为儿童提供内容建议的儿童的主屏UI的示例截屏。图7是根据实施方式图示计算机系统的实施方式的框图。具体实施方式本公开的方面和实施方式针对在没有人工干预的情况下算法上识别对儿童适合的内容。该事实方式被描述为内容共享平台的儿童的内容系统,其中该儿童的内容系统使能够识别、策划、和呈现对儿童适合和对儿童相关的内容。儿童的内容可以是指对于儿童而言是安全(例如,非成人、暴力、或明示(explicitly))和/或娱乐(例如,相关或有趣的)的一个或多个内容项。本公开的实施方式可以识别令儿童感兴趣的内容。例如,儿童的内容系统可以识别令儿童感兴趣的实体(例如,人、地方、或事物),针对这些实体算法上为不同年龄组选择并生成内容(例如,频道、播放列表、视频等),针对适合度(例如,基于内容评级)过滤该内容,根据受欢迎度和其它量度排名所过滤的内容,以及将内容发布至内容共享平台的儿童的内容界面。内容评级可以是指适合的观看观众的指示,诸如“一般观众”、“儿童”、“青少年”、“成人”、和/或任何其它适合内容评级。例如,内容评级可以包括指示符Y、G、PG、Teen、Mature等中的一个。在一个实施方式中,儿童的内容界面可以包括与内容共享平台相关联的儿童的具体应用的主屏。针对儿童的现有的内容策划解决方案并未使识别、策划、和呈现对儿童适合和对儿童相关的内容的过程自动化。针对儿童的内容策划的现有解决方案提供了一种白名单方法,其中小组的内容是从整个内容库集中人工挑选出来的。然而,在当前的内容共享平台中,可能存在是比适用于人们查看的内容更多的上传至平台的内容(例如,每分钟将300小时的视频上传至平台)。不同于本公开的方面,将不会算法上执行这些现有解决方案,这些现有解决方案并未使用大量的内容,和/或并不具有高的传入率、新内容以及大量基础内容。此外,现有解决方案并未使用不具有来自内容发布方的内容评级的内容(例如,与具有相对应的所发布内容评级的传统剧院电影或电视节目相比)。本公开经常出于简明的目的而引用视频。然而,本公开的教导通常被广泛地应用至媒体项,并且能够被应用至各种类型的内容或媒体项,该内容或媒体项包括例如视频、音频、文本、图像、节目介绍等。图1图示根据本公开的一个实施方式的示例系统架构100。系统架构100包括客户端设备110A至110Z、网络105、数据存储106、内容共享平台120、和服务器130。在一个实施方式中,网络105可以包括公共网络(例如,互联网)、私有网络(例如,局域网(LAN)或广域网(WAN))、有线网络(例如,以太网)、无线网络(例如,802.11网络或Wi-Fi网络)、蜂窝网络(例如,长期演进型(LTE)网络)、路由器、集线器、交换机、服务器计算机,和/或它们的组合。在一个实施方式中,数据存储106可以是存储器(例如,随机存取存储器)、高速缓存、驱动器(例如,本文档来自技高网...
在没有人工干预的情况下算法上识别对儿童适合的内容

【技术保护点】
一种方法,包括:由处理设备识别对应于与儿童相关的话题的实体;由所述处理设备,针对所识别的实体中的每个实体来确定儿童的亲和度分值;以及由所述处理设备,基于针对与所述内容相对应的所识别的实体的儿童的亲和度分值来选择内容。

【技术特征摘要】
【国外来华专利技术】2015.02.22 US 14/628,2881.一种方法,包括:由处理设备识别对应于与儿童相关的话题的实体;由所述处理设备,针对所识别的实体中的每个实体来确定儿童的亲和度分值;以及由所述处理设备,基于针对与所述内容相对应的所识别的实体的儿童的亲和度分值来选择内容。2.根据权利要求1所述的方法,其中,所述实体包括人、地方、或事物中的至少一个。3.根据权利要求1所述的方法,其中,识别所述实体进一步包括从知识图中选择所述实体,所述知识图包括具有关于实体的库集的结构化信息和所述实体的库集之间的关系连接的知识库,其中,所述实体的库集包括所述实体。4.根据权利要求3所述的方法,其中,识别所述实体进一步包括:访问与针对儿童的内容相关的外部数据源;从所述外部数据源提取针对儿童的话题;将所提取的话题与从所述知识图确定的所述实体的库集协调;以及利用来自所提取的话题的经协调的实体,从所述知识图扩展所述实体。5.根据权利要求4所述的方法,其中,所述外部数据源包括发布针对儿童安全的和儿童感兴趣的内容的评级和评论的受信网站。6.根据权利要求1所述的方法,其中,确定所述儿童的亲和度分值进一步包括:识别注释有所述实体的内容项;基于共同收看信号和共同出现信号识别与所识别的内容项相关的其它内容项;将所识别的其它内容项与所识别内容项合并,以生成单个组的内容项;通过在所述单个组的内容项中注释的所述实体将所述单个组的内容项分组,以形成针对每个实体的实体分组;以及针对具有实体分组的每个实体,基于所述实体分组中的内容项的注释集中性、注释相关性、平均质量、受欢迎度、或平均相关度权重中的至少一个,计算针对所述实体的儿童的亲和度分值。7.根据权利要求6所述的方法,进一步包括针对语言、质量、受欢迎度、或内容评级中的至少一个过滤所识别的内容项。8.根据权利要求1所述的方法,其中,选择所述内容进一步包括:基于内容的类别、上传状态,或与内容相关联的内容项的数量中的至少一个识别一组候选内容;针对每个候选内容:识别所述候选内容中的每个内容项的实体注释;针对所述候选内容中的每个内容项确定平均评级和观看计数;以及从通过所识别的实体注释加权的所述候选内容的所有内容项汇集所述平均评级和所述观看计数,以针对所述候选内容生成汇集分值;归一化来自所有所述候选内容的所述汇集分值;以及基于所述归一化的汇集分值,排名所述候选内容。9.根据权利要求1所述的方法,其中,所选择的内容包括内容共享平台的频道。10.根据权利要求1所述的方法,其中,所选择的内容包括所述内容共享平台的播放列表。11.一种系统,包括:存储器;以及处理设备,所述处理设备被耦合至所述存储器,其中,所述处理设备用于:识别对应于与儿童相关的话题的实体;针对所识别的实体中的每个实体来确定儿童的亲和度分值;以及基于针对与所述内容相对应的所识别的实体的儿童的亲和度分值来选择内容。12.根据权利要求11所述的系统,其中,所述实体包括人、地方、或事物中的至少一个。13.根据权利要求11所述的系统,其中,用于识别所述实体的所述处理设备进一步包括从知识图中选择所述实体的所述处理设备,所述知识图包括具有关于实体的库集的结构化信息和所述实体的库集之间的关系连接的知识库,其中,所述实体的库集包括所述实体。14.根据权利要求13所述的系统,其中,用于识别所述实体的所述处理设备进一步包括用于以下操作的所述处理设备:访问与针对儿童的内容相关的外部数据源;从所述外部数据源提取针对儿童的话题;将所提取的话题与从所述知识图确定的所述实体的库集协调;以及利用来自所提取的话题的经协调的实体,从所述知识图扩展所述实体。15.根据权利要求11所述的系统,其中,用于确定儿童的亲和度分值的所述处理设备进一步包括用于以下操作...

【专利技术属性】
技术研发人员:雪莉·康尼·高塞尔坦·吉尔金艾琳·玛格丽特·彼得斯·隆
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1