互联网发布内容的监控方法和装置制造方法及图纸

技术编号:4670509 阅读:185 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了对互联网发布的内容进行监控的方法和装置。示例性方法包括以下步骤:请求与接收的主题标识相关联的真正简易聚合(RSS)源文件,接收标识出第一媒体内容的所述RSS源文件,从所述RSS源文件中提取所述第一媒体内容的第一资源标识符,使用所述第一资源标识符检索获得所述第一媒体内容,执行从所述第一媒体内容提取第一内容识别码的步骤和生成所述第一媒体内容的第一签名的步骤中的至少一个,以及将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及媒体内容发布的监控,更具体地,涉及互联网发布内容的监控方法和装置
技术介绍
随着互联网站点的大小和复杂度的增加,以及网页更新频率的加快,网站创建者 们开发出了使网站用户获悉网站内可用信息和内容的各种方法和技术。网站创建者们现已 采用的一种技术是内容源。内容源是如下的单个或多个文件,该单个或多个文件包含网站 可用内容的总结以及网站可用内容的全文链接。内容源的一种类型被称为真正简易聚合 (reallysimple syndication, RSS) 。 RSS文档是根据针对RSS源建立的标准而创建的可扩 展标记语言(extensible markup language, XML)文件。通过遵循RSS标准,网站创建者能 确保支持RSS标准的任意类型的客户机都能够读取其内容源。 例如,希望总能获悉网站变化的网站用户可以订阅内容源(例如,让该用户的内 容源读取器定期并且自动地从远程站点检索获得内容源,然后提示该用户)和/或人工检 索获得内容源。如果在上一次检索获得内容源之后进行了网页的更新,则该用户将会被提 示。该用户能够浏览内容源中的信息(例如,对网页上可用的信息和/或媒体内容的说明) 并能够指令内容源读取器从内容源中所标识的位置处检索获得全部内容和/或请求用户 的web浏览器显示全部内容。附图说明 图l是其中站点监控器检测和/或识别远程站点处可用的媒体内容的示例性系统 的框图。 图2是图1所示的站点监控器的示例性实现的框图。 图3是表示可被执行以实现图1和图2所示的站点监控器的示例性机器可读指令 的流程图。 图4是表示可被执行以实现图1和图2所示的站点监控器的示例性机器可读指令 的流程图。 图5是表示可被执行以实现图1和图2所示的站点监控器的示例性机器可读指令 的流程图。 图6例示了 XML格式的示例性内容源文件。 图7是能够执行如图3-5所示的机器可读指令以实现此处公开的装置和/或方法 的示例性计算机平台的框图。具体实施例方式图1是示例性系统100的框图,在该示例性系统100中站点监控器110检测和/ 或识别远程站点102和104处可用的媒体内容。示例性系统IOO可用于例如检测版权的侵权。在一个示例性实施方式中,站点监控器110订阅远程站点102和104中的一个或更多 个的媒体内容源(如聚合源)。除此之外,示例性媒体内容源提供了远程站点102和104 处的可用媒体内容的一个或更多个统一资源定位符(universal resource locator,URL)。 例如,以周期性间隔(如每周一次),远程站点102和104可发送和/或站点监控器可请求 并接收可扩展标记语言(extensible markup language, XML)文件,该XML文件标识出了自 发出上一个XML文件后相对于各远程站点102或104的所有新媒体内容。示例性站点监控 器110接收来自远程站点102和/或104的媒体内容源并提取所需条目的URL。例如,用 户可以向站点监控器IIO输入一个或更多个关键字或词组。从而,站点监控器110将仅提 取与该关键字或词组相关联的内容的URL。站点监控器110检索获得所提取URL的媒体内 容,并提取与该媒体内容相关联的任何程序识别码和/或生成各检索获得的媒体内容的签 名(例如,代表该媒体内容的一个或更多个特征的信号或字符串)。示例性站点监控器IIO 将所提取的码和/或所生成的签名与已知媒体内容的参考码和/或参考签名的数据库进行 比较。如果示例性站点监控器110确定针对任一检索获得的内容所提取的代码和/或所生 成的签名与数据库中相应的参考码和/或参考签名匹配,则可以由此识别出内容的同一性 和/或其原始来源(其可能不同于提供该内容的远程站点102和104),并且示例性站点监 控器对相应远程站点(即远程站点102和104之一)正发布已知媒体内容这一情况进行记 录。如果该已知媒体内容是受版权保护的媒体内容,示例性站点监控器IIO可向媒体内容 的原始来源和/或发布来源(如远程站点102和/或104)发出侵犯版权通知。 图1的示例性系统100包含远程站点102、远程站点104、通信网络108以及站点 监控器110。尽管示例性系统100中包含两个远程站点、一个网络以及一个站点监控器,但 系统100的其它实现可包括任意数量的远程站点、网络和站点监控器。例如,可针对每个远 程站点或相应远程站点组而包含独立的站点监控器。 例示的示例性远程站点102和远程站点104是网络服务器,其输出标识了相应远 程站点处的可用内容的内容源。具体地说,例示的示例性远程站点102响应于对与主题标 识(如关键字、词组等)相关联内容的请求而输出XML文件(例如如图6所示的XML文件)。 例如,假设远程站点具有关于电视网络(如NBC和/或ABC)的内容,当远程站点102的用 户(如人或站点监控器110)发出对与电视网络NBC相关联的内容的请求时,远程站点102 发送标识出在远程站点102处可用的与NBC相关联的媒体内容的XML文件。与此相反,所 例示的示例性远程站点104允许用户订阅以自动接收内容源。尽管示例性远程站点102和 示例性远程站点104被实现为以不同方式处理内容源,但系统IOO可包含被实现为响应于 请求而发送内容源的任意数量的远程站点以及被实现为基于订阅而发送内容源的任意数 量的远程站点。此外,远程站点可以采用任何其它技术来发送内容源。 示例性远程站点102发送的示例性XML文件包含以下信息远程站点102的地址 (如URL)以及远程站点102处可用的各媒体内容(如网页、视频文件或视频流、音频文件 或音频流、文本文件、多媒体表示等)的标题、说明、地址(如URL)、公布日期和父网页(如 URL)。另选地,XML文件可包含上述信息的任意子集和/或可以包含附加信息(如内容的 作者、上传内容的用户、内容的创建日期等)。 示例性远程站点104向已订阅内容源的用户、设备和/或系统定期发送标识出该 内容的XML文件。例如,如果用户订阅了最新添加内容源,则远程站点104将定期发送标识出自上次发送后已被添加的内容的XML文件。远程站点104可包含任意数量和/或 类型的内容源。例如,远程站点104可允许用户识别将在XML文件中定期标识出的媒体内 容的主题。尽管示例性远程站点104定期发送XML文件,但可根据任意的日程表(例如在 日程表规定的特定时间或日期添加新内容时,在用户请求发送文件时,在定位了与发送相 关联的某一最少量的媒体内容时等)发送XML文件。此外,尽管示例性远程站点104发送 了 XML文件,但可以使用任意其它类型的文件,例如有定界符(delimited)的文本文件、Microsoft⑧Excel(5)文件、超文本标记语言(hyper-text markup language, HTML)文件等。 远程站点102和远程站点104可为任意类型的远程站点。在所例示的例子中,远 程站点102和远程站点104为互联网上的服务器。例如,远程站点102和/或远程站点104 可为YouTubeTM网站或接受用户提交内容的其它任何网站中的一种。然而,远程站点102和 远程站点104或者可以是任意类型网络上的任意类型服务本文档来自技高网...

【技术保护点】
一种方法,所述方法包括以下步骤:请求与接收的主题标识相关联的真正简易聚合(RSS)源文件;接收标识出第一媒体内容的所述RSS源文件;从所述RSS源文件中提取所述第一媒体内容的第一资源标识符;使用所述第一资源标识符检索获得所述第一媒体内容;执行以下步骤中的至少一个:从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。

【技术特征摘要】
【国外来华专利技术】US 2007-5-21 60/939,341一种方法,所述方法包括以下步骤请求与接收的主题标识相关联的真正简易聚合(RSS)源文件;接收标识出第一媒体内容的所述RSS源文件;从所述RSS源文件中提取所述第一媒体内容的第一资源标识符;使用所述第一资源标识符检索获得所述第一媒体内容;执行以下步骤中的至少一个从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。2. 根据权利要求1所述的方法,所述方法还包括以下步骤将所述第一内容识别码和 所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一 个进行比较。3. 根据权利要求2所述的方法,所述方法还包括以下步骤当所述第一内容识别码和 所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至 少一个相匹配时,存储所述第一媒体内容的标识。4. 根据权利要求2所述的方法,所述方法还包括以下步骤当所述第一内容识别码和 所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至 少一个相匹配时,向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实 体以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是 所述参考媒体内容的真实副本。5. 根据权利要求1所述的方法,其中所述RSS源文件标识出第二媒体内容,所述方法还包括以下步骤从所述RSS源文件中提取所述第二媒体内容的第二资源标识符; 使用所述第二资源标识符检索获得所述第二媒体内容;执行以下步骤中的至少一个从所述第二媒体内容提取第二内容识别码,和生成所述 第二媒体内容的第二签名;以及将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。6. 根据权利要求1所述的方法,其中所述RSS源文件是可扩展标记语言文件。7. 根据权利要求1所述的方法,其中所述第一媒体内容是视频。8. 根据权利要求1所述的方法,其中从互联网上的服务器接收所述RSS源文件。9. 根据权利要求8所述的方法,其中从所述服务器下载所述第一媒体内容。10. 根据权利要求8所述的方法,其中从与提供所述RSS源文件的服务器不同的内容服 务器下载所述第一媒体内容。11. 根据权利要求l所述的方法,其中所述RSS源文件标识出第二媒体内容,所述方法 还包括以下步骤提取与所述第二媒体内容相关联的文本; 确定所述文本是否标识出所接收的主题标识;以及 当所述文本标识出所述主题标识时,检索获得所述第二媒体内容。12. —种装置,所述装置包括源读取器,其请求与接收的主题标识相关联的真正简易聚合(RSS)源文件,并且接收标识出第一媒体内容的所述RSS源文件;源处理器,其从所述RSS源文件中提取所述第一媒体内容的第一资源标识符; 内容下载器,其使用所述第一资源标识符检索获得所述第一媒体内容; 内容处理器,其执行以下操作中的至少一个从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及数据存储部,其存储所述第一内容识别码和所述第一签名二者中的至少一个。13. 根据权利要求12所述的装置,其中所述内容处理器还将所述第一内容识别码和所 述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个 进行比较。14. 根据权利要求13所述的装置,其中当所述第一内容识别码和所述第一签名二者中 的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述 数据存储部还存储所述第一媒体内容的标识。15. 根据权利要求13所述的装置,所述装置还包括通知器,当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至 少一个相匹配时,所述通知器向所述参考内容的版权所有者、所述第一媒体内容的发布者、 版权维权实体以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一 媒体内容是所述参考媒体内容的真实副本。16. 根据权利要求12所述的装置,其中所述RSS源文件标识出第二媒体内容,所述源处理器还从所述RSS源文件中提取所述第二媒体内容的第二资源标识符,所述内容下载器还使用所述第二资源标识符检索获得所述第二媒体内容,所述内容处理器还执行从所述第二媒体内容提取第二内容识别码的操作和生成所述第二媒体内容的第二签名的操作中的至少一个,以及所述数据存储部还存储所述第二内容识别码和所述第二签名二者中的至少一 个。17. 根据权利要求12所述的装置,其中所述RSS源文件是可扩展标记语言文件。18. 根据权利要求12所述的装置,其中所述第一媒体内容是视频。19. 根据权利要求12所述的装置,其中从互联网上的服务器接收所述RSS源文件。20. 根据权利要求19所述的装置,其中从所述服务器下载所述第一媒体内容。21. 根据权利要求19所述的装置,其中从与提供所述RSS源文件的服务器不同的内容 服务器下载所述第一媒体内容。22. 根据权利要求12所述的装置,其中所述RSS源文件标识出第二媒体内容,所述源处 理器还提取与所述第二媒体内容相关联的文本并确定所述文本是否标识出所接收的主题 标识,以及当所述文本标识出所述主题标识时,所述内容检索器还检索获得所述第二媒体 内容。23. —种存储有指令的机器可读介质,所述指令在被执行时使得机器执行以下操作 请求与接收的主题标识相关联的真正简易聚合(RSS)源文件; 接收标识出第一媒体内容的所述RSS源文件;从所述RSS源文件中提取所述第一媒体内容的第一资源标识符; 使用所述第一资源标识符检索获得所述第一媒体内容;执行以下操作中的至少一个从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。24. 根据权利要求23所述的机器可读介质,其中所述指令还使得所述机器将所述第一 内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二 者中的至少一个进行比较。25. 根据权利要求24所述的机器可读介质,其中当所述第一内容识别码和所述第一签 名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹 配时,所述指令还使得所述机器存储所述第一媒体内容的标识。26. 根据权利要求24所述的机器可读介质,其中当所述第一内容识别码和所述第一签 名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹 配时,所述指令还使得所述机器向所述参考内容的版权所有者、所述第一媒体内容的发布 者、版权维权实体以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述 第一媒体内容是所述参考媒体内容的真实副本。27. 根据权利要求23所述的机器可读介质,其中所述RSS源文件标识出第二媒体内容, 并且所述指令还使得所述机器执行以下操作从所述RSS源文件中提取所述第二媒体内容的第二资源标识符; 使用所述第二资源标识符检索获得所述第二媒体内容;执行以下操作中的至少一个从所述第二媒体内容中提取第二内容识别码,和生成所 述第二媒体内容的第二签名;以及将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。28. 根据权利要求23所述的机器可读介质,其中所述RSS源文件是可扩展标记语言文件。29. 根据权利要求23所述的机器可读介质,其中所述第一媒体内容是视频。30. 根据权利要求23所述的机器可读介质,其中从互联网上的服务器接收所述RSS源 文件。31. 根据权利要求30所述的机器可读介质,其中从所述服务器下载所述第一媒体内容。32. 根据权利要求30所述的机器可读介质,其中从与提供所述RSS源文件的服务器不 同的内容服务器下载所述第一媒体内容。33. 根据权利要求23所述的机器可读介质,其中所述RSS源文件...

【专利技术属性】
技术研发人员:阿伦拉马斯瓦米
申请(专利权)人:尼尔森美国有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1