互联网上使用访问/搜索应用自动搜索非法内容的系统和方法技术方案

技术编号:5446438 阅读:251 留言:0更新日期:2012-04-11 18:40
提供一种在互联网上使用访问/搜索应用自动搜索非法内容的系统和方 法。所述系统包括:关键字输入单元,其从搜索客户接收与内容相关的关键 字,并按照关键字群组来管理关键字;脚本文件编辑单元,其从访问/搜索应 用的配置信息中提取窗口类标识ID,并基于所提取的窗口类ID和访问信息 编辑用于搜索/下载非法内容的脚本文件,其中所述窗口类ID能够控制该访 问/搜索应用;脚本文件自动化单元,其控制所述访问/搜索应用,以根据用于 搜索/下载脚本文件的所编辑的非法内容,在互联网上自动搜索/下载与关键字 群组相关的非法内容;和非法内容信息存储单元,其存储使用所述访问/搜索 应用搜索和下载的非法内容信息。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及在互联网上使用访问/搜索应用自动搜索非法内容的系统和 方法。更加具体地说,本专利技术涉及在互联网上使用访问/搜索应用的非法内容自动搜索系统及其方法,所述系统基于诸如对等服务(P2P)、网络^埂盘和网 页的互联网站点内的访问/搜索应用的配置信息、编辑用于搜索/下载非法内容 的脚本文件,并基于该脚本文件控制该访问/搜索应用,从而在P2P/网络硬盘 中自动搜索非法内容。
技术介绍
在当前的数字版权管理(DRM)环境中,虽然内容被合法地传送给用户, 但是用户能够通过捕获工具或黑客活动来非法地复制图像、音频和视频内容, 同时又不使语音或画面的质量恶化。当用户未经许可通过对等(P2P)服务或 网络硬盘服务在互联网上发布非法复制的内容时,其他用户就能够^f吏用非法 内容,而无需购买所述内容。发布非法数字内容严重地影响了数字内容产业。 因而,需要用于防止非法复制的技术。虽然需要跟踪并惩罚非法活动以防止对数字内容的非法复制,但是在传 统技术中,很难搜索/下载非法复制的内容并跟踪非法内容的发布者。 一种传 统方法通过^吏用了7>用协议(诸如e-donkey (电驴)和bitTorrent)的、包括 简单超文本标记语言(HTML)的在线网页收集内容,但是该方法的功能有 限。而且,存在不可能取得一部分信息的问题。由于在P2P或网络硬盘中提供了个人通信协议和接口 , P2P或网络硬盘 是一般用户所使用的额外付费的公共服务(premium common service)环境, 因此存在很难自动搜索内容的问题。防止和跟踪非法发布传统数字内容的技术包括一种用于跟踪和搜索图像 的技术,其基于网页搜索器、基于内容的特征点提取器和基于内容的搜索引 擎,对发布于互联网上的图像的特征点和元数据进行搜索和分类,由此来发 现互联网上的版4又侵权。5然而,这一传统技术仅限于网页搜索,并且对象内容仅限于图像。并且, 根据服务提供商在不同的公共P2P/网络硬盘中搜索非法复制的内容不是自动 进行的,而是手动进行的。存在另一种传统技术,其使用客户端代理来防止和跟踪非法复制和未经 许可的发布。所述技术能够建立一个系统,该系统通过用于在互联网或P2P共享网络上监视非法作品的非法作品监視服务器以及从该非法作品监视服务器发布的非法作品跟踪程序,来跟踪互联网或P2P共享网络上的非法作品,由此有效 控制和监视在互联网上发布的非法作品。并且,该非法作品监视系统能够通 过向监视非法作品的客户端支付非法作品跟踪费用(诸如里程点(mileage point)或适当的报酬)来有效地维持。然而,该传统技术只能在简单网页/公用P2P中进行搜索。由于每个应用 具有不同的接口和不同的传输协议,因此存在这样的问题在被作为公共服 务提供的封闭P2P (closedP2P)或网络硬盘中的搜索以及发布者信息的跟踪 要手动执行
技术实现思路
技术问题因此,本专利技术的一个目的是提供一种在互联网上使用访问/搜索应用搜索 非法内容的系统及其方法。该系统根据诸如对等(P2P)、网络硬盘和网页的 互联网站点中的访问/搜索应用的配置信息,编辑用于搜索/下载非法内容的脚 本文件,并基于该脚本文件控制该访问/搜索应用,由此来自动搜索P2P/网络 硬盘中的非法内容。本专利技术的其它目的和优点将通过下面的描述而被理解,并且将通过下文 阐述的本专利技术的实施例而变得更加清楚。还将清楚的是,本专利技术的目的和优 点能够通过权利要求中定义的装置及其組合容易地实现。技术方案根据本专利技术的一个方面,提供一种在互联网上使用访问/搜索应用的非法 内容自动搜索系统。所述系统包括关键字输入单元,其从搜索客户接收与 内容相关的关键字,并按照关键字群組来管理所述关键字;脚本文件编辑单 元,其从访问/搜索应用的配置信息中提取窗口类标识ID,并基于所提取的窗口类ID和访问信息编辑用于搜索/下载非法内容的脚本文件,其中所述窗口类ID能够控制该访问/搜索应用;脚本文件自动化装置,其控制所述访问/搜 索应用,以根据用于搜索/下载脚本文件的所编辑的非法内容,在互联网上自 动搜索/下载与关键字群組相关的非法内容;和非法内容信息存储单元,其存 储使用所述访问/搜索应用搜索的和下载的非法内容信息。根据本专利技术的另 一个方面,提供一种在互联网上使用访问/搜索应用的非 法内容自动搜索方法,该方法包含如下步骤a)从所述访问/搜索应用的配 置信息提取用于控制该访问/搜索应用的窗口类标识ID; b)通过所提取的窗口 类ID和所述访问/搜索应用,基于被用于访问互联网站点的访问信息来编辑 用于搜索/下载非法内容的脚本文件;c)从搜索客户接收与所述内容相关的关 键字,并根据每一群組来管理所述关键字;以及d)控制所述访问/搜索应用, 以根据所编辑的用于搜索/下载所述非法内容的脚本文件,在互联网上自动地 搜索/下载与所述关键字群组相关的非法内容。本专利技术的 一 个目的是在互联网上的封闭P2P/网络硬盘中自动搜索非法内容。通过基于诸如P2P、网络硬盘和网页的、待搜索的互联网站点上的访问/ 搜索应用的配置信息编辑脚本文件,并根据所编辑的脚本文件来控制该访问/ 搜索应用搜索/下载与关键字群組相关的非法内容,来自动地搜索非法内容信 息。当诸如发布服务器、拥有版权的个人和内容服务提供商这样的搜索请求 客户请求跟踪非法的复制内容时,本专利技术执行互联网上的诸如封闭P2P/网络 硬盘访问程序这样的内容服务程序,根据关键字群組执行自动搜索,并下载 与包括图像、音频和视频的非法复制内容相关的信息。并且,本专利技术包括用 于收集发布者信息的发布者信息跟踪模块。有益效果在传统的技术中,手动地执行在简单网页或公用P2P中的简单搜索、在 收费P2P或网络硬盘中的内容搜索和发布者确定工作。相反,本专利技术基于能够控制封闭的访问/搜索应用的脚本来搜索非法内 容,并提取搜索到的内容的发布者信息,从而能够自动地搜索非法内容和发 布者信息。并且,当访问/搜索应用是网页类型的网络硬盘时,例如,当内容被存储7在网页的公告板中时,本专利技术将访问/搜索应用作为脚本进行调用,通过网页 分析块对源进行分析,并通过分析结果获得链l妻信息,由此,当位置信息改 变时,本专利技术无需校正脚本,能够容易地进行搜索。本专利技术通过钩住在访问/搜索应用内部所传送的窗口消息,来在窗口消息 内部提取发布者信息。从而,当不能够提取发布者信息时,本专利技术能够强制 提取发布者信息,并控制访问/搜索应用。通过在在线服务上自动搜索内容并确定内容是否非法,本专利技术能够减少 防止非法复制所需的劳动力和预算,并且能够激励对内容非法复制的防止。附图说明本专利技术的上述和其它目的和特征将从以下结合附图给出的对优选实施例的描述变得清楚,其中图1示出了根据本专利技术的实施例的、在互联网上使用访问/搜索应用的非法内容自动搜索系统;图2为说明根据本专利技术的实施例的、图1的脚本文件编辑块的框图; 图3为说明根据本专利技术的实施例的、图1的脚本文件自动化块的框以及图4为说明根据本专利技术实施例的基于访问/搜索应用在互联网上自动搜索 非法内容的方法中的、根据每一群组搜索关键字的方法的流程图。具体实施例方式本专利技术的其它目的和优点将从下列参考附图对实施例的描述变得清楚。 因此,本专利技术的领域的技术人员能够容易地具体本文档来自技高网
...

【技术保护点】
一种在互联网上使用访问/搜索应用的非法内容自动搜索系统,包括: 关键字输入装置,其从搜索客户接收与内容相关的关键字,并按照关键字群组来管理所述关键字; 脚本文件编辑装置,其从访问/搜索应用的配置信息中提取能够控制该访问/搜索应用的窗口类标识ID,并基于所提取的窗口类ID和访问信息编辑用于搜索/下载非法内容的脚本文件; 脚本文件自动化装置,其控制所述访问/搜索应用,以根据所编辑的用于搜索/下载脚本文件的非法内容,在互联网上自动搜索/下载与关键字群组相关的非法内容;和 非法内容信息存储装置,其存储使用所述访问/搜索应用搜索和下载的非法内容信息。

【技术特征摘要】
【国外来华专利技术】2006.7.25 KR 10-2006-00699701、一种在互联网上使用访问/搜索应用的非法内容自动搜索系统,包括关键字输入装置,其从搜索客户接收与内容相关的关键字,并按照关键字群组来管理所述关键字;脚本文件编辑装置,其从访问/搜索应用的配置信息中提取能够控制该访问/搜索应用的窗口类标识ID,并基于所提取的窗口类ID和访问信息编辑用于搜索/下载非法内容的脚本文件;脚本文件自动化装置,其控制所述访问/搜索应用,以根据所编辑的用于搜索/下载脚本文件的非法内容,在互联网上自动搜索/下载与关键字群组相关的非法内容;和非法内容信息存储装置,其存储使用所述访问/搜索应用搜索和下载的非法内容信息。2、 如权利要求l所述的系统,还包括信息管理装置,其管理所述访问/搜索应用的配置信息,并管理用来通过 该访问/4窆索应用访问互联网站点的访问信息。3、 如权利要求l所述的系统,其中,所述脚本文件编辑装置包括窗口类ID提取单元,其从所述访问/搜索应用的配置信息中提取能够控 制该访问/搜索应用的窗口类ID;窗口命令输入单元,其接收窗口命令,以基于所提取的窗口类ID将命令直接传送到窗口类;脚本命令输入单元,其接收用于自动执行窗口输入的脚本命令;和 脚本编辑单元,其根据所提取的窗口类ID、输入的窗口命令、输入的脚本命令和所管理的访问信息来编辑用于搜索/下载非法内容的脚本文件。4、 如权利要求3所述的系统,其中,所述脚本文件自动化装置包括 脚本文件分析单元,其分析所编辑的用于搜索/下载非法内容的脚本文件,并将该脚本文件转换成用于搜索/下载非法内容的脚本操作文件;自动关键字输入单元,其加载并自动输入来自所述关键字输入装置的、按照每个群组进行管理的关键字;和脚本文件操作单元,其操作转换后的用于搜索/下载非法内容的脚本操作文件,并控制所述访问/搜索应用,使其按照每个群组在互联网上自动搜索/下载与所输入的关键字相关的非法内容。5、 如权利要求4所述的系统,其中,所述脚本文件自动化装置还包括 发布者信息提取单元,其从发布脚本文件操作单元中的非法内容的互联网站点提取非法内容的发布者信息;文件下载控制单元,其基于搜索到的和所下载的非法内容的特征点下载 一部分内容,并将所述内容识别为非法内容;网页分析单元,当所述访问/搜索应用为网页类型的网络^^盘时,其分析 网页的源,并获取包括非法内容的链接信息;和附加单元,当根据用于搜索/下载非法内容的脚本操作文件没有提取出非 法内容的发布者信息时,其钩住从访问...

【专利技术属性】
技术研发人员:郑彗源李骏硕徐泳浩俞元英徐庸硕李相光李善和金元谦吴元根李诚晥李承宰尹英锡
申请(专利权)人:韩国电子通信研究院
类型:发明
国别省市:KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1