【技术实现步骤摘要】
本专利技术实施例涉及通信
,特别涉及一种内容识别的方法、系统和装置。
技术介绍
随着互联网的发展,与多媒体内容的相关应用已经非常丰富,例如:音乐、软件或电影下载、视频分享、短信和彩信等。与这些应用伴随而来的版权问题、垃圾和非法信息过滤问题,以及病毒和恶意插件问题也越来越严重。这些问题都对内容的正确识别提出了要求,通过正确识别一项内容,来判断该项内容是否版权保护内容,是否为垃圾信息等尤为重要。现在,音乐、电影、软件、电子图书等电子内容的下载、分享已经是非常流行的互联网应用。随着这些应用的发展,在各个下载、分享网站上,存在着大量侵犯版权的内容,这些内容为网站吸引了大量的用户。这些内容一般是CP(Content Provider,内容提供商)发行的,未经允许免费自由地在网站上上载和传播,这些内容使CP的正当权益受到极大的损害。为了解决这类版权问题,目前CI(Content Identification,内容识别技术)逐渐成为一些重要的内容提供商用于保护其内容版权的手段。内容识别技术是指利用内容特征提取技术,提取一项内容区别于其它内容的特征值。首先计算得到正版内容的特征值,再计算在网站上被传播的内容的特征值并与正版内容的特征值进行对比,从而判断该被传播内容是否与正版内容是同一项内容,或是否是正版内容的一部分。如果是,则根据正版内容的版权控制规则,控制被传播内容的传播和使用。现有技术还有一种通过集中的第三方来建立内容的版权控制数据库,来屏蔽受保护内容的上传的方法,CIDF(Content Identifier Forum,内容标识论坛)制定了一个用于版权保护 ...
【技术保护点】
一种内容识别的方法,其特征在于,包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。
【技术特征摘要】
1. 一种内容识别的方法,其特征在于,包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。2. 如权利要求1所述内容识别的方法,其特征在于,所述根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值包括:如果所述内容类型为文本,并且所述业务实体对内容的控制目的为过滤,则采用传统哈希算法计算所述内容的哈希值,或者先提取所述文本内容的关键字,再计算所述关键字的哈希值,以所述计算得到的哈希值作为所述内容特征值;或者,如果所述内容类型为文本,并且所述业务实体对内容的控制目的为版权保护,则采用传统哈希算法计算所述内容的哈希值,并以所述计算得到的哈希值作为所述内容的特征值;或者,如果所述内容类型为图片、音频或视频,则采用基于内容的哈希算法提取所述内容特征值,所述基于内容的哈希算法包括内容特征提取算法和鲁棒性哈希算法。3. 如权利要求1所述内容识别的方法,其特征在于,所述根据内容特征值获取已注册内容的内容属性包括:查找内容证书,根据所述内容证书获取所述内容属性;或者,向内容识别管理CIM实体发送内容属性查询请求,接收所述CIM实体返回的内容属性,所述内容属性查询请求包括所述内容特征值和查询请求类型。4. 如权利要求3所述内容识别的方法,其特征在于,所述查找内容证书,根据所述内容证书获取所述内容属性包括:在查找到内容证书之后,验证所述查找到的内容证书的签名,在验证签名成功之后,从所述内容证书中获取所述内容属性。5. 如权利要求3所述内容识别的方法,其特征在于,所述查询请求类型包括:上传内容版权验证、下载内容版权验证、过滤控制和软件验证。6. 如权利要求5所述内容识别的方法,其特征在于,当所述查询请求类型为上传内容版权验证时,所述内容属性查询请求还包括业务实体标识;或者,当所述查询请求类型为软件验证时,所述内容属性查询请求还包括软件名称和版本信息;或者,当所述查询请求类型为下载内容版权验证时,所述内容属性查询请求还包括用户标识。7. 如权利要求1所述内容实别的方法,其特征在于,所述已注册内容是在CIM实体上注册的。8. 一种内容识别方法,其特征在于,包括:接收业务实体发送的内容属性查询请求,所述内容属性查询请求包括所述内容特征值和查询请求类型;根据所述内容属性查询请求中携带的内容特征值,在内容识别管理CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值;在查找到与所述内容特征值最接近的已存内容的特征值之后,根据所述内容属性查询请求中携带的查询请求类型获取已注册内容的内容属性,并将所述获取的内容属性返回所述业务实体,以供所述业务实体对所述业务实体的内容进行控制。9. 如权利要求8所述内容识别的方法,其特征在于,所述查询请求类型包括:上传内容版权验证、下载内容版权验证、过滤控制和软件验证。10. 如权利要求9所述内容识别的方法,其特征在于,当所述查询请求类型为上传内容版权验证时,所述内容属性查询请求还包括业务实体标识,所述获取的内容属性包括版权声明和所述业务实体标识对应的业务实体的版权控制规则。11. 如权利要求9所述内容识别的方法,其特征在于,当所述查询请求类型为软件验证时,所述内容属性查询请求还包括软件名称和版本信息,所述根据内容属性查询请求中携带的内容特征值,在CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值具体为:根据所述内容属性查询请求中携带的软件名称和版本信息,在所述CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值。12. 如权利要求9所述内容识别的方法,其特征在于,当所述查询请求类型为下载内容版权验证时,所述内容属性查询请求还包括用户标识。13. 一种用于内容识别的内容注册方法,其特征在于,包括:接收注册主体发送的内容注册请求;根据所述内容注册请求携带的内容类型和注册目的参数选择特征生成算法,生成内容特征值;存储所述生成的内容特征值和所述内容的内容属性,完成对所述注册主体提交的内容的注册。14. 如权利要求13所述用于内容识别的内容注册方法,其特征在于,所述对注册主体提交的内容进行注册还包括:为所述注册的内容生成内容证书,所述内容证书包括注册内容的特征值、内容属性、注册主体和验证所述内容...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。