一种内容识别的方法、系统和装置制造方法及图纸

技术编号:2825954 阅读:166 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种内容识别的方法、系统和装置,所述内容识别的方法包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。通过本发明专利技术实施例,CIM实体根据不同的内容类型,选择合适的识别方法准确地识别内容,对注册主体提交的内容进行注册,在业务实体获取到已注册内容的内容属性之后,该业务实体根据该内容属性对该业务实体的内容进行控制,并且业务实体对内容的验证不必每次都连接CIM实体,降低了CIM实体的负荷。

【技术实现步骤摘要】

本专利技术实施例涉及通信
,特别涉及一种内容识别的方法、系统和装置
技术介绍
随着互联网的发展,与多媒体内容的相关应用已经非常丰富,例如:音乐、软件或电影下载、视频分享、短信和彩信等。与这些应用伴随而来的版权问题、垃圾和非法信息过滤问题,以及病毒和恶意插件问题也越来越严重。这些问题都对内容的正确识别提出了要求,通过正确识别一项内容,来判断该项内容是否版权保护内容,是否为垃圾信息等尤为重要。现在,音乐、电影、软件、电子图书等电子内容的下载、分享已经是非常流行的互联网应用。随着这些应用的发展,在各个下载、分享网站上,存在着大量侵犯版权的内容,这些内容为网站吸引了大量的用户。这些内容一般是CP(Content Provider,内容提供商)发行的,未经允许免费自由地在网站上上载和传播,这些内容使CP的正当权益受到极大的损害。为了解决这类版权问题,目前CI(Content Identification,内容识别技术)逐渐成为一些重要的内容提供商用于保护其内容版权的手段。内容识别技术是指利用内容特征提取技术,提取一项内容区别于其它内容的特征值。首先计算得到正版内容的特征值,再计算在网站上被传播的内容的特征值并与正版内容的特征值进行对比,从而判断该被传播内容是否与正版内容是同一项内容,或是否是正版内容的一部分。如果是,则根据正版内容的版权控制规则,控制被传播内容的传播和使用。现有技术还有一种通过集中的第三方来建立内容的版权控制数据库,来屏蔽受保护内容的上传的方法,CIDF(Content Identifier Forum,内容标识论坛)制定了一个用于版权保护的应用框架,主要是采用标识符标识需要分发的内容,并将该标识符与相关的内容属性,例如内容本身所具备的属性(例如:-->大小、类型等)、创建者的属性、版权属性,以及为分发而定义的相关的规则所涉及的分发属性等进行绑定。但是,本专利技术的专利技术人发现,该技术存在以下缺点:该方案对所有类型的内容都使用传统的哈希算法MD5(Message Digest Algorithm5,信息摘要算法5)来计算内容的特征值,只要内容有一个比特改变,就不能正确完成内容的验证和识别,所以采用该方案检测内容,很容易被检测内容规避。
技术实现思路
本专利技术实施例提供一种内容识别的方法、系统和装置,以实现根据不同的内容类型,选择合适的识别方法准确地识别内容。为达到上述目的,本专利技术实施例一方面提供一种内容识别的方法,包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。另一方面,本专利技术实施例还提供一种内容识别方法,包括:接收业务实体发送的内容属性查询请求,所述内容属性查询请求包括所述内容特征值和查询请求类型;根据所述内容属性查询请求中携带的内容特征值,在内容识别管理CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值;在查找到与所述内容特征值最接近的已存内容的特征值之后,根据所述内容属性查询请求中携带的查询请求类型获取已注册内容的内容属性,并将所述获取的内容属性返回所述业务实体,以供所述业务实体对所述业务实体的内容进行控制。再一方面,本专利技术实施例还提供一种用于内容识别的内容注册方法,包括:接收注册主体发送的内容注册请求;根据所述内容注册请求携带的内容类型和注册目的参数选择特征生成算法,生成内容特征值;存储所述生成的内容特征值和所述内容的内容属性,完成对所述注册主体提交的内容的注册。再一方面,本专利技术实施例还提供一种内容识别的系统,包括:业务实体,用于根据内容类型和所述业务实体对内容的控制目的选择特征提取算法提取-->内容特征值,根据所述内容特征值获取内容识别管理CIM实体上的已注册内容的内容属性,并根据所述获取的内容属性对所述业务实体的内容进行控制;内容识别管理CIM实体,用于接收所述业务实体发送的内容属性查询请求,所述内容属性查询请求包括所述内容特征值和查询请求类型,根据所述内容属性查询请求中携带的内容特征值,在所述CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值,并在查找到与所述内容特征值最接近的已存内容的特征值之后,根据所述内容属性查询请求中携带的查询请求类型获取已注册内容的内容属性,并将所述获取的内容属性返回所述业务实体,以供所述业务实体对所述业务实体的内容进行控制。再一方面,本专利技术实施例还提供一种业务实体,包括:特征值提取模块,用于根据内容类型和所述业务实体对内容的控制目的选择特征提取算法提取内容特征值;属性获取模块,用于根据所述特征值提取模块提取的内容特征值获取内容识别管理CIM实体上的已注册内容的内容属性;内容控制模块,用于根据所述属性获取模块获取的内容属性对所述业务实体的内容进行控制。再一方面,本专利技术实施例还提供一种内容识别管理CIM实体,包括:内容注册模块,用于接收注册主体发送的内容注册请求,对所述注册主体提交的内容进行注册;内容特征数据库,用于保存已注册内容的内容特征值和内容属性;验证和查询处理模块,用于接收业务实体发送的内容属性查询请求,所述内容属性查询请求包括所述内容特征值和查询请求类型,根据所述内容属性查询请求中携带的内容特征值,在所述CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值,在查找到与所述内容特征值最接近的已存内容的特征值之后,根据所述内容属性查询请求中携带的查询请求类型获取已注册内容的内容属性,并将所述获取的内容属性返回所述业务实体,以供所述业务实体对所述业务实体的内容进行控制。与现有技术相比,本专利技术实施例具有以下优点:通过本专利技术实施例,业务实体根据所接收内容的内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值,根据提取的内容特征值获取已注册内容的内容属性,-->并根据获取的内容属性对业务实体的内容进行控制。本专利技术实施例实现了由通用的CIM实体根据不同的内容类型,选择合适的识别方法准确地识别内容,对注册主体提交的内容进行注册,在业务实体获取到已注册内容的内容属性之后,该业务实体根据该内容属性对该业务实体的内容进行控制。附图说明图1为本专利技术一个实施例中内容识别的系统的结构图;图2为本专利技术一个实施例中内容识别的方法的流程图;图3为本专利技术另一实施例中内容识别的方法的流程图;图4为本专利技术一个实施例中内容特征提取和证书生成的流程图;图5为本专利技术一个实施例中内容证书的格式的示意图;图6为本专利技术一个实施例中验证流程的示意图;图7为本专利技术一个实施例中获取内容属性的流程图;图8为本专利技术一个实施例中内容识别管理CIM实体11的结构图;图9为本专利技术一个实施例中业务实体12的结构图。具体实施方式本专利技术一个实施例提供一种内容识别的方法,可以准确地识别各种类型的内容。本专利技术实施例建立了一个通用的内容识别的系统,可以用于业务实体对该业务实体涉及的内容进行版权控制、内容过滤、软件验证等操作,并且该内容识别的系统还可被灵活地扩展到其他应用领域。该业务实体指提供具体业务的实体,例如:网站、用户终端或业务网关等。本专利技术实施例针对不同内容类型的特点,选择最合适的识别方法准确识别内容,提高了本文档来自技高网
...

【技术保护点】
一种内容识别的方法,其特征在于,包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。

【技术特征摘要】
1. 一种内容识别的方法,其特征在于,包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。2. 如权利要求1所述内容识别的方法,其特征在于,所述根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值包括:如果所述内容类型为文本,并且所述业务实体对内容的控制目的为过滤,则采用传统哈希算法计算所述内容的哈希值,或者先提取所述文本内容的关键字,再计算所述关键字的哈希值,以所述计算得到的哈希值作为所述内容特征值;或者,如果所述内容类型为文本,并且所述业务实体对内容的控制目的为版权保护,则采用传统哈希算法计算所述内容的哈希值,并以所述计算得到的哈希值作为所述内容的特征值;或者,如果所述内容类型为图片、音频或视频,则采用基于内容的哈希算法提取所述内容特征值,所述基于内容的哈希算法包括内容特征提取算法和鲁棒性哈希算法。3. 如权利要求1所述内容识别的方法,其特征在于,所述根据内容特征值获取已注册内容的内容属性包括:查找内容证书,根据所述内容证书获取所述内容属性;或者,向内容识别管理CIM实体发送内容属性查询请求,接收所述CIM实体返回的内容属性,所述内容属性查询请求包括所述内容特征值和查询请求类型。4. 如权利要求3所述内容识别的方法,其特征在于,所述查找内容证书,根据所述内容证书获取所述内容属性包括:在查找到内容证书之后,验证所述查找到的内容证书的签名,在验证签名成功之后,从所述内容证书中获取所述内容属性。5. 如权利要求3所述内容识别的方法,其特征在于,所述查询请求类型包括:上传内容版权验证、下载内容版权验证、过滤控制和软件验证。6. 如权利要求5所述内容识别的方法,其特征在于,当所述查询请求类型为上传内容版权验证时,所述内容属性查询请求还包括业务实体标识;或者,当所述查询请求类型为软件验证时,所述内容属性查询请求还包括软件名称和版本信息;或者,当所述查询请求类型为下载内容版权验证时,所述内容属性查询请求还包括用户标识。7. 如权利要求1所述内容实别的方法,其特征在于,所述已注册内容是在CIM实体上注册的。8. 一种内容识别方法,其特征在于,包括:接收业务实体发送的内容属性查询请求,所述内容属性查询请求包括所述内容特征值和查询请求类型;根据所述内容属性查询请求中携带的内容特征值,在内容识别管理CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值;在查找到与所述内容特征值最接近的已存内容的特征值之后,根据所述内容属性查询请求中携带的查询请求类型获取已注册内容的内容属性,并将所述获取的内容属性返回所述业务实体,以供所述业务实体对所述业务实体的内容进行控制。9. 如权利要求8所述内容识别的方法,其特征在于,所述查询请求类型包括:上传内容版权验证、下载内容版权验证、过滤控制和软件验证。10. 如权利要求9所述内容识别的方法,其特征在于,当所述查询请求类型为上传内容版权验证时,所述内容属性查询请求还包括业务实体标识,所述获取的内容属性包括版权声明和所述业务实体标识对应的业务实体的版权控制规则。11. 如权利要求9所述内容识别的方法,其特征在于,当所述查询请求类型为软件验证时,所述内容属性查询请求还包括软件名称和版本信息,所述根据内容属性查询请求中携带的内容特征值,在CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值具体为:根据所述内容属性查询请求中携带的软件名称和版本信息,在所述CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值。12. 如权利要求9所述内容识别的方法,其特征在于,当所述查询请求类型为下载内容版权验证时,所述内容属性查询请求还包括用户标识。13. 一种用于内容识别的内容注册方法,其特征在于,包括:接收注册主体发送的内容注册请求;根据所述内容注册请求携带的内容类型和注册目的参数选择特征生成算法,生成内容特征值;存储所述生成的内容特征值和所述内容的内容属性,完成对所述注册主体提交的内容的注册。14. 如权利要求13所述用于内容识别的内容注册方法,其特征在于,所述对注册主体提交的内容进行注册还包括:为所述注册的内容生成内容证书,所述内容证书包括注册内容的特征值、内容属性、注册主体和验证所述内容...

【专利技术属性】
技术研发人员:高洪涛刘义俊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1