对内容分类的方法及系统技术方案

技术编号:3480822 阅读:182 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了对内容分类的方法及系统,以减小内容分类处理的负荷和网络传输流量。方法包括:内容分类请求方发送待分类内容的内容摘要给内容分类提供方;内容分类提供方根据所述内容摘要进行内容分类。内容分类请求装置,包括:摘要操作判断单元,用于判断是否需要获得待分类内容的内容摘要;摘要获得单元,用于在摘要操作判断单元判定需要获得待分类内容的内容摘要时,获得该待分类内容的内容摘要;第一发送单元,用于将摘要获得单元获得的内容摘要发出。

【技术实现步骤摘要】

本专利技术涉及网络及通信领域,特别是涉及对内容分类的方法及系统
技术介绍
随着网络技术和各项信息技术的飞速发展,用户所能接触到的内容逐渐脱 离时间和空间的限制,用户暴露在色情、暴力、病毒等一系列不健康和对客户 端有威胁的内容面前的机率大大增加,于是对通信内容过滤的需求越来越强烈。现有的过滤技术包括名单过滤技术、关键词过滤技术、模板过滤技术、 分类过滤技术等,其中基于分类的内容过滤技术由于其使用灵活和适应性广泛 而成为研究的热点。另一方面,自动文摘技术已经发展了 50年左右,与其相 关的基础技术(如自动分词)也经历了长期的发展并形成了一些实用系统, 尤其是西文自动文摘发展已经比较成熟。同时视频摘要技术的研究和成果也日 新月异,越来越成熟。参见图l所示,目前基于分类的内容过滤框架从结构上主要分为2个部分 内容过滤单元和内容分类单元。内容分类单元提供一个接口 CBCS-l,内容分 类请求方(包括框架内部的内容过滤单元,以及外部的其他请求者)均可以 通过此接口获取待分类内容的内容类别。内容分类请求方可输入的参数包括 内容本身或内容标识(如URI)和/或其他与内容相关信息(如内容所有者)。参见图2所示,目前内容分类请求方获取待分类内容的内容类别的过程, 包括下列步骤1.内容分类请求方确定使用内容本身去请求内容类别,如情况一,内 容分类请求方为内容过滤单元,其收到的内容过滤请求中只带有内容本身,而 没有其他内容标识和预分类信息;情况二,内容分类请求方为内容过滤单元,其收到的内容过滤请求中的内容为预分类内容,^f旦其预分类信息不可信^f壬且没有其他内容标识;情况三,内容分类请求方为内容过滤单元,其收到的内容过 滤请求中带有内容本身和内容标识,但是内容分类提供方(内容分类单元)无 法提供其内容标识对应的类别信息;情况四,内容提供商作为内容分类请求方 仅仅是为了请求类别,以生成预分类内容,供其提供的内容在以后被请求时使 用该类别信息;情况五,内容分类请求方为内容过滤单元,其收到的内容过滤 请求中带有内容本身和内容标识,由于内容过滤单元设置成不支持以内容标识 去获取类别的模式,从而直接使用内容本身去请求内容类别。2. 内容分类请求方构造内容类别请求消息,并向内容分类提供方发送该 消息,其中携带了内容本身。3. 内容分类提供方从内容类别请求消息中提取出内容本身,并对内容本 身采用适当的算法进行分类。4. 内容分类提供方构造响应消息,向内容分类请求方返回内容类别。 在输入l^t中,直接体现该内容的只有内容本身和内容对应的URI。 URI不一定总是能获取,同时对于该URI对应的内容类别,内容分类提供方不一定 能提供(如未保存在内容分类单元中或者内容分类单元未能从外部获取得到 对应的内容类别),这时内容分类请求方只能直接向内容分类提供方提供内容 本身,而内容本身可能很大,需要承载在一个内容类别请求消息拆分成的多个 数据包中,这时不仅需要内容分类提供方从该请求消息中解析出待分类的内 容,而且需要大量緩存、重组内容,最后再根据分类算法进行分类处理。专利技术人在专利技术过程中发现,现有技术中,内容分类请求方在请求内容类别 时提供给内容分类提供方的信息中,直接体现该信息的输入参数只有内容本身 和URI两种。在向内容分类提供方提供内容本身时,缺乏一个高效的处理方式, 不仅加重内容分类提供方分类处理的负荷,同时加大网络传输流量,特别是对 于外部实体通过CBCS-1接口请求内容类别的情况。
技术实现思路
本专利技术实施例提供了 一种请求内容分类的方法,以减小网络传输流量。 本专利技术实施例还提供了 一种内容分类的方法,以减小内容分类处理的负荷。本专利技术实施例还提供了对内容分类的方法及系统,以减小内容分类处理的 负荷和网络传输流量。本专利技术实施例的一种请求内容分类的方法,包括以下步骤内容分类请求 方获得待分类内容的内容摘要,生成内容类别请求消息,并在所述的内容类别 请求消息中携带所述的内容摘要;内容分类请求方将携带有所述内容摘要的内容类别请求消息发出,请求内容类别。本专利技术实施例的一种内容分类的方法,包括以下步骤内容分类提供方收 到内容类别请求消息,所述的内容类别请求消息中携带有待分类内容的内容摘本专利技术实施例的对内容分类的方法包括内容分类请求方发送待分类内容 的内容摘要给内容分类提供方;内容分类提供方根据所述内容摘要进行内容分 类。本专利技术实施例的内容分类请求系统,包括摘要操作判断单元,用于判断 是否需要获得待分类内容的内容摘要;摘要获得单元,用于在摘要操作判断单 元判定需要获得待分类内容的内容摘要时,获得该待分类内容的内容摘要;第 一发送单元,用于将摘要获得单元获得的内容摘要发出。本专利技术实施例的内容分类的系统,包括内容分类请求方一侧和内容分类 提供方一侧;所述内容分类请求方一侧包括内容分类请求装置,其中进一步 包括摘要操作判断单元,用于判断是否需要获得待分类内容的内容摘要;摘 要获得单元,用于在摘要操作判断单元判定需要获得待分类内容的内容摘要 时,获得该待分类内容的内容摘要;第一发送单元,用于将摘要获得单元获得 的内容摘要发出;所述内容分类提供方一侧包括内容分类提供装置,用于根据内容分类请求装置发来的所述内容摘要进行内容分类。本专利技术实施例中,内容分类请求方发送待分类内容的内容摘要给内容分类提供方;内容分类提供方根据所述内容摘要进行内容分类。由于本专利技术实施例以待分类内容的内容摘要向内容分类提供方请求内容 类别,而所述内容摘要又远远小于内容本身,所以减小了内容分类处理的负荷 和网络传输流量。附图说明图1为现有基于分类的内容过滤框架示意图2为现有内容分类请求方获取待分类内容的内容类别的流程图3为本专利技术实施例的方法步骤流程图4为本专利技术实施例的内容分类请求系统结构示意图5为本专利技术实施例1的应用场景示意图6为本专利技术实施例2的应用场景示意图7为本专利技术实施例3的应用场景示意图8为本专利技术实施例3的流程图9为本专利技术实施例4的应用场景示意图10为本专利技术实施例4的流程图。具体实施例方式为了减小网络传输流量,本专利技术实施例提供了 一种请求内容分类的方法, 包括下列步骤内容分类请求方获得待分类内容的内容摘要,生成内容类别请 求消息,并在所述的内容类别请求消息中携带所述的内容摘要;内容分类请求 方将携带有所述内容摘要的内容类别请求消息发出,请求内容类别。其中,内容分类请求方在确定需以待分类内容的内容本身请求内容类别 时,再判断是否需要获得待分类内容的内容摘要。并且内容分类请求方判定需要获得所述待分类内容的内容摘要时,再获得内容摘要。为了减小内容分类处理的负荷,本专利技术实施例提供了 一种内容分类的方法,包括以下步骤内容分类提供方收到内容类别请求消息,所述的内容类别 请求消息中携带有待分类内容的内容摘要;内容分类提供方根据所述的内容摘 要对所述的待分类内容进行内容分类。为了减小内容分类处理的负荷和网络传输流量。本专利技术实施例提供了一种对内容分类的方法,参见图3所示,包括下列步骤51. 内容分类请求方确定使用待分类内容的内容本身去请求内容类别。(可 选步骤)52. 内容分类请求方判断是否需要获得待分类内容的内容摘要。内容分类请求方可判断待分类内容的数据大小是否大于阈值,和/或待分类 内容的数据格本文档来自技高网
...

【技术保护点】
一种请求内容分类的方法,其特征在于,包括下列步骤:内容分类请求方获得待分类内容的内容摘要,生成内容类别请求消息,并在所述的内容类别请求消息中携带所述的内容摘要;内容分类请求方将携带有所述内容摘要的内容类别请求消息发出,以该内容摘要请求内容类别。

【技术特征摘要】

【专利技术属性】
技术研发人员:柴晓前彭锦卓汉祖依德维格
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1