当前位置: 首页 > 专利查询>奥多比公司专利>正文

确定和推荐用于文档的文档控制策略的系统和方法技术方案

技术编号:5461374 阅读:273 留言:0更新日期:2012-04-11 18:40
本说明书描述了识别用于给定文档的适当文档控制策略的相关技术。概括地说,一种方法可以包括:确定文档的文体分类,该文体分类包括多个项以及表示该项关于该文档的置信度水平的相应分数;根据文体分类在文档控制策略本体中识别相关节点;至少部分地基于至少一个分数评估该相关节点的可用性的置信度水平;如果所评估的该相关节点的可用性的置信度水平低于阈值,则在文档控制策略本体中选择该相关节点的父节点以代表该相关节点;以及基于在文档控制策略本体中所识别的或所选择的相关节点,推荐至少一个文档控制策略以管理对该文档的访问。

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及识别用于给定文档的适当文档控制策略。
技术介绍
文档控制策略包括文档访问策略和文档保留策略。文档安全策略是文档访问策略的一般例子。文档安全策略是规则框架内的一个实例,组织在该规则框架内建立多个必需的文档信息安全级别以获得特定期望机密性和隐私目标。策略是关于应用于文档内容的权限和特权、以及任何其他可能分配给或应用于文档的约束的声明。文档安全策略通常通过DRM(数字权限管理)系统来描述和/或实现。文档保留策略是组织关于保存数据(尤其是电子文档)的规范化策略内的一个实例。与之相关的还有文档数据销毁策略,其是组织关于数据(尤其是电子文档)销毁/数据过期的规范化策略内的一个实例。文档数据销毁策略是文档保留策略的一种类型。文档保留策略通常通过记录归档系统来实现。当一个文档被创建之后,用户通常手动地施行文档保留和安全策略,或者使用DRM系统(其中常常需要对新的未知文档进行人工干预)。另一种方法依赖信息科技工作流/内容管理系统(ITW/CMS)来帮助选择、分配和施行适当的策略。这种工作流和系统常常是高度定制化的、专门开发来用于公司的特定业务实践,并且利用将安全和保留策略与预定义文档类别紧密结合的分类系统。
技术实现思路
本说明书描述了识别用于给定文档的适当文档控制策略的相关技术。概括地说,本说明书描述的主题的一个方面可以包含于一种-->方法中,该方法包括:确定文档的文体分类,文体分类包括多个项(term)以及相应分数,每个分数对应一个项,表示该项关于该文档的置信度水平;通过将文体分类与文档控制策略本体进行比较,来在文档控制策略本体中识别一个相关节点;至少部分地基于至少一个分数评估相关节点的可用性的置信度水平;如果所评估的相关节点的可用性的置信度水平低于阈值,则在文档控制策略本体中选择该相关节点的父节点以代表该相关节点;并且基于在文档控制策略本体中所识别的或所选择的相关节点推荐至少一个文档控制策略以管理对该文档的访问。确定可以包括:使用包括分级知识结构的文档文体本体对所述文档进行分类,所述分级知识结构包含项和概念的词汇表、以及用于文档文体分类的表示词汇表项和概念之间的相互关系的推理链;所述文体分类可以包括所述推理链的子集;以及所述识别可以包括检查与比所述推理链的子集的各项的最低水平高的水平相关联的项。该方法还包括基于与所述文档控制策略本体中的一个父节点的子节点相关联的多个文档控制策略的组合,导出用于所述文档控制策略本体中的所述父节点的文档控制策略;以及将导出的文档控制策略与文档控制策略本体中的父节点相关联。所述导出的文档控制策略可以包括导出的安全策略和导出的保留策略,并且导出所述文档控制策略可以包括:组合与所述父节点的子节点相关联的安全策略的布尔值,以形成所述导出的安全策略;以及组合所识别的单独情况以形成所述导出的保留策略,所述所识别的单独情况是基于与子节点相关联的多个文档控制策略的关联变量。导出可以包括:从与所述文档控制策略本体中的子节点相关联的多个文档控制策略中导出集合了策略组成的文档控制策略,默认为更保守的策略组成。此外,所述导出可以包括递归地导出用于所述文档控制策略本体中的父节点的文档控制策略,直至根节点;并且其中所述导出和所述关联可以在部署所述文档控制策略本体之前执行。-->所述推荐可以包括输出多个推荐的文档控制策略以及对应的来自所述文档控制策略本体的推理链。所述方法还包括:将来自多个推荐的文档控制策略的最高排名的文档控制策略自动应用于所述文档。上述方面的其他实施例包括相应的系统、装置和计算机程序产品。例如,一种系统可以包括:用户接口设备;文档控制组件,包括包含文档控制策略的分级知识结构,所述文档控制策略包含根据与父节点的子节点相关联的规则的代数最大值而由所述父节点继承的至少一个文档控制策略;以及一个或多个计算机,其可操作为与所述用户接口设备和所述文档控制组件进行交互,以确定文档的文体分类,将所述文体分类与所述分级知识结构进行比较以在包括所述父节点的多个节点中识别一个相关节点,并且基于在所述分级知识结构中识别的相关节点推荐至少一个文档控制策略,来管理对所述文档的访问。所述一个或多个计算机可以包括一个个人计算机,并且所述个人计算机可以包括所述用户接口设备。所述一个或多个计算机可以包括可操作为通过数据通信网络与所述用户接口设备进行交互的服务器,并且所述用户接口设备可操作为客户端而与所述服务器进行交互。所述系统还可以包括:用于文档文体分类的文档文体本体,所述文档文体本体包括分级知识结构,所述分级知识结构包含项和概念的词汇表,以及表示词汇表项和概念之间的相互关系的推理链;应用程序接口(API),配置为向所述文档控制组件提供对所述文档文体本体中的推理链的选定元素的访问;其中所述文档控制组件包括策略本体组件,该策略本体组件配置为推荐所述至少一个文档控制策略,并且其包括一个接口,策略管理组件通过该接口访问要应用到所述文档的至少一个文档控制策略。所述策略管理组件可以包括策略服务器,并且所述编程接口可以利用XML(可扩展标记语言)和XML方案(XSD)进行数据交换。在本说明书中描述的主题的特定实施例可以实现为获得一个或-->多个下述优势。分级知识结构可以用于自动地对文档进行分类,并且随后推荐和应用适当的文档安全和保留策略。可以基于文档文体(例如文档类别和类型)自动地定位和推荐安全和保留策略,并且企业可以使用这些系统和方法使保护和保留文档的过程自动化。可以进行关于文档的文体概括以推荐应当应用的一个或多个可能的策略。关于包含文档控制策略的分级知识结构概括文体分类的能力,其可以至少部分地将在文档分类中使用的分级表示与用于识别文档控制策略的分级表示分开。这允许方法和系统容易地在真实世界业务环境中使用,在这种环境中人类和机器代理可能难以高度精确地确定给定文档的确切类型或类别。不需要高强度的人类干预或完善的自动文档分类器就可以定位有用和正确的策略。可以避免耗时且常常出错的人工过程以及人工辅助的DRM,并且可以自动地选择适当文档控制策略并将其应用到文档,而与生成该文档的用户的知识和能力无关。此外,在没有完整规定安全和保留策略的业务中,可以自动地进行相关文档文体的概括和推理以找到适当的候选策略。这对于涉及影响保障、保护和归档业务文档的义务的政府规范(例如2002年Sarbanes-Oxley法案)的公司来说特别有价值。此外,系统是灵活的,因为新的安全和保留策略可以容易地增加和施行,并且新的文档类型可以容易地增加到文档分类系统,那些单独作出的改变不会当策略确定时引起两种类别的交集中的不兼容性。使用返回分级类别结构内的文档文体类别的分类器可以通过使用更概括的父分类来实现对小错误或误分类的更大容忍度,这种父分类具有更保守的规则但是仍然是正确的。本专利技术的一个或多个实施例的细节在附图和下文描述中阐明。从这些描述、附图和权利要求书中,本专利技术的其他特征、方面和优势将变得明显。附图说明-->图1示出了配置用于自动确定和推荐文档控制策略的示例性系统。图2示出了用于自动确定和推荐文档控制策略的示例性工作流。图3是示出了确定、推荐文档控制策略并将其应用到文档的示例性过程的流程图。图4示出了与示例性策略本体相比较的两个示例性分类器推理链本文档来自技高网...

【技术保护点】
一种方法,包括: 确定文档的文体分类,所述文体分类包括多个项和相应的分数,每个分数对应一个项,表示该项关于该文档的置信度水平; 通过将所述文体分类与文档控制策略本体进行比较,在文档控制策略本体中识别相关节点; 至少部分地基 于至少一个所述分数评估所述相关节点的可用性的置信度水平; 如果所评估的所述相关节点的可用性的置信度水平低于阈值,则在文档控制策略本体中选择所述相关节点的父节点以代表所述相关节点;以及 基于在文档控制策略本体中所识别的或所选择的相 关节点,推荐至少一个文档控制策略以管理对所述文档的访问。

【技术特征摘要】
【国外来华专利技术】US 2006-9-6 11/470,5331.一种方法,包括:确定文档的文体分类,所述文体分类包括多个项和相应的分数,每个分数对应一个项,表示该项关于该文档的置信度水平;通过将所述文体分类与文档控制策略本体进行比较,在文档控制策略本体中识别相关节点;至少部分地基于至少一个所述分数评估所述相关节点的可用性的置信度水平;如果所评估的所述相关节点的可用性的置信度水平低于阈值,则在文档控制策略本体中选择所述相关节点的父节点以代表所述相关节点;以及基于在文档控制策略本体中所识别的或所选择的相关节点,推荐至少一个文档控制策略以管理对所述文档的访问。2.根据权利要求1所述的方法,其中所述确定包括:使用包括分级知识结构的文档文体本体对所述文档进行分类,所述分级知识结构包含项和概念的词汇表、以及用于文档文体分类的表示词汇表项和概念之间的相互关系的推理链,所述文体分类包括所述推理链的子集,以及所述识别包括检查与比所述推理链的子集的各项的最低水平高的水平相关联的项。3.根据权利要求1所述的方法,还包括:基于与所述文档控制策略本体中的父节点的子节点相关联的多个文档控制策略的组合,导出用于所述文档控制策略本体中的所述父节点的文档控制策略,并且将导出的文档控制策略与所述文档控制策略本体中的所述父节点相关联。4.根据权利要求3所述的方法,其中所述导出的文档控制策略包括导出的安全策略和导出的保留策略,并且导出所述文档控制策略包括:组合与所述父节点的子节点相关联的安全策略的布尔值,以形成所述导出的安全策略;以及组合所识别的单独情况以形成所述导出的保留策略,所述所识别的单独情况是基于与子节点相关联的多个文档控制策略的关联变量。5.根据权利要求3所述的方法,其中所述导出包括:从与所述文档控制策略本体中的子节点相关联的多个文档控制策略中导出集合了策略组成的文档控制策略,默认为更保守的策略组成。6.根据权利要求3所述的方法,其中所述导出包括:递归地导出用于所述文档控制策略本体中的父节点的文档控制策略,直至根节点,并且其中所述导出和所述关联在部署所述文档控制策略本体之前执行。7.根据权利要求1所述的方法,其中所述推荐包括:输出多个推荐的文档控制策略以及对应的来自所述文档控制策略本体的推理链。8.根据权利要求1所述的方法,还包括:将来自多个推荐的文档控制策略的最高排名的文档控制策略自动应用于所述文档。9.一种系统,包括:用户接口设备;文档控制组件,包括包含文档控制策略的分级知识结构,所述文档控制策略包含根据与父节点的子节点相关联的规则的代数最大值而由所述父节点继承的至少一个文档控制策略;以及一个或多个计算机,其可操作为与所述用户接口设备和所述文档控制组件进行交互,以确定文档的文体分类,将所述文体分类与所述分级知识结构进行比较,以在包括所述父节点的多个节点中识别一个相关节点,并且基于在所述分级知识结构中识别的相关节点推荐至少一个文档控制策略来管理对所述文档的访问。10.根据权利要求9所述的系统,其中所述一个或多个计算机包括可操作为通过数据通信网络与所述用户接口设备进行交互的服务器,并且所述用户接口设备可操作为客户端与所述服务器进行交互。11.根据权利要求9所述的系统,其中所述一个或多个计算机包括一个个人计算机,并且所述个人计算机包括所述用户接口设备。12.根据权利要求9所述的系统,还包括:用于文档文体分类的文档文体本体,所述文档文体本体包括分级知识结构,所述分级知识结构包含项和概念的词汇表,以及表示词汇表项和概念之间的相互关系的推理链;应用程序接口(API),配置...

【专利技术属性】
技术研发人员:W钱格L马斯因特尔
申请(专利权)人:奥多比公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1