信息处理方法、系统和装置制造方法及图纸

技术编号:13911033 阅读:68 留言:0更新日期:2016-10-27 03:02
本申请涉及信息处理方法、系统和装置,并具体提供了一种方法,其中知识管理器生成包括安全注释令牌和术语令牌的知识结构。安全注释令牌中的每一个被存储在并行字段中,并对齐到术语令牌中的至少一个。知识管理器将对应于搜索请求的安全策略与安全注释令牌中的一个或多个进行匹配,并进而基于对齐到所匹配的安全注释令牌的术语令牌中的一个或多个术语令牌的模糊化来生成搜索结果。

【技术实现步骤摘要】

技术介绍
文档安全是描述保护文档不被未授权用户使用的通用术语。传统地,作为防止未授权的查看的简单方法,文档创建器可以密码保护文档。使用这种传统的方法,用户可以键入正确的密码并查看整个文档。否则,用户被禁止查看该文档的任何部分。信息检索和问题应答系统从许多源吸取文档以创建从中获取结果的知识库。文档可以具有取决于知识库的领域的变化的分类级别。例如,公司或军事知识库可以包括秘密(confidential)、机密(secret)和绝密(top secret)文档。在另一示例中,医学知识库可以包括具有诸如社会安全号、保险信息等的敏感患者信息的医学文档。信息检索和问题应答系统对文档添加注释,作为将元数据、实体信息或附加知识并入搜索以提高信息查全和应答精确性的方式。软件开发者可以使用各种方法来将注释链接到文档,诸如通过将注释存储为文档级别的元数据、将注释存储在分开的结构化资源中、或者通过将注释直接嵌入到文档中来修改文档。
技术实现思路
根据本公开内容的一个实施例,提供了这样一种方法,在该方法中,知识管理器生成包括安全注释令牌和术语令牌的知识结构。每个安全注释令牌被存储在并行字段中,并与至少一个术语令牌对齐。知识管理器将对应于搜索请求的安全策略与一个或多个安全注释令牌匹配,并且进而基于对与所匹配的安全注释令牌对齐的一个或多个术语令牌的模糊化来生成搜索结果。前述是概要,并因而必然包含简化、概括和对细节的省略;因此,本领域技术人员将认识到,该概要仅是说明性的,并且不是旨在以任何
方式进行限定。仅通过权利要求限定的本公开内容的其它方面、专利技术性特征和优点将在以下阐述的非限定性详细描述中变得清楚。附图说明通过参考附图,本公开内容可以被更好地理解,并且其众多对象、特征和优点对本领域技术人员而言变得清楚,其中:图1描绘了计算机网络中的知识管理器系统的一个说明性实施例的示意图;图2示出了信息处理系统,更具体地示出了处理器和公共部件,该信息处理系统是能够执行本文所描述的计算操作的计算机系统的简化示例;图3是描绘知识管理器的示例性图,该知识管理器创建包括与术语令牌对齐的安全注释令牌的知识结构,并通过匹配安全令牌与安全策略来使用该知识结构提供精细粒度的已过滤结果;图4是描绘与安全行为子系统对接以提供对搜索请求的已过滤应答的查询子系统的示例性图;图5是描绘由源文档预处理子系统处理的文档的示例性图;图6是描绘知识管理器从已预处理的文档生成的知识结构的示例性图;图7是描绘提供对搜索请求的特定于术语的已过滤应答的查询子系统的示例性图;图8是描绘包括敏感患者信息的医学文档的示例性图;图9是描绘基于请求者的信用的患者文档的各种视图的示例性图;图10是描绘由知识管理器采取以在文档吸取期间将安全注释令牌添加到并行字段中并生成可搜索知识结构的步骤的示例性流程图;图11是显示由知识管理器采取以使用原始文本和对应的注释来生成知识结构的步骤的流程图;和图12是显示在处理搜索请求并基于文档的存储在一组并行字段中的安全注释令牌来过滤该文档的步骤的示例性流程图。具体实施方式本文使用的术语仅是为了描述特定实施例的目的,并非旨在限制本公开内容。如本文所使用的,单数形式的“一”、“一个”和“这个”旨在也包括复数形式,除非上下文以其他方式明确指出。将进一步理解到,当用在本说明书中时,术语“包括”和/或“包含”规定所指明的特征、整体、步骤、操作、元件和/或部件的存在,但不排除一个或多个其它特征、整体、步骤、操作、元件、部件和/或前述这些的组的存在或添加。在下面的权利要求中的所有单元或步骤加上功能元件的对应结构、材料、行为和等同形式旨在包括用于结合具体要求保护的其它受保护元件来执行功能的任何结构、材料或行为。本公开内容的说明书是为了说明和描述目的给出,而非旨在穷尽或者被限定为所公开的形式下的本公开内容。在不脱离本公开内容的范围和精神的情况下,各种修改和变型对本领域技术人员而言是清楚的。选择和描述实施例是为了最好地解释本公开内容的原理和可行的应用,以及为了使本领域其他技术人员能够理解本公开内容的具有适合于所构想的特定用途的各种修改的各种实施例。本专利技术可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本专利技术的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储
有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。用于执行本专利技术操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、可能的应答设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的可能的应答信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本专利技术的各个方面。这里参照根据本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本专利技术的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算
机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,本文档来自技高网
...

【技术保护点】
一种由信息处理系统实现的方法,所述信息处理系统包括存储器和处理器,所述方法包括:创建包括多个安全注释令牌和多个术语令牌的知识结构,其中所述多个安全注释令牌中的每一个安全注释令牌被存储在对应于所述多个术语令牌中的至少一个术语令牌的多个并行字段的至少一个并行字段中;将对应于搜索请求的一个或多个安全策略与所述多个安全注释令牌中的一个或多个安全注释令牌进行匹配;以及基于每个术语令牌都对应于所匹配的一个或多个安全注释令牌中的至少一个安全注释令牌的所述多个术语令牌的子集的模糊化,生成对所述搜索请求的一个或多个应答。

【技术特征摘要】
2015.04.16 US 14/688,9851.一种由信息处理系统实现的方法,所述信息处理系统包括存储器和处理器,所述方法包括:创建包括多个安全注释令牌和多个术语令牌的知识结构,其中所述多个安全注释令牌中的每一个安全注释令牌被存储在对应于所述多个术语令牌中的至少一个术语令牌的多个并行字段的至少一个并行字段中;将对应于搜索请求的一个或多个安全策略与所述多个安全注释令牌中的一个或多个安全注释令牌进行匹配;以及基于每个术语令牌都对应于所匹配的一个或多个安全注释令牌中的至少一个安全注释令牌的所述多个术语令牌的子集的模糊化,生成对所述搜索请求的一个或多个应答。2.根据权利要求1所述的方法,还包括:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的搜索限制策略;以及在知识库的搜索期间,省略所述术语令牌的子集。3.根据权利要求1所述的方法,还包括:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的评分限制策略;以及在对与所述一个或多个应答对应的一个或多个搜索结果评分期间,省略所述术语令牌的子集。4.根据权利要求1所述的方法,还包括:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的片段授权安全策略;以及基于所述片段授权安全策略,删除一个或多个候选应答。5.根据权利要求1所述的方法,还包括:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的可视化安全策略;以及显示所述一个或多个应答的遮盖所述术语令牌的子集中的一个或多个术语令牌的经修改的一个应答。6.根据权利要求5所述的方法,还包括:利用一个或多个安全警告消息替换所遮盖的一个或多个术语令牌。7.根据权利要求1所述的方法,其中,在创建所述知识结构之前,所述方法还包括:基于文档的一个或多个文档特性,向所述文档分配多个安全注释标签;从所述多个安全注释标签中生成所述多个安全注释令牌;以及从被包括在所述文档中的多个术语中生成所述多个术语令牌。8.一种信息处理系统,包括:一个或多个处理器;耦合到所述处理器中的至少一个处理器的存储器;以及一组计算机程序指令,所述计算机程序指令被存储在所述存储器中并由所述处理器中的至少一个处理器执行以便执行以下动作:创建包括多个安全注释令牌和多个术语令牌的知识结构,其中所述多个安全注释令牌中的每一个安全注释令牌被存储在对应于所述多个术语令牌中的至少一个术语令牌的多个并行字段的至少一个并行字段中;将对应于搜索请求的一个或多个安全策略与所述多个安全注释令牌中的一个或多个安全注释令牌进行匹配;以及基于每个术语令牌都对应于所匹配的一个或多个安全注释令牌中的至少一个安全注释令牌的所述多个术语令牌的子集的模糊化,生
\t成对所述搜索请求的一个或多个应答。9.根据权利要求8所述的信息处理系统,其中所述一个或多个处理器中的至少一个处理器执行包括以下的附加动作:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的搜索限制策略;以及在知识库的搜索期间,省略所述术语令牌的子集。10.根据权利要求8所述的信息处理系统,其中所述一个或多个处理器中的至少一个处理器执行包括以下的附加动作:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的评分限制策略;以及在对与所述一个或多个应答对应的一个或多个搜索结果评分期间,省略所述术语令牌的子集。11.根据权利要求8所述的信息处理系统,其中所述一个或多个处理器中的至少一个处理器执行包括以下的附加动作:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的片段授权安全策略;以及基于所述片段授权安全策略,删除一个或多个候选应答。12.根据权利要求8所述的信息处理系统,其中所述一个或多个处理器中的至少一个处理器执行包括以下的附加动作:确定所述一个或多个安全策略中的至少一个安全策略是对应于所匹配的一个或多个安全注释令牌的可视化安全策略;以及显示所述一个或多个应答的遮盖所述术语令牌的子集中的一个或多个术语令牌的经修改的一个应答。13.根据权利要求12所述的信息处理系统,其中所述一个或多个处
\t理器中的至少一个处理器执行包括以下的附加动作:利用一个或多个安全警告消息替换所遮盖的一个或多个术语令牌。14.根据权利要求8所述的信息处理系统,其中在创建所述知识结构之前,所述一个或多个处理器中的至少一个处理器执行包括以下的附加动作:基于文档的一个或多个文档特性,向所述文档分配多个安全注释标签;从所述多个安全注释标签中生成所述多个安全注释令牌;以及从被包括在所述文档中的多个术语中生成所述多个术语令牌。15.一种信息处理装置,包括:用于创建包括多个安全注释令牌和多个术语令牌的知识结构的模块,其中所述多个安全注释令牌中的...

【专利技术属性】
技术研发人员:B·B·比莫恩B·M·德布罗尼O·F·费罗蒂B·J·基莱C·M·诺拉恩
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1