用于语言标签管理的方法和系统技术方案

技术编号:11507191 阅读:85 留言:0更新日期:2015-05-27 08:49
本公开提供了一种用于语言标签管理的方法和系统。根据本公开的一个方面,一种用于语言标签管理的方法和技术包括:访问标准化的语言标签存储库以识别存储库语言标签的变更;搜索使用语言标签而被分类的数据源的记录以识别在数据源的记录中存在的语言标签;确定在数据源的记录中存在的语言标签是否与存储库语言标签不一致;响应于确定在数据源的记录中存在的语言标签与存储库语言标签不一致,确定针对数据源的语言标签更新策略;以及根据语言标签更新策略对记录执行语言标签更新处理,以基于存储库语言标签对记录重新分类。

【技术实现步骤摘要】
用于语言标签管理的方法和系统
技术介绍
公共图书馆、国家数据仓库、公共服务资料库以及历史新闻数据库经常收集、分类和挖掘历史记录。元数据管理经常被用于数据分类。例如,语言标签已经被用在元数据中以便分等级、归档、分类和处理所收集的特定语言、脚本、领域和编码类别下的文本、图形、音频和视频流数据格式的国际文档。语言标签可以被嵌入和/或集成到所收集的信息中以支持联网信息处理和管理。具体地,在HTML和XML中,语言标签可以指示HTML和XML文档中的文本或其他项目的语言。
技术实现思路
根据本公开的一个方面,公开了一种用于国际数据存储库上的语言标签管理的方法和技术。该方法包括:访问标准化语言标签存储库以识别存储库语言标签中的变更;搜索使用语言标签分类的数据源的记录以识别数据源的记录中存在的语言标签;确定数据源的记录中存在的语言标签是否与存储库语言标签不一致;响应于确定数据源的记录中存在的语言标签与存储库语言标签不一致,确定针对数据源的语言标签更新策略;以及根据语言标签更新策略对记录执行语言标签更新处理以基于存储库语言标签对记录重新分类。附图说明为了更完整地理解本申请、其目的和优点,现在参考结合附图给出的以下描述,在附图中:图1是可以在其中实现本公开的说明性实施例的数据处理系统的网络的实施例;图2是可以在其中实现本公开的说明性实施例的数据处理系统的实施例;图3是示出可以在其中实现本公开的实施例的用于语言标签管理的数据处理系统的实施例的图;图4是示出根据本公开实施例的语言标签更新处理的图;图5是示出根据本公开的使用针对语言标签的抽象层的语言标签更新处理的另一个实施例的图;图6是示出根据本公开的用于语言标签管理的方法的流程图;并且图7是示出根据本公开的用于语言标签管理的方法的另一个实施例的流程图。具体实施方式本公开的实施例提供了一种用于国际数据存储库上的语言标签管理的方法、系统和计算机程序产品。例如,本公开的实施例能增强语言标签管理、在旧的元数据中更新新语言标签、并重新分类从全世界资源收集的数据。例如,本公开的实施例通过检测语言标签存储库中的新的语言标签、从语言标签存储库动态地同步本地语言标签表、以及根据为数据源建立的配置文件/策略使用新的语言标签动态地更新和/或重新分类所存储的数据,来使得具有语言标签的所存储的元数据能够被管理和/或更新。在一些实施例中,访问标准化语言标签存储库以识别存储库语言标签中的变更;搜索使用语言标签而分类的数据源的记录以识别数据源的记录中存在的语言标签;确定数据源的记录中存在的语言标签是否与存储库语言标签不一致;以及如果这样,则确定针对数据源的语言标签更新策略,根据语言标签更新策略对记录执行语言标签更新处理以基于存储库语言标签对记录重新分类。所属
的技术人员知道,本公开的各个方面可以实现为系统、方法或计算机程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本公开的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可用或计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。下面将参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本公开。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机或其它可编程数据处理装置以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品。计算机程序指令还可以加载到计算机、其它可编程数据处理装置或其他设备上,以使一系列操作步骤在计算机、其它可编程装置或其他设备上被执行以产生计算机实现的过程,使得在计算机或其它可编程装置上执行的指令提供用于实现流程图和/或框图中的一个或多个方框中规定的功能/动作的处理。现在参考附图并且特别参考图1-2,提供可以在其中实现本公开的说明性实施例的数据处理环境的示例性示图。应当理解的是,图1-2仅是示例性的并且并非旨在声称或暗示关于可以在其中实现不同实施例的环境的任何限制。可以对示出的环境进行许多修改。图1是可以在其中实现本公开的说明性实施例的数据处理系统的网络的图示。网络数据处理系统100是可以在其中实现本公开的说明性实施例的计算机网络。网络数据处理系统100包含网络130,其是用于提供网络数据处理系统100内连接在一起的各种设备和计算机之间的通信链路的介质。网络130可以包括连接,诸如有线、无线通信链路或光纤电缆。在一些实施例中,服务器140和服务器150与数据存储装置1本文档来自技高网
...
用于语言标签管理的方法和系统

【技术保护点】
一种方法,包括:访问标准化的语言标签存储库以识别存储库语言标签的变更;搜索使用语言标签而被分类的数据源的记录以识别在所述数据源的记录中存在的语言标签;确定在所述数据源的记录中存在的语言标签是否与所述存储库语言标签不一致;响应于确定在所述数据源的记录中存在的语言标签与所述存储库语言标签不一致,确定针对所述数据源的语言标签更新策略;以及根据所述语言标签更新策略对所述记录执行语言标签更新处理,以基于所述存储库语言标签对所述记录重新分类。

【技术特征摘要】
2013.11.20 US 14/0848901.一种用于语言标签管理的方法,包括:访问标准化的语言标签存储库以识别存储库语言标签的变更;搜索使用语言标签而被分类的数据源的记录以识别在所述数据源的记录中存在的语言标签;确定在所述数据源的记录中存在的语言标签是否与所述存储库语言标签不一致;响应于确定在所述数据源的记录中存在的语言标签与所述存储库语言标签不一致,确定针对所述数据源的语言标签更新策略;以及根据所述语言标签更新策略对所述记录执行语言标签更新处理,以基于所述存储库语言标签对所述记录重新分类;其中所述语言标签更新处理包括:响应于确定所述数据源的记录中存在旧的/无效语言标签,创建针对旧的/无效语言标签的语言标签参考元数据,将参考元数据链接到所述数据源的记录中的相关语言标签。2.如权利要求1所述的方法,其中所述语言标签更新处理包括:自动地利用对应的存储库语言标签替换所述数据源的记录中的语言标签。3.如权利要求1所述的方法,还包括:在所述标准化的语言标签存储库中监视对存储库语言标签的变更;以及响应于检测到对所述存储库语言标签的变更,自动地更新具有所述存储库语言标签的变更历史的语言标签表。4.如权利要求3所述的方法,还包括:基于所述语言标签表中的所述变更历史,识别所述数据源的记录中的与所述存储库语言标签不一致的语言标签。5.如权利要求3所述的方法,还包括:在所述数据源中监视添加的记录;响应于检测到添加的记录,基于所述语言标签表来确定所述添加的记录是否具有与所述存储库语言标签不一致的语言标签;以及响应于确定所述添加的记录具有与所述存储库语言标签不一致的语言标签,自动地根据所述语言标签更新策略对所述添加的记录执行所述语言标签更新处理。6.如权利要求1所述的方法,还包括:在完成所述语言标签更新处理时,自动地基于所述存储库语言标签来验证所述数据源的记录的重新分类。7.一种用于语言标签管理的系统...

【专利技术属性】
技术研发人员:A·Y·伯格米尔刘速K·魏德曼
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1