利用索引串匹配的上下文盲数据转换制造技术

技术编号：11628701 阅读：91 留言：0更新日期：2015-06-18 20:22

用于将数据从第一形式转换到第二形式而不用参考要被转换的数据上下文的基于计算机的工具和方法。该转换可以通过将源数据与包括用于数据转换的规则(例如，特定于上下文的规则)的外部信息(例如，公共和/或私有模式)相匹配来促进。匹配可以基于优化的索引串匹配技术来执行，该技术可操作以将源数据匹配到上下文相关的外部信息，而无需具体识别源数据或识别的外部信息的上下文。相应地，数据转换可以在无监督机器学习环境中执行。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】对相关申请的交叉引用本申请是于2012年8月28日提交的标题为"SCALABLESTRINGMATCHINGASA COMPO肥NTFORUNSU阳RVIS邸LEARNINGINSEMANTICMETA-M孤化DEVELOPMENT"的美国专利申请No. 13/596,844的部分接续，该专利全部内容通过引用被完整地结合于此。
本公开内容一般而言设及使用基于计算机的工具将数据从第一形式转换到第二形式，并且更具体而言，设及可W与无监督学习过程关联地利用索引串匹配，W通过利用至少部分地基于上下文相关模式与在转换源数据时使用的源数据的索引串匹配而选择的模式来转换上下文不确定数据的基于计算机的工具。
技术介绍
在各种应用中，可能希望将数据从第一（或输入）形式转换到第二（或目标）形式。该种转换可W包括，例如，数据相对于语言学、句法和/或格式的改变。在该点上，语言学差异可能是由于使用了不同的语言，或在单个语言中，由于对术语、专有名称、缩写、特质 (idiosyncratic)短语或结构、W及特定于位置、区域、业务实体或单元、贸易、组织等其它事物的不同用法。对于当前意图，在语言学的范围内的差异还包括不同的货币、不同的重量和量度单位W及其它系统的差异。句法可能设及词语的分句（phrasing)、次序和组织，W及与其相关的语法和其它规则。格式差异可能设及与数据库或其它应用及相关工具相关联的数据结构或约定。可W与转换过程关联有利地解决一个或多个该些形式上的差异。转换环境的一些例子包括：将数据从一个或多个遗留系统导入到目标系统中；...

【技术保护点】
一种用于在操作将数据从第一形式转换到第二形式的基于计算机的工具中使用的方法，包括：利用基于计算机的工具，识别要从第一形式转换到第二形式的数据集合，其中所述数据集合是上下文不确定的；利用基于计算机的工具，访问多个模式，每个模式包括用于在数据的特定上下文中转换数据的一个或多个转换规则，其中所述一个或多个转换规则至少部分地基于所述特定上下文；利用基于计算机的工具，利用独立于所述数据集合和所述多个模式的上下文执行的索引串匹配，将所述数据集合与所述多个模式的至少一部分进行比较；利用基于计算机的工具，至少部分地基于所述比较，从所述多个模式中选择选定的模式；将所述选定的模式的一个或多个转换规则应用到所述数据集合，以将所述数据集合从所述第一形式转换到所述第二形式。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：P·戈伦，L·里瓦斯，E·A·格林，
申请(专利权)人：甲骨文国际公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人