利用对加密匹配索引进行的精确和模糊匹配来检测重复制造技术

技术编号:27696236 阅读:18 留言:0更新日期:2021-03-17 05:24
本文公开了系统、方法和计算机程序产品实施方案,其用于在云计算平台中使用加密密钥利用对加密匹配索引的精确和模糊匹配而检测重复。实施方案通过在接收到新记录时确定匹配规则索引值而进行操作。实施方案使用客户的加密密钥和确定性加密方法对匹配索引规则值进行加密,并且存储加密的匹配规则索引值。稍后可以通过如下来执行重复检测:使用相同的确定性加密方法确定候选条目的密文,并且将该密文与存储的加密匹配索引进行比较。

【技术实现步骤摘要】
【国外来华专利技术】利用对加密匹配索引进行的精确和模糊匹配来检测重复
技术介绍
一般而言,组织或个人可以利用云计算平台管理与客户的关系。这样的云计算平台可以被称为客户关系管理(CRM)解决方案。CRM解决方案可以包括各种特征,比如联系人管理、销售管理和生产力工具,以更好地跟踪和分析与客户和潜在客户的交互(interaction)。CRM解决方案可以积累大量数据以支持这些特征。保持该数据干净、最新并且无重复优化和提高了CRM解决方案的性能和分析效用。然而,清洁数据可能存在挑战。例如,出于数据安全的目的,在客户需要使用他们控制的密钥(encryptionkey)加密数据的情况下,CRM解决方案可以利用客户的密钥加密特定的静止(atrest)数据字段或静止实体。这样的租户级(tenant-level)加密可能使CRM解决方案中的重复检测和消除进一步复杂化。附图说明附图被并入本文并且形成说明书的一部分。图1是根据一些实施方案的云计算系统的框图。图2反映了根据一些实施方案的在云计算平台中检测到的重复的屏幕截图。图3反映了根据一些实施方案的云计算平台中的标准字段的加密配置屏幕的屏幕截图。图4反映了根据一些实施方案的云计算平台中的自定义字段(customfield)的加密配置屏幕的屏幕截图。图5反映了根据一些实施方案的云计算平台中的匹配规则的屏幕截图。图6是示出根据一些实施方案的当在云计算平台中添加新记录时的重复检测方法的流程图。图7是示出根据一些实施方案的创建和加密待被用于重复检测的匹配索引的方法的流程图。图8是对实现各种实施方案有用的示例计算机系统。在附图中,相同的附图标记通常表示相同或相似的元件。另外,通常,附图标记的最左边的数字(一个或多个)标识附图标记首次出现的附图。具体实施方式如下详细描述参考附图以说明与本公开一致的示例性实施方案。在详细描述中对“一个示例性实施方案”、“示例性实施方案”、“示例实施方案”等的引用指示描述的示例性实施方案可以包括特定的特征、结构或特性,但是每个示例性实施方案不必包括特定的特征、结构或特性。此外,这样的短语不需要指的是相同的示例性实施方案。此外,当本公开结合示例性实施方案描述特定特征、结构或特性时,相关领域的技术人员将知道如何结合其它示例性实施方案影响这些特征、结构或特性,无论是否明确描述。本文描述的示例性实施方案提供了说明性示例而不是限制性的。其它示例性实施方案是可能的,并且可以在本公开的精神和范围内对示例性实施方案进行修改。因此,详细描述不限制本公开。相反,所附权利要求及其等同物限定了本公开的范围。可以使用硬件(例如,电路)、固件、软件或其任意组合实现实施方案。实施方案还可以被实现为存储在机器可读介质上并且由一个或多个处理器读取和执行的指令。机器可读介质包括用于以机器(例如,计算装置)可读形式存储或传输信息的任何机制。例如,在一些实施方案中,机器可读介质包括只读存储器(ROM);随机存取存储器(RAM);磁盘存储媒体;光学存储媒体;闪存装置;电、光、声或其它形式的传播信号(例如,载波、红外信号、数字信号等)等。此外,固件、软件、例程和/或指令可以在本文被描述为执行某些动作。然而,这些描述仅仅是为了方便,并且这些动作由计算装置、处理器、控制器或执行固件、软件、例程和/或指令的其它装置产生。此外,如下所述,可以由通用计算机执行任何实现变化。对术语“模块”的任何引用应当理解为包括软件、固件和硬件(比如一个或多个电路、微芯片或装置,或其任意组合)中的至少一个或其任意组合。此外,相关领域的技术人员将理解,每个模块可以包括实际装置内的一个或多于一个部件,并且形成描述的模块的一部分的每个部件可以协作地或独立于形成模块的一部分的任何其他部件而工作。相反,在此描述的多个模块可以表示实际装置内的单个部件。此外,模块内的部件可以是单个装置或以有线或无线方式分布在多个装置之间。示例性实施方案的以下详细描述将充分揭示本公开内容的一般性质,使得其他人可以通过应用相关领域的技术人员的知识,针对各种应用容易地修改和/或定制这样的示例性实施方案,而不需要过度的实验并且不脱离本公开的精神和范围。因此,基于在此给出的教导和指导,这些修改落入示例性实施方案的意义和多个等同物之内。在此,措辞或术语用于描述而非限制的目的,使得本说明书的术语或措辞应当由相关领域的技术人员根据本文的教导来解释。本文提供了系统、设备、装置、方法和/或计算机程序产品实施方案,和/或其组合和子组合,用于实现在云计算平台中使用加密匹配索引(encryptedmatchindex)的重复检测。组织可以利用云计算平台作为CRM解决方案以管理与客户的关系。云计算平台可以允许组织跟踪和分析与客户的交互、增加销售、管理联系人以及更好地计划未来。云计算平台可以组织客户服务流和供应链管理,并且可以监测社交媒体流以确定潜在客户。通过经由这样的云计算平台跟踪与客户的交互,组织可以最终提高盈利能力、消除过程低效和/或以其他方式提高组织能力。云计算平台可以存储与组织、销售、客户、供应商、竞争者、线索(lead)等相关的各种各样的和大量的数据字段。仅作为示例,云计算平台可以存储与联系信息、客户偏好、社交媒体数据、客户购买记录、服务记录、客户交互、营销活动、销售目标、组织目的、销售数据、盈利能力分析、商业线索/机会等有关的字段。字段可以是标准字段,例如联系人、帐户、线索和机会,或是由组织为适应其自己的组织要求的特殊目的而设计和使用的自定义字段。由于该数据的潜在敏感特性,云计算平台可以支持数据加密。加密使用密钥(key)和初始化向量(initializationvector),同时将字段的原本可读的字母数字数据(即,明文)翻译为加密形式(即,密文),该加密形式对于不知道密钥和初始化向量的实体是不可读的。云计算平台然后存储密文的加密形式。当获取存储的数据时,云计算平台可以使用密钥和初始化向量来解密密文。标准字段和自定义字段均可以被加密。组织可以在加密方法之间选择(例如,确定性(deterministic)和/或概率性(probabilistic))以加密数据字段。对于给定的明文和密钥,确定性加密方案总是产生相同的密文。概率性加密方案在加密过程中利用随机性,给定相同的明文和密钥产生不同的密文。组织还具有在云计算平台中维持纯净数据(cleandata)的兴趣。纯净数据提高了可用性,防止了错误,维持了系统完整性,并且增强了分析能力。维持纯净数据的一个方面是消除给定数据集中的重复。可以通过运行重复消除作业来全局地管理重复检测。重复检测也可以发生在逐表或逐例的基础上。当向云计算平台添加新记录时,可以自动发生重复检测。云计算平台可利用匹配规则检测非法记录。匹配规则可以检查云计算平台中的特定字段或若干字段。匹配规则可以是标准的或定制的(即,用户定义的)。标准匹配规则可以检查给定数据实体的预定字段以确定是否存在重复。例如,针对云计算平台中联系人的标准化匹配规则可以检本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n由云计算平台接收包括一个或多个字段的新记录;/n由所述云计算平台选择适用于所述新记录的匹配规则,所述匹配规则包括唯一标识符、一个或多个匹配类型和一个或多个适用字段;/n由所述云计算平台计算匹配索引值,其中所述匹配索引值是在所述新记录中的一个或多个字段中接收的一个或多个适用字段的组合;/n由所述云计算平台导出加密匹配索引值,其中所述匹配规则的唯一标识符被用作加密方案中的初始化向量,并且所述匹配索引值被用作加密方案中的明文;和/n由所述云计算平台将加密匹配索引值存储在加密匹配索引列中。/n

【技术特征摘要】
【国外来华专利技术】20180531 US 62/678,812;20180703 US 16/026,8191.一种方法,包括:
由云计算平台接收包括一个或多个字段的新记录;
由所述云计算平台选择适用于所述新记录的匹配规则,所述匹配规则包括唯一标识符、一个或多个匹配类型和一个或多个适用字段;
由所述云计算平台计算匹配索引值,其中所述匹配索引值是在所述新记录中的一个或多个字段中接收的一个或多个适用字段的组合;
由所述云计算平台导出加密匹配索引值,其中所述匹配规则的唯一标识符被用作加密方案中的初始化向量,并且所述匹配索引值被用作加密方案中的明文;和
由所述云计算平台将加密匹配索引值存储在加密匹配索引列中。


2.根据权利要求1所述的方法,进一步包括:
由所述云计算平台接收匹配规则参数,所述匹配规则参数包括所述一个或多个匹配类型和所述一个或多个适用字段;
由所述云计算平台基于所述一个或多个适用字段创建所述唯一标识符;和
由所述云计算平台存储定制匹配规则,所述定制匹配规则包括所述唯一标识符、所述一个或多个匹配类型和所述一个或多个适用字段。


3.根据权利要求1所述的方法,进一步包括:
由所述云计算平台将加密匹配索引值与所述加密匹配索引列中的现有值进行比较,以确定所述加密匹配索引值是否与一个或多个现有值重复;和
如果所述加密匹配索引值与所述一个或多个现有值中的现有值重复,则由所述云计算平台显示错误消息。


4.根据权利要求1所述的方法,进一步包括:
如果针对所述一个或多个字段中的任何一个未启用加密,则由所述云计算平台以未加密的形式存储所述匹配索引值。


5.根据权利要求1所述的方法,进一步包括:
由所述云计算平台扫描加密匹配索引列以确定一个或多个重复;和
由所述云计算平台在网络界面中向用户显示所述一个或多个重复。


6.根据权利要求1所述的方法,其中所述一个或多个匹配类型可以是精确型或模糊型。


7.根据权利要求1所述的方法,其中所述加密方案是确定性方案。


8.根据权利要求1所述的方法,其中所述云计算平台是客户关系管理平台。


9.一种系统,包括:
存储器;和
至少一个处理器,其耦合至所述存储器并且配置为:
在云计算平台中接收包括一个或多个字段的新记录;
选择适用于所述新记录的匹配规则,所述匹配规则包括唯一标识符、一个或多个匹配类型和一个或多个适用字段;
计算匹配索引值,其中所述匹配索引值是在所述新记录中的一个或多个字段中接收的所述一个或多个适用字段的组合,和
导出加密匹配索引值,
其中所述匹配规则的唯一标识符被用作加密方案中的初始化向量,并且...

【专利技术属性】
技术研发人员:A·赫尚斯S·谢尔C·克尔P·V·瓦伊什纳芙A·本古尔V·W·刘D·麦加里S·萨尼科穆
申请(专利权)人:易享信息技术有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1