数据去识别处理装置及方法制造方法及图纸

技术编号:28447430 阅读:28 留言:0更新日期:2021-05-15 21:08
一种数据去识别处理装置及方法。该数据去识别处理装置储存一第一产业领域的一数据集,其中该数据集定义多个栏位。该数据去识别处理装置接收一第一指令及一第二指令,其中该第一指令对应至一第二产业领域,且该第二指令对应至一数据用途。该数据去识别处理装置根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一识别分类,根据该数据用途将该数据集转换为一转换数据集,且根据该等识别分类将该转换数据集转换为一去识别数据集。将该转换数据集转换为一去识别数据集。将该转换数据集转换为一去识别数据集。

【技术实现步骤摘要】
数据去识别处理装置及方法


[0001]本专利技术系关于一种数据去识别处理装置及方法。更具体而言,本专利技术系关于一种基于产业领域及数据用途的数据去识别处理装置及方法。

技术介绍

[0002]随着大数据时代的来临,愈来愈多的企业会收集各种数据加以分析,再依据分析的结果作出业务上的决策(例如:银行业者会基于使用者的银行存款及消费行为决定是否给予信用贷款)。然而,企业自有的数据的广度相当有限,跨领域整合数据以作出更精准的决策、创造更多的价值,势必为未来的趋势。由于企业所分析的数据往往具有个人身份(例如:姓名)或其他需要被保护的信息(例如:地址、收入),因此在跨领域整合数据时,必须要进行去识别处理,且必须符合不同领域的规范(简称为合规),以避免侵害个资所属人的人格权及相关金融法规。
[0003]习知的数据去识别处理技术主要是删除、加密或上位化可直接识别的数据(例如:姓名、身份证号码)或只显示一部分的数据(例如:数值中的某几位数),然而此种处理方式将使得处理过后的数据,难以用来对特定用途来进行评估(例如:评估是否给予使用者信用贷款)。这些习知的数据去识别处理技术皆未考虑到跨领域整合数据时需要跨领域合规,且未考虑到在合规的同时仍需要达到数据赋能的技术效果,亦即在将数据进行去识别处理之后,仍可用来对特定用途进行评估。有鉴于此,本领域仍亟需一种跨领域整合数据且跨领域合规的数据去识别处理技术。

技术实现思路

[0004]本专利技术的一目的在于提供一数据去识别处理装置。该数据去识别处理装置包含一储存器、一输入接口及一处理器,其中该处理器电性连接至该储存器及该输入接口。该储存器储存一第一产业领域的一数据集,其中该数据集定义多个栏位。该输入接口接收一第一指令及一第二指令,其中该第一指令对应至一第二产业领域,且该第二指令对应至一数据用途。该处理器根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一识别分类,根据该数据用途将该数据集转换为一第一转换数据集,且根据该等识别分类将该第一转换数据集转换为一第一去识别数据集。
[0005]本专利技术的另一目的在于提供一数据去识别处理方法,其系适用于一电子计算装置。该电子计算装置储存一第一产业领域的一数据集,且该数据集定义多个栏位。该数据去识别处理方法包含下列步骤:(a)接收一第一指令,其中该第一指令对应至一第二产业领域,(b)接收一第二指令,其中该第二指令对应至一数据用途,(c)根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一识别分类,(d)根据该数据用途将该数据集转换为一第一转换数据集,以及(e)根据该等识别分类将该第一转换数据集转换为一第一去识别数据集。
[0006]本专利技术所提供的数据去识别处理技术(至少包含装置及方法)会根据一数据用途
对某一产业领域的数据集进行转换,且会根据至少二个产业领域及该数据用途对数据集进行去识别处理。经前述转换及去识别处理过后的数据集具有更丰富、更有利于该数据用途的信息,因此利用经前述转换及去识别处理过后的数据集所建立的用途评估模型将能作出更精准的决策、创造更多的价值。此外,由于本专利技术所提供的数据去识别处理技术在进行去识别处理时考量了所涉及的产业领域与数据用途的法律规范,因此经前述转换及去识别处理过后的数据集也就跨领域地符合规定。
[0007]以下结合附图阐述本专利技术的技术及实施方式,俾使本领域的技术人员能理解所请求保护的专利技术的技术特征。
附图说明
[0008]图1A描绘第一实施方式的数据去识别处理装置1的架构示意图;
[0009]图1B描绘数据集D的一具体范例;
[0010]图1C描绘转换数据集TD的一具体范例;
[0011]图1D描绘去识别数据集DD的一具体范例;以及
[0012]图2描绘第二实施方式的数据去识别处理方法的主要流程图。
[0013]附图标记说明
[0014]1:数据去识别处理装置
[0015]10:指令
[0016]11:储存器
[0017]12:指令
[0018]13:输入接口
[0019]15:处理器
[0020]17:传输接口
[0021]A1、A2、A3、A4、A5:栏位
[0022]D:数据集
[0023]DD:去识别数据集
[0024]Ra、
……
、Rz:记录
[0025]TD:转换数据集
[0026]S201~S209:步骤
具体实施方式
[0027]以下将透过实施方式来解释本专利技术所提供的数据去识别处理装置及方法。然而,该等实施方式并非用以限制本专利技术需在如该等实施方式所述的任何环境、应用或方式方能实施。因此,关于以下实施方式的说明仅在于阐释本专利技术的目的,而非用以限制本专利技术的范围。应理解,在以下实施方式及附图中,与本专利技术非直接相关的元件已省略而未绘示,且附图中各元件的尺寸以及元件间的尺寸比例仅为便于绘示及说明,而非用以限制本专利技术的范围。
[0028]本专利技术的第一实施方式为一数据去识别处理装置1,其架构示意图系描绘于图1A。数据去识别处理装置1包含一储存器11、一输入接口13及一处理器15,且处理器15电性连接
至储存器11及输入接口13。储存器11可为一记忆体、一硬盘(Hard Disk Drive;HDD)、一通用串行总线(Universal Serial Bus;USB)盘、一光盘(Compact Disk;CD)或本领域的技术人员所知的任何其他具有雷同功能的非暂态储存媒体或装置。输入接口13可为任何可供使用者输入信息的接口,例如:滑鼠、键盘、触控式显示屏幕。处理器15可为各种处理器、中央处理单元(Central Processing Unit;CPU)、微处理器(Microprocessor Unit;MPU)、数字信号处理器(Digital Signal Processor;DSP)或本领域的技术人员所知的任何其他具有雷同功能的计算装置。
[0029]数据去识别处理装置1会针对要用于跨领域整合的数据集进行数据转换(例如:基于原有的数据提供额外的信息,容后详述)及去识别处理,使处理过后的数据集具有更丰富的信息,且符合所整合的产业领域与数据用途的法律规范(例如:網絡安全法規及其他相关金融法规,但不以此为限)。
[0030]于本实施方式中,数据去识别处理装置1的储存器11储存一第一产业领域(未绘示)的一数据集D。数据集D定义多个栏位且包含多笔记录,其中各笔记录包含多个数据一对一的对应至该等栏位。请参图1B,其系描绘数据集D的一具体范例。该具体范例将用于后续的说明,但应理解其非用以限制本专利技术的范围。于该具体范例中,数据集D定义五个栏位A1、A2、A3、A4、A5且包含多笔记录Ra、
……
、Rz,其中记录Ra、
……
、Rz各自包含多个数据一对一地对应至栏位A1、A2、A3、A4、A5。
[0031]使用者可透过输入接口13输入一指令10,且指令10本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据去识别处理装置,其特征在于,包含:一储存器,储存一第一产业领域的一数据集,其中该数据集定义多个栏位;一输入接口,接收一第一指令及一第二指令,其中该第一指令对应至一第二产业领域,该第二指令对应至一数据用途;以及一处理器,电性连接至该储存器及该输入接口,根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一识别分类,根据该数据用途将该数据集转换为一第一转换数据集,且根据该等识别分类将该第一转换数据集转换为一第一去识别数据集。2.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器还根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一敏感分类,其中该处理器系根据该等识别分类及该等敏感分类将该第一转换数据集转换为该第一去识别数据集。3.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器系藉由以下运作将该数据集转换为该第一转换数据集:根据该数据用途决定一指定栏位的一数据转换方式,且将该指定栏位所对应的多笔数据以对应的该数据转换方式转换。4.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器系藉由以下运作将该第一转换数据集转换为该第一去识别数据集:根据各该栏位的该识别分类决定各该栏位的一去识别处理方式,且将该第一转换数据集中各该栏位所对应的多笔数据以对应的该去识别处理方式来进行去识别处理。5.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器还对该第一去识别数据集执行一去识别检测。6.如权利要求5所述的数据去识别处理装置,其特征在于,该去识别检测包含一K匿名检测、一L多样性检测及一T相似性检测的至少其中之一。7.如权利要求5所述的数据去识别处理装置,其特征在于,该处理器还根据该数据用途决定该等栏位的一重要性排序,当该处理器还判断该第一去识别数据集未通过该去识别检测时,该处理器还根据该重要性排序决定该第一去识别数据集所包含的至少一栏位以进行一进阶去识别处理。8.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器还以一自动编码器从该第一去识别数据集撷取多个特征值,且该处理器还利用该特征值预测该第一去识别数据集于该数据用途的一建模效果。9.如权利要求8所述的数据去识别处理装置,其特征在于,当该建模效果低于一门槛值时,该处理器还根据该数据用途将该数据集转换为一第二转换数据集,且根据该等识别分类将该第二转换数据集转换为一第二去识别数据集,其中该处理器系根据该数据用途决定该等栏位中的一指定栏位的一数据转换方式,且该处理器于转换该第一转换数据集和该第二转换数据集时系采用不同的数据转换方式来将该指定栏位所对应的多笔数据进行转换。10.如权利要求1所述的数据去识别处理装置,其特征在于,还包含:一传输接口,电性连接至该处理器,且传送该第一去识别数据集至一建模装置;其中,该建模装置于接收该第一去识别数据集和对应该第二产业领域的一第三去识别数据集后,建立对应该数...

【专利技术属性】
技术研发人员:叶育惠谷圳杨秉哲吕宜颖罗至善
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1