【技术实现步骤摘要】
数据去识别处理装置及方法
[0001]本专利技术系关于一种数据去识别处理装置及方法。更具体而言,本专利技术系关于一种基于产业领域及数据用途的数据去识别处理装置及方法。
技术介绍
[0002]随着大数据时代的来临,愈来愈多的企业会收集各种数据加以分析,再依据分析的结果作出业务上的决策(例如:银行业者会基于使用者的银行存款及消费行为决定是否给予信用贷款)。然而,企业自有的数据的广度相当有限,跨领域整合数据以作出更精准的决策、创造更多的价值,势必为未来的趋势。由于企业所分析的数据往往具有个人身份(例如:姓名)或其他需要被保护的信息(例如:地址、收入),因此在跨领域整合数据时,必须要进行去识别处理,且必须符合不同领域的规范(简称为合规),以避免侵害个资所属人的人格权及相关金融法规。
[0003]习知的数据去识别处理技术主要是删除、加密或上位化可直接识别的数据(例如:姓名、身份证号码)或只显示一部分的数据(例如:数值中的某几位数),然而此种处理方式将使得处理过后的数据,难以用来对特定用途来进行评估(例如:评估是否给予使用者信用贷款)。这些习知的数据去识别处理技术皆未考虑到跨领域整合数据时需要跨领域合规,且未考虑到在合规的同时仍需要达到数据赋能的技术效果,亦即在将数据进行去识别处理之后,仍可用来对特定用途进行评估。有鉴于此,本领域仍亟需一种跨领域整合数据且跨领域合规的数据去识别处理技术。
技术实现思路
[0004]本专利技术的一目的在于提供一数据去识别处理装置。该数据去识别处理装置包含一储存器、一输入接口 ...
【技术保护点】
【技术特征摘要】
1.一种数据去识别处理装置,其特征在于,包含:一储存器,储存一第一产业领域的一数据集,其中该数据集定义多个栏位;一输入接口,接收一第一指令及一第二指令,其中该第一指令对应至一第二产业领域,该第二指令对应至一数据用途;以及一处理器,电性连接至该储存器及该输入接口,根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一识别分类,根据该数据用途将该数据集转换为一第一转换数据集,且根据该等识别分类将该第一转换数据集转换为一第一去识别数据集。2.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器还根据该第一产业领域、该第二产业领域及该数据用途决定各该栏位的一敏感分类,其中该处理器系根据该等识别分类及该等敏感分类将该第一转换数据集转换为该第一去识别数据集。3.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器系藉由以下运作将该数据集转换为该第一转换数据集:根据该数据用途决定一指定栏位的一数据转换方式,且将该指定栏位所对应的多笔数据以对应的该数据转换方式转换。4.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器系藉由以下运作将该第一转换数据集转换为该第一去识别数据集:根据各该栏位的该识别分类决定各该栏位的一去识别处理方式,且将该第一转换数据集中各该栏位所对应的多笔数据以对应的该去识别处理方式来进行去识别处理。5.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器还对该第一去识别数据集执行一去识别检测。6.如权利要求5所述的数据去识别处理装置,其特征在于,该去识别检测包含一K匿名检测、一L多样性检测及一T相似性检测的至少其中之一。7.如权利要求5所述的数据去识别处理装置,其特征在于,该处理器还根据该数据用途决定该等栏位的一重要性排序,当该处理器还判断该第一去识别数据集未通过该去识别检测时,该处理器还根据该重要性排序决定该第一去识别数据集所包含的至少一栏位以进行一进阶去识别处理。8.如权利要求1所述的数据去识别处理装置,其特征在于,该处理器还以一自动编码器从该第一去识别数据集撷取多个特征值,且该处理器还利用该特征值预测该第一去识别数据集于该数据用途的一建模效果。9.如权利要求8所述的数据去识别处理装置,其特征在于,当该建模效果低于一门槛值时,该处理器还根据该数据用途将该数据集转换为一第二转换数据集,且根据该等识别分类将该第二转换数据集转换为一第二去识别数据集,其中该处理器系根据该数据用途决定该等栏位中的一指定栏位的一数据转换方式,且该处理器于转换该第一转换数据集和该第二转换数据集时系采用不同的数据转换方式来将该指定栏位所对应的多笔数据进行转换。10.如权利要求1所述的数据去识别处理装置,其特征在于,还包含:一传输接口,电性连接至该处理器,且传送该第一去识别数据集至一建模装置;其中,该建模装置于接收该第一去识别数据集和对应该第二产业领域的一第三去识别数据集后,建立对应该数...
【专利技术属性】
技术研发人员:叶育惠,谷圳,杨秉哲,吕宜颖,罗至善,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。