秘密决策树学习装置、秘密决策树学习系统、秘密决策树学习方法、及程序制造方法及图纸

技术编号:38004753 阅读:5 留言:0更新日期:2023-06-30 10:19
一个实施方式的秘密决策树学习装置是一种通过秘密计算使决策树进行学习的秘密决策树学习装置,其具有:输入部,输入由多个记录构成的数据集合,所述多个记录包括1个以上的说明变量的属性值和目标变量的属性值;及学习部,按照所述决策树的每个层次,集中进行所述层次中包含的所有节点的所述数据集合的划分,由此使所述决策树进行学习。由此使所述决策树进行学习。由此使所述决策树进行学习。

【技术实现步骤摘要】
【国外来华专利技术】秘密决策树学习装置、秘密决策树学习系统、秘密决策树学习方法、及程序


[0001]本专利技术涉及秘密决策树学习装置、秘密决策树学习系统、秘密决策树学习方法、及程序。

技术介绍

[0002]作为无需恢复加密数值即可获得特定的运算(计算)结果的方法,已知一种被称为秘密计算的方法(例如,非专利文件1)。非专利文件1记载的方法中,通过进行将数值分片分散至3个秘密计算装置这样的加密处理,并由3个秘密计算装置进行协同计算,可无需恢复数值地获得作为分散至3个秘密计算装置的状态的加减法、常数加法、乘法、常数乘法、逻辑运算(取反、逻辑积、逻辑和、及异或)、数据格式转换(整数和二进制数)等的结果。
[0003]另外,当根据给定的数据集合使决策树进行学习(即,对决策树进行训练)时,由各节点(node)根据各数据的属性值来计算对数据集合进行划分(分割)时的评价(评估)值,并采用该评价值为最大的划分的方法也是众所周知的。
[0004][引证文件][0005][非专利文件][0006]非专利文件1:千田浩司,滨田浩气,五十岚大,高桥克巳,「轻量检证可能3
パーティ
隐藏关数计算的再考」,In CSS,2010.

技术实现思路

[0007][要解决的技术问题][0008]然而,在通过秘密计算使决策树进行学习的情况下,其计算时间较长。例如,在决策树为高度h以下的二叉树的情况下,秘密计算中,为了对各节点分类的数据数(即,数据数量)进行隐藏,数据集合的参照次数需为Θ(2
h
)次。为此,如果决策树的高度增大,则学习所需的计算时间也会变长。
[0009]本专利技术的一个实施方式是鉴于上述问题而提出的,其目的在于,减少通过秘密计算使决策树进行学习时的计算时间。
[0010][技术方案][0011]为了实现上述目的,一个实施方式的秘密决策树学习装置是一种通过秘密计算使决策树进行学习的秘密决策树学习装置,其具有:输入部,输入由多个(plural)记录构成的数据集合,所述多个记录包括1个以上的说明变量(explanatory variable)的属性值和目标变量(objective variable)的属性值;及学习部,按照所述决策树的每个层次(hierarchy),集中进行所述层次中包含的所有节点的所述数据集合的划分,藉此使所述决策树进行学习。
[0012][有益效果][0013]能够减少通过秘密计算使决策树进行学习时的计算时间。
附图说明
[0014][图1]表示本实施方式的秘密决策树学习装置的功能构成的一例的示意图。
[0015][图2]表示本实施方式的秘密决策树学习装置的硬件构成的一例的示意图。
[0016][图3]表示本实施方式的秘密决策树学习处理的流程的一例的流程图。
[0017][图4]表示本实施方式的秘密决策树测试处理的流程的一例的流程图(其1)。
[0018][图5]表示本实施方式的秘密决策树测试处理的流程的一例的流程图(其2)。
[0019][图6]表示本实施方式的秘密分组处理的流程的一例的流程图。
具体实施方式
[0020]下面对本专利技术的一个实施方式进行说明。本实施方式中对秘密决策树学习装置10进行说明,该秘密决策树学习装置10可藉由秘密计算高效地进行决策树的学习(即,在不公开输入和输出的情况下使决策树进行学习)。如后所述,本实施方式的秘密决策树学习装置10利用“给定的数据集合中的各数据以在决策树的同一层次的节点之间相互不重叠的方式被分类”之特点,并集中进行同一层次的所有节点的分类,据此,可使该数据集合整体的参照次数呈指数级减少。需要说明的是,本实施方式中,使用秘密计算对输入和输出进行了保密的决策树也被称为秘密决策树。
[0021]<标记法>
[0022]首先对各种标记法进行说明。需要说明的是,下文中也对本实施方式中不一定使用的标记法进行了说明。
[0023]将通过加密、秘密共享等对某一值a进行了隐藏后的值称为a的隐藏值,并记为[a]。在a藉由秘密共享而被隐藏了的情况下,可通过[a]对各秘密计算装置持有(拥有)的秘密共享的片段(分片)的集合进行参照。
[0024]·
恢复
[0025]将使a的隐藏值[a]为输入并计算c=a时的值c的处理记为下式。
[0026]c

Open([a])
[0027]·
算术运算
[0028]加法、减法、乘法的各运算为使2个值a、b的隐藏值[a]、[b]作为输入并分别计算a+b、a

b、ab的计算结果c1、c2、c3的隐藏值[c1]、[c2]、[c3]。将加法、减法、乘法的各运算的执行分别记为下式。
[0029][c1]←
Add([a],[b])
[0030][c2]←
Sub([a],[b])
[0031][c3]←
Mul([a],[b])
[0032]在不会招致误解的情况下,将Add([a],[b])、Sub([a],[b])、Mul([a],[b])分别简记为[a]+[b]、[a]‑
[b]、[a]×
[b]。
[0033]·
比较
[0034]比较的运算为使2个值a、b的隐藏值[a]、[b]作为输入并计算a=b、a≤b、a<b的真假值c∈{0,1}的隐藏值[c1]、[c2]、[c3]。就真假值而言,真时为1,假时为0。将a=b、a≤b、a<b的比较运算的执行分别记为下式。
[0035][c1]←
EQ([a],[b])
[0036][c2]←
LE([a],[b])
[0037][c3]←
LT([a],[b])
[0038]·
选择
[0039]选择的运算为将真假值c∈{0,1}的隐藏值[c]和2个值a、b的隐藏值[a]、[b]作为输入并计算满足
[0040][式1][0041]的d的隐藏值[d]。将该运算的执行记为下式。
[0042][d]←
IfElse([c],[a],[b])
[0043]该运算可通过下式实现。
[0044][d]←
[c]×
([a]‑
[b])+[b][0045]<决策树>
[0046]决策树是一种有向图,其通过基于树结构的规则的组合来表达针对数据的某一属性的知识。此外,属性包括被称为目标变量的属性和被称为说明变量的属性,决策树将说明变量的属性值作为输入,并对目标变量的属性值进行予测和输出。决策树包含1个以上的节点(node),叶(叶节点)之外的各节点设定有例如「年龄小于30岁」(注:「」等同于
“”
)等的与说明变量相关的划分规则(划分条件)。另一方面,叶节点(即,决策树的终端(末端)的节点)设定有目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种秘密决策树学习装置,通过秘密计算使决策树进行学习,所述秘密决策树学习装置具有:输入部,输入由多个记录构成的数据集合,所述多个记录包括1个以上的说明变量的属性值和目标变量的属性值;及学习部,按照所述决策树的每个层次,集中进行所述层次中包含的所有节点的所述数据集合的划分,藉此使所述决策树进行学习。2.如权利要求1所述的秘密决策树学习装置,其中,所述学习部按照所述决策树的每个层次,使用在前一层次中被划分为1个以上的组的数据集合和表示所述数据集合中包含的各记录所属的组的组信息向量,在所述层次中包含的所有节点将所述数据集合集中划分至更细的组,藉此使所述决策树进行学习。3.如权利要求2所述的秘密决策树学习装置,其中,所述数据集合由属于同一组的连续记录构成,所述组信息向量是与构成所述数据集合的各记录中的属于同一组的记录的最后的记录对应的元素为1且与所述最后的记录对应的元素之外的元素为0的向量。4.如权利要求2或3所述的秘密决策树学习装置,其中,设所述层次为i,这里,i=1,

,h,所述学习部按照每个层次i反复执行:使用在前一层次中被划分为1个以上的组的数据集合[T
i
]和表示所述数据集合[T
i
]中包含的各记录所属的组的组信息向量[g
i
],计算表示所述层次i中包含的各节点的划分条件的参数[p
i
...

【专利技术属性】
技术研发人员:滨田浩气
申请(专利权)人:日本电信电话株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1