基于联邦随机森林学习的健康监护模型构建方法、系统技术方案

技术编号：24208647 阅读：45 留言：0更新日期：2020-05-20 15:49

本发明专利技术涉及一种基于联邦随机森林学习的健康监护模型构建方法，包括：于任一客户端，对本地的当前数据集进行分类，以构建客户端决策树的当前节点，获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果，并将该中间结果发送至协作端；于该协作端，从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息，并将该分裂信息分发至所有客户端；于任一该客户端，根据该分裂信息对本地的当前数据集进行划分；并以划分后的当前数据集构建本地的当前节点的左右子树；重复顺序执行上述步骤以进行迭代，直到该当前节点满足迭代终止条件，以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。

Health monitoring model construction method and system based on federal random forest learning

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦随机森林学习的健康监护模型构建方法、系统
本专利技术涉及普适计算、可穿戴健康监护和行为识别领域，特别涉及一种面向健康监护的联邦随机森林学习方法。
技术介绍
近年来，慢性疾病已经成为导致成年人死亡的主要原因之一。根据世界健康组织的报道，不良的饮食习惯和饮食过量、缺乏锻炼和吸烟是慢性病的三个主要诱因。其中，缺乏锻炼每年会导致超过190多万人的死亡。因此，实时、准确的监测人们的日常行为对于预防慢性疾病具有重要现实意义。微型、可穿戴式传感器件的诞生与发展为日常行为监护提供了新的途径。其体积小、低功耗的特性使得长时间、实时的行为识别成为可能。传统的可穿戴健康监护应用通常要求集合所有用户信息来构建一个具有较好泛化性能的监护模型。但是，在实际应用中，由于不同用户使用不同厂商生产的健康监护产品，用户数据通常是孤立的，由于用户隐私问题，很难通过数据共享的方式在不同厂商之间交换用户数据。用户数据的隐私保护成为可穿戴健康监护中面临的一个重要挑战。联邦学习是近年来人工智能领域出现的一项新兴技术，它为在不共享隐私数据条件下进行协同训练提供了一种新的框架。联邦学习不用汇聚模型训练所需的数据进行集中计算，而是分散机器学习的计算到参与各方的数据库上进行加密的分布式计算。常见的联邦学习分为横向联邦学习、垂直联邦学习和联邦迁移学习三大类。本专利技术聚焦于横向迁移学习问题，两个数据集的用户特征一致，而用户不同。其主要适用于不同健康监护公司期望能够在保护数据隐私的前提下，协同创建一个具有更优监护性能的健康监护模型的场景。已有的健康监...

【技术保护点】
1.一种基于联邦随机森林学习的健康监护模型构建方法，其特征在于，包括：/n步骤1，对于多个相互之间数据隔离的客户端，于任一客户端，对本地的当前数据集进行分类，以构建客户端决策树的当前节点，获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果，并将该中间结果发送至协作端；/n步骤2，于该协作端，从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息，并将该分裂信息分发至所有客户端；/n步骤3，于任一该客户端，根据该分裂信息对本地的当前数据集进行划分；并以划分后的当前数据集构建本地的当前节点的左右子树；/n步骤4，重复顺序执行步骤1-3以进行迭代，直到该当前节点满足迭代终止条件，以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。/n

【技术特征摘要】
1.一种基于联邦随机森林学习的健康监护模型构建方法，其特征在于，包括：
步骤1，对于多个相互之间数据隔离的客户端，于任一客户端，对本地的当前数据集进行分类，以构建客户端决策树的当前节点，获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果，并将该中间结果发送至协作端；
步骤2，于该协作端，从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息，并将该分裂信息分发至所有客户端；
步骤3，于任一该客户端，根据该分裂信息对本地的当前数据集进行划分；并以划分后的当前数据集构建本地的当前节点的左右子树；
步骤4，重复顺序执行步骤1-3以进行迭代，直到该当前节点满足迭代终止条件，以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。

2.如权利要求1所述的健康监护模型构建方法，其特征在于，还包括：以所有该分裂信息，构建该协作端的随机森林模型为协作端健康监护模型。

3.如权利要求1所述的健康监护模型构建方法，其特征在于，该迭代终止条件为：该当前节点中的数据均属于同一类别。

4.如权利要求1所述的健康监护模型构建方法，其特征在于，该当前数据集包括该客户端从用户的健康数据中提取的特征数据；其中，该特征数据包括时域特征数据和频域特征数据，该时域特征数据包括：该健康数据的均值、标准差、最小值、最大值、众数、区间和过均值点次数；该频域特征数据包括：该健康数据的直流分量，该健康数据进行快速傅里叶变换后的峰值、均值、标准差、能量熵。

5.一种基于联邦随机森林学习的健康监护模型构建系统，其特征在于，包括：
中间结果获取模块，用于获取客户端决策树的当前节点生成的中间结果；其中，对于多个相互之间数据隔离的客户端，于任一客户端，对本地的当前数据集进行分类，以构建客户端决策树的当前节点，获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果，并将该中间结果发送至协作端；
分裂信息获取模块，用于获取构建该当前节点左右子树的分裂信息；其中，于该协作端，从所...

【专利技术属性】
技术研发人员：陈益强，胡春雨，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人