基于联邦随机森林学习的健康监护模型构建方法、系统技术方案

技术编号:24208647 阅读:45 留言:0更新日期:2020-05-20 15:49
本发明专利技术涉及一种基于联邦随机森林学习的健康监护模型构建方法,包括:于任一客户端,对本地的当前数据集进行分类,以构建客户端决策树的当前节点,获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果,并将该中间结果发送至协作端;于该协作端,从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息,并将该分裂信息分发至所有客户端;于任一该客户端,根据该分裂信息对本地的当前数据集进行划分;并以划分后的当前数据集构建本地的当前节点的左右子树;重复顺序执行上述步骤以进行迭代,直到该当前节点满足迭代终止条件,以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。

Health monitoring model construction method and system based on federal random forest learning

【技术实现步骤摘要】
基于联邦随机森林学习的健康监护模型构建方法、系统
本专利技术涉及普适计算、可穿戴健康监护和行为识别领域,特别涉及一种面向健康监护的联邦随机森林学习方法。
技术介绍
近年来,慢性疾病已经成为导致成年人死亡的主要原因之一。根据世界健康组织的报道,不良的饮食习惯和饮食过量、缺乏锻炼和吸烟是慢性病的三个主要诱因。其中,缺乏锻炼每年会导致超过190多万人的死亡。因此,实时、准确的监测人们的日常行为对于预防慢性疾病具有重要现实意义。微型、可穿戴式传感器件的诞生与发展为日常行为监护提供了新的途径。其体积小、低功耗的特性使得长时间、实时的行为识别成为可能。传统的可穿戴健康监护应用通常要求集合所有用户信息来构建一个具有较好泛化性能的监护模型。但是,在实际应用中,由于不同用户使用不同厂商生产的健康监护产品,用户数据通常是孤立的,由于用户隐私问题,很难通过数据共享的方式在不同厂商之间交换用户数据。用户数据的隐私保护成为可穿戴健康监护中面临的一个重要挑战。联邦学习是近年来人工智能领域出现的一项新兴技术,它为在不共享隐私数据条件下进行协同训练提供了一种新的框架。联邦学习不用汇聚模型训练所需的数据进行集中计算,而是分散机器学习的计算到参与各方的数据库上进行加密的分布式计算。常见的联邦学习分为横向联邦学习、垂直联邦学习和联邦迁移学习三大类。本专利技术聚焦于横向迁移学习问题,两个数据集的用户特征一致,而用户不同。其主要适用于不同健康监护公司期望能够在保护数据隐私的前提下,协同创建一个具有更优监护性能的健康监护模型的场景。已有的健康监护系统很少关注数据共享中存在的用户隐私问题,通常情况下,不同公司利用各自收集到的用户数据进行建模,公司之间很少会共享收集到的数据。这种运营模式下构建的健康监护模型通常会因为数据量不足而导致模型泛化能力低的问题,即根据已有数据构建的模型不能很好的适用于新用户。因此,如何在保护用户数据隐私的前提下,构建出泛化性能更好的健康监护模型是健康监护领域关注的主要问题。
技术实现思路
针对传统健康监护模型无法同时兼顾用户数据隐私和模型泛化能力的问题,本专利技术以客户端与协作端的协同工作方式,在各客户端之间不暴露用户数据的条件下,构建出具有良好泛化性能的随机森林模型。具体来说,本专利技术提出了一种基于联邦随机森林学习的健康监护模型构建方法,包括:步骤1,对于多个相互之间数据隔离的客户端,于任一客户端,对本地的当前数据集进行分类,以构建客户端决策树的当前节点,获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果,并将该中间结果发送至协作端;步骤2,于该协作端,从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息,并将该分裂信息分发至所有客户端;步骤3,于任一该客户端,根据该分裂信息对本地的当前数据集进行划分;并以划分后的当前数据集构建本地的当前节点的左右子树;步骤4,重复顺序执行步骤1-3以进行迭代,直到该当前节点满足迭代终止条件,以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。本专利技术所述的健康监护模型构建方法,还包括:以所有该分裂信息,构建该协作端的随机森林模型为协作端健康监护模型。3、如权利要求1所述的健康监护模型构建方法,其特征在于,该迭代终止条件为:该当前节点中的数据均属于同一类别。本专利技术所述的健康监护模型构建方法,其中,该当前数据集包括该客户端从用户的健康数据中提取的特征数据;该特征数据包括时域特征数据和频域特征数据,该时域特征数据包括:该健康数据的均值、标准差、最小值、最大值、众数、区间和过均值点次数;该频域特征数据包括:该健康数据的直流分量,该健康数据进行快速傅里叶变换后的峰值、均值、标准差、能量熵。本专利技术还提出一种基于联邦随机森林学习的健康监护模型构建系统,包括:中间结果获取模块,用于获取客户端决策树的当前节点生成的中间结果;其中,对于多个相互之间数据隔离的客户端,于任一客户端,对本地的当前数据集进行分类,以构建客户端决策树的当前节点,获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果,并将该中间结果发送至协作端;分裂信息获取模块,用于获取构建该当前节点左右子树的分裂信息;其中,于该协作端,从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息,并将该分裂信息分发至所有客户端;节点子树构建模块,用于在任一该客户端,根据该分裂信息对本地的当前数据集进行划分;并以划分后的当前数据集构建本地的当前节点的左右子树;客户端模型构建模块,用于构建该客户端的健康监护模型;其中,重复顺序调用该中间结果获取模块、该分裂信息获取模块和该节点子树构建模块以进行迭代,直到该当前节点满足迭代终止条件,以当前客户端决策树组成的随机森林模型为客户端健康监护模型。本专利技术所述的健康监护模型构建系统,还包括:协作端模型构建模块,用于构建该协作端的健康监护模型;其中,以所有该分裂信息,构建该协作端的随机森林模型为协作端健康监护模型。本专利技术所述的健康监护模型构建系统,其中该迭代终止条件为:该当前节点中的数据均属于同一类别。本专利技术所述的健康监护模型构建系统,其中该数据集包括该客户端从用户的健康数据中提取的特征数据;该特征数据包括时域特征数据和频域特征数据,该时域特征数据包括:该健康数据的均值、标准差、最小值、最大值、众数、区间和过均值点次数;该频域特征数据包括:该健康数据的直流分量,该健康数据进行快速傅里叶变换后的峰值、均值、标准差、能量熵。本专利技术还提出一种计算机可读存储介质,存储有计算机可执行指令,该计算机可执行指令用于执行如前所述的基于联邦随机森林学习的健康监护模型构建方法。本专利技术还提出一种数据处理装置,包括:多个相互之间数据隔离的客户端,设置有如前所述的计算机可读存储介质,该客户端的处理器调取并执行该计算机可读存储介质中的计算机可执行指令,以构建客户端健康监护模型;协作端,设置有如前述的计算机可读存储介质,该协作端的处理器调取并执行该计算机可读存储介质中的计算机可执行指令,以获取用于构建该客户端健康监护模型的分裂信息,并构建协作端健康监护模型。附图说明图1是本专利技术的基于联邦随机森林学习的健康监护模型构建方法流程图。图2是本专利技术的基于联邦随机森林学习的健康监护模型构建系统框架图。图3是本专利技术的数据处理装置示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图,对本专利技术提出的基于联邦随机森林学习的健康监护方法和系统进一步详细说明。应当理解,此处所描述的具体实施方法仅仅用以解释本专利技术,并不用于限定本专利技术。相比已有方法,本专利技术是针对可穿戴健康监护领域的第一个横向联邦学习框架,它能够在保护用户数据隐私的情况下,构建跨组织或用户的具有强泛化能力的健康监护模型;此外,本专利技术提出的健康监护系统可扩展性强,它适用于多家机构或组织协同构建健康模型,当参与单位动态增加时,本专利技术能够实现高效适应。在健康监护中,假设有N个客户端,每个本文档来自技高网
...

【技术保护点】
1.一种基于联邦随机森林学习的健康监护模型构建方法,其特征在于,包括:/n步骤1,对于多个相互之间数据隔离的客户端,于任一客户端,对本地的当前数据集进行分类,以构建客户端决策树的当前节点,获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果,并将该中间结果发送至协作端;/n步骤2,于该协作端,从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息,并将该分裂信息分发至所有客户端;/n步骤3,于任一该客户端,根据该分裂信息对本地的当前数据集进行划分;并以划分后的当前数据集构建本地的当前节点的左右子树;/n步骤4,重复顺序执行步骤1-3以进行迭代,直到该当前节点满足迭代终止条件,以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。/n

【技术特征摘要】
1.一种基于联邦随机森林学习的健康监护模型构建方法,其特征在于,包括:
步骤1,对于多个相互之间数据隔离的客户端,于任一客户端,对本地的当前数据集进行分类,以构建客户端决策树的当前节点,获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果,并将该中间结果发送至协作端;
步骤2,于该协作端,从所有客户端的中间结果中选取具有最大信息增益者对应的分裂属性和分裂值作为分裂信息,并将该分裂信息分发至所有客户端;
步骤3,于任一该客户端,根据该分裂信息对本地的当前数据集进行划分;并以划分后的当前数据集构建本地的当前节点的左右子树;
步骤4,重复顺序执行步骤1-3以进行迭代,直到该当前节点满足迭代终止条件,以当前的客户端决策树组成的随机森林模型为客户端健康监护模型。


2.如权利要求1所述的健康监护模型构建方法,其特征在于,还包括:以所有该分裂信息,构建该协作端的随机森林模型为协作端健康监护模型。


3.如权利要求1所述的健康监护模型构建方法,其特征在于,该迭代终止条件为:该当前节点中的数据均属于同一类别。


4.如权利要求1所述的健康监护模型构建方法,其特征在于,该当前数据集包括该客户端从用户的健康数据中提取的特征数据;其中,该特征数据包括时域特征数据和频域特征数据,该时域特征数据包括:该健康数据的均值、标准差、最小值、最大值、众数、区间和过均值点次数;该频域特征数据包括:该健康数据的直流分量,该健康数据进行快速傅里叶变换后的峰值、均值、标准差、能量熵。


5.一种基于联邦随机森林学习的健康监护模型构建系统,其特征在于,包括:
中间结果获取模块,用于获取客户端决策树的当前节点生成的中间结果;其中,对于多个相互之间数据隔离的客户端,于任一客户端,对本地的当前数据集进行分类,以构建客户端决策树的当前节点,获取该当前节点的分裂属性、分裂值和信息增益为该客户端的中间结果,并将该中间结果发送至协作端;
分裂信息获取模块,用于获取构建该当前节点左右子树的分裂信息;其中,于该协作端,从所...

【专利技术属性】
技术研发人员:陈益强胡春雨
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1