【技术实现步骤摘要】
基于区块链与联邦学习的模型训练方法、装置及区块链
[0001]本申请涉及计算机
,具体涉及一种基于区块链与联邦学习的模型训练方法、装置及区块链。
技术介绍
[0002]语音识别技术重点是将人类语音中的词汇内容转换为计算机可读的输入形式。语音识别技术的长远发展离不开语音数据的支持。
[0003]现阶段已有很多公开的语音数据集。但随着时代进步、人们思想变化,总会有新词被源源不断地创造出来,一些旧词也会衍生出新的含义。因此需要大量新鲜的语音数据不断支持语音识别技术的发展。
[0004]在收集更新语音数据时,直接从用户本地数据集中抓取数据将涉及到侵犯隐私的问题。利用联邦学习能够规避这一问题,但根据联邦学习方式训练出来的模型无法满足各个设备的个性化需求。因此,在语音识别场景下,缺乏一种既兼顾信息安全,又适应用户个性化需求的模型训练方法。
技术实现思路
[0005]为解决上述问题,本申请实施例提供了一种基于区块链与联邦学习的模型训练方法、装置及区块链,旨在克服或者部分克服上述技术问题。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种基于区块链与联邦学习的模型训练方法,其特征在于,所述区块链包括参与训练的多个空闲边缘节点,多个所述空闲边缘节点的一个为聚合节点,其余所述空闲边缘节点为训练节点,所述方法包括:聚合节点基于随机函数生成最初的全局初始模型;各所述训练节点从所述聚合节点下载全局初始模型,以所述全局初始模型为本地初始模型,基于各所述训练节点的本地语音数据训练得到各所述训练节点的本地语音识别模型;各所述训练节点将各自的所述本地语音识别模型分别传输至所述聚合节点,以使所述聚合节点依照聚合算法聚合得到全局语音识别模型,并将得到的所述全局语音识别模型作为所述全局初始模型;当所述全局语音识别模型满足预设迭代条件时,各所述训练节点从所述聚合节点下载所述全局语音识别模型;各所述空闲边缘节点基于各自存储的本地语音数据计算二次训练所需的参数并上传至所述区块链,根据各自存储的本地语音数据及所述参数分别二次训练并部署所述全局语音识别模型。2.根据权利要求1所述的方法,其特征在于,所述各所述训练节点从所述聚合节点下载所述全局初始模型,以所述全局初始模型为本地初始模型,基于各所述训练节点的本地语音数据训练得到各所述训练节点的本地语音识别模型,包括:各所述训练节点根据预设数据量从各自的所述本地语音数据中随机获取指定数量的训练样本,其中,所述预设数据量包括预设数据条数和预设训练轮次;各所述训练节点基于所述指定数量的训练样本,按照预设训练轮次训练本地初始模型,得到各所述训练节点的本地语音识别模型。3.根据权利要求1所述的方法,其特征在于,所述各所述训练节点将各自的所述本地语音识别模型分别传输至所述聚合节点,以使所述聚合节点依照聚合算法聚合得到全局语音识别模型,并将得到的所述全局语音识别模型作为全局初始模型,包括:各所述训练节点将各自的所述本地语音识别模型参数分别传输至所述聚合节点;所述聚合节点对所述参数的每个维度取平均值,以所述平均值组成的新参数作为全局语音识别模型的参数,得到全局语音识别模型;将得到的所述全局语音识别模型作为全局初始模型。4.根据权利要求1所述的方法,其特征在于,当所述全局语音识别模型满足预设迭代条件时,各所述训练节点从所述聚合节点下载所述全局语音识别模型,包括:当所述全局语音识别模型的精度高于预设精度阈值时,各所述训练节点从所述聚合节点下载所述全局语音识别模型。5.根据权利要求2所述的方法,其特征在于,所述各所述空闲边缘节点基于各自存储的本地语音数据计算二次训练所需的参数并上传至所述区块链,根据各自存储的本地语音数据及所述参数分别二次训练并部署所述全局语音识别模型,包括:收集存储于各所述边缘空闲节点的所有语音数据;确定各条所述语音数据的平均重复度打分;将所述平均重复度打分上传至所述区块链;
根据所述平均重复度打分确定二次训练轮次,按照所述二次训练轮次训练...
【专利技术属性】
技术研发人员:李慧,王旭蕾,廖德强,
申请(专利权)人:海南火链科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。