针对存储在服务器中的隐马尔可夫模型(HMM)评估存储在客户端中的观测值序列的概率的方法和服务器技术

技术编号:9467960 阅读:144 留言:0更新日期:2013-12-19 03:57
本发明专利技术针对存储在服务器中的隐马尔可夫模型(HMM)安全地评估存储在客户端中的观测值序列的概率。服务器针对HMM的各个状态确定所述观测值序列的当前元素的对数概率的加密结果。针对各个状态确定了基于所述观测值序列的先前元素的所述观测值序列的似然度与至各个状态的转移概率的乘积的对数和的加密结果。将针对各个状态的所述观测值序列的对数似然度的加密结果确定为对数和的加密结果与所述观测值序列的当前元素的对应对数概率的加密结果的乘积。针对各个状态,基于所述观测值序列的对数似然度,来确定所述观测值序列的对数概率的加密结果。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术针对存储在服务器中的隐马尔可夫模型(HMM)安全地评估存储在客户端中的观测值序列的概率。服务器针对HMM的各个状态确定所述观测值序列的当前元素的对数概率的加密结果。针对各个状态确定了基于所述观测值序列的先前元素的所述观测值序列的似然度与至各个状态的转移概率的乘积的对数和的加密结果。将针对各个状态的所述观测值序列的对数似然度的加密结果确定为对数和的加密结果与所述观测值序列的当前元素的对应对数概率的加密结果的乘积。针对各个状态,基于所述观测值序列的对数似然度,来确定所述观测值序列的对数概率的加密结果。【专利说明】针对存储在服务器中的隐马尔可夫模型(H關)评估存储在客户端中的观测值序列的概率的方法和服务器
本专利技术总体上涉及基于隐马尔可夫模型的概率推理,并且更具体的说,涉及针对基于隐马尔可夫模型的概率推理的服务器计算机与客户端计算机之间的隐私保护计算。
技术介绍
基于隐马尔可夫模型(HMM)的概率推理在机器学习、语音处理和基因序列分析中是普遍的。具有隐私约束的概率推理是相对未开发的研究领域,并且应用于数据和HMM属于不同方并且不能共享的多方场景。例如,客户端计算机(Alice)需要分析来自电话呼叫的语音数据。Alice将语音识别任务外包给拥有从经训练的数据库获得的HMM的服务器计算机(Bob)。因为涉及隐私,Alice不能与Bob共享语音数据,同时Bob不能公开可揭示关于训练数据库的信息的HMM参数。一种用于经由HMM的安全推理的方法是基于双方恰好承受相同协议开销的隐私保护双方最大化方法的。然而,这种方法不适用于瘦客户端将数据加密并将加密的数据发送到服务器以执行大部分计算密集的任务的应用。HMM和HMM的三个基本问题HMM是马尔可夫链的一般化,其中HMM的状态非直接已知,而是生成可分析的输出。输出还被称为“观测值”。因为所述观测值取决于HMM的隐含状态,所以所述观测值可揭不关于隐含状态的信息。HMM λ是三重参数,λ=(Α, B, Π)。矩阵A (A=(Bij))是状态转移矩阵,au是从状态Si至状态Si的转移概率,其中,I≤i,j≤N,并且N是HMM的状态数,Bij=Pr Iqw=SjIqt=SiKI≤i,j≤N,其中,(S1, S2,...,SN}是一组状态,qt是时刻t的状态,并且Pr是联合概率。矩阵B (B=(bi,b2,...,bN))是观测值的概率矩阵,h是观测值序列的已知符号集上的概率矩阵的列向量,j=l, 2,…,N。因此,bj (vk) =Pr {xt=vk I qt=Sj}, I ≤ j ≤ N,I≤k≤M,其中{Vi,V2,...,Vm}是观测值符号的符号集,并且xt是时刻t的观测值。向量II (n = (ji1, Ji2,..., JiN))是 HMM 的初始状态概率向量,其中,Ji FPHq1=SiK对于观测值序列X1, χ2,...,χτ和HMM λ=(Α, B, Π),一个问题是针对HMM确定观测值序列的概率,即,Prix1, χ2,...,χτ| λ }。在非安全域中,该问题的解决方案包括前向算法(forward algorithm)和后向算法(backward algorithm)。在例如基因序列分析和自然语言处理的统计句法分析(statistical parsing)中,主要问题是针对HMM确定对应于观测值序列的最可能的状态序列。该问题是针对HMM λ =(Α, B, Π)高效地计算联合概率PHq1, q2,..., qT, X1, x2,..., χτ λ }。在非安全域中,该问题通常通过维特比算法(Viterbi algorithm)来解决。另一问题是基于观测值序列确定HMM的参数。在非安全域中,该问题的一个解决方案包括Baum-Welch算法。前向算法时刻t在状态Sj的观测值序列的联合概率如下:a t (j) =Pr {x1; x2,..., xt, qt=Sj | λ } 0 (I)在非安全域中,前向算法包括以下步骤。1.进行初始化,a I (j) = Ji jbj (X1),I ≤ j ≤ N ;2.针对各个状态Sj (I≤j≤N),并且针对所有观测值t (I≤t≤T-1),根据下式确定观测值序列的似然度:【权利要求】1.一种针对存储在服务器中的隐马尔可夫模型(HMM)来评估存储在客户端中的观测值序列的概率的方法,其中,所述客户端具有加法同态密码体制的解密密钥和加密密钥,并且所述服务器具有所述加密密钥,该方法包括以下步骤: 针对HMM的各个状态,确定所述观测值序列的当前元素的对数概率的加密结果; 针对HMM的各个状态,确定基于所述观测值序列的先前元素的所述观测值序列的似然度与至HMM的状态的转移概率的乘积的对数和的加密结果,其中,所述确定的步骤使用H-SMC,其中,所述H-SMC包括利用加法同态的至少一个性质的安全多方计算; 将针对各个状态的所述观测值序列的对数似然度的加密结果确定为对数和的加密结果与所述观测值序列的当前元素的对应对数概率的加密结果的乘积;以及 针对各个状态,基于所述观测值序列的对数似然度,来确定所述观测值序列的对数概率的加密结果,其中,由所述服务器执行所述方法的步骤。2.根据权利要求1所述的方法,该方法还包括以下步骤: 将所述观测值序列的对数概率发送至所述客户端。3.根据权利要求1所述的方法,其中,所述H-SMC包括H-对数和法。4.根据权利要求1所述的方法,其中,根据λ=(Α,Β,Π)定义ΗΜΜλ,其中,A=(au)是状态转移矩阵,au是从状态Si至状态S」的转移概率,其中,I ^ i, j ^ N,并且N是HMM的状态数,其中,B=(bi,b2,...,bN)是观测值的概率矩阵,h是所述观测值序列的符号集上的概率矩阵的列向量,j=l,2,...,N,其中,Π = (πι,ji2,...,jin)是HMM的初始状态概率向量,其中,所述确定对数和的加密结果的步骤包括以下步骤:根据I ()来确定对数和的加密结果,其中,函数ξ (.)是加法同态密码体制的加密函数,I是状态S1的索引,1=1,2,...,N,其中,at(l)是状态S1下的先前元素Xt的观测值序列的似然度,并且au是从HMM的状态S1至状态S」的转移概率,并且其中,确定所述观测值序列的当前元素的对数概率的加密结果的步骤包括以下步骤:根据ξ (1gbj(Xw))来确定对数概率的加密结果,其中,xt+1是当前元素,并且其中,根据 5.根据权利要求1所述的方法,该方法还包括以下步骤: 确定修改向量; 将利用所述修改向量修改的所述观测值序列的符号集的对数概率的列向量发送至所述客户端; 接收利用所述修改向量修改的所述观测值序列的各个元素的对数概率的加密结果;以及 去除所述修改向量,以生成各个元素的对数概率的加密结果。6.根据权利要求5所述的方法,其中,根据λ=(Α,Β,Π)定义ΗΜΜλ,其中,A=(au)是状态转移矩阵,Bij是从状态Si至状态S」的转移概率,其中,I < i,j < N,并且N是HMM的状态数,其中,B=(b1; b2,...,bN)是观测值的概率矩阵,bj是所述观测值序列的符号集上的概率矩阵的列向量,j本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:S·拉内孙伟M·A·帕塔克B·拉杰
申请(专利权)人:三菱电机株式会社
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1