System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 正交神经网络的经典算法和量子算法制造技术_技高网
当前位置: 首页 > 专利查询>QC韦尔公司专利>正文

正交神经网络的经典算法和量子算法制造技术

技术编号:40638921 阅读:2 留言:0更新日期:2024-03-13 21:21
正交神经网络对权重矩阵应用正交性。它们可以实现更高的精度,并避免深层架构的易失性或爆炸性梯度。已经提出了几种经典的梯度下降方法来在更新权重矩阵的同时保持正交性,但这些方法运行时间较长并且只能提供近似的正交性。在本公开中,我们引入了一种新型的神经网络层。该层允许以与标准层相同的渐近运行时间以完美的正交性进行梯度下降。该层受到量子计算的启发,因此既可以应用于经典计算系统,也可以应用于量子计算系统。它可以作为量子神经网络和快速正交神经网络的构建块。

【技术实现步骤摘要】
【国外来华专利技术】

本公开一般涉及神经网络,更具体地,涉及使用量子计算系统或经典计算系统来训练和使用正交神经网络。


技术介绍

1、在神经网络结构的演化过程中,在权值矩阵中加入约束往往是一条有效的途径。例如,正交神经网络(orthonn)已被提出为一种新型的神经网络,其每一层的权重矩阵应保持正交。这一属性有助于获得更高的精度性能,并避免深层结构的梯度消失或爆炸。为了在更新权矩阵的同时保持正交性,已经提出了几种经典的梯度下降方法。然而,这些技术的运行时间较长,有时仅近似于正交性。具体地,在训练期间实现正交性的主要方法是首先执行梯度下降以更新权重矩阵(其现在将不是正交化的),然后执行奇异值分解以正交化或几乎正交化权重矩阵。然而,实现正交性阻碍了快速训练过程,因为在每一步都需要执行svd计算。

2、在量子机器学习的新兴领域,已经提出了几个实现神经网络的建议。一些算法依赖于长期和完美的量子计算机,而另一些算法则试图利用变分电路来利用现有的量子设备。然而,目前还不清楚这样的架构如何扩展,以及它们是否提供高效和准确的训练。


技术实现思路

1、本公开描述了用于机器学习算法(例如深度学习算法)的新颖方法。本公开描述了一类具有正交权重矩阵的特性的神经网络。这是一种用于近似某些函数的改进的技术,例如由于下面描述的原因而用于数据分类的那些函数。还可以根据电路中的门的数目、训练的定标时间(scaling time)和门的类型来优化所构造的神经网络。

2、正交神经网络可以为深度神经网络(即具有大量层的神经网络)提供优势。在向前和向后传递时,他们都可以保持规则。这一属性能够防止梯度消失和爆炸,这在深度神经网络中是突出的。这种神经网络还具有权值无冗余的特性,因为向量是正交的和线性独立的,因此每个向量都给出了关于输入输出关系的“不同”信息。

3、一些实施例涉及用于在权重矩阵中提供正交性的连接神经网络的量子架构。在一些实施例中,对于神经网络的每一层,神经网络包括形状像倒金字塔的量子电路。

4、一些实施例涉及使用一元保持量子电路(例如,具有如第2节中描述的bs门)来形成正交神经网络层。该层可以在o(n)时间内训练,其中n是该层的输入节点数。可以使用数据加载器将数据加载到层中,例如,如第2节所述。

5、其他方面包括组件、设备、系统、改进、方法、过程、应用、计算机可读介质以及与上述任何内容相关的其他技术。

本文档来自技高网...

【技术保护点】

1.一种用于执行量子电路以实现神经网络的层的方法,所述层具有n>0个输入节点、d>0个输出节点和正交权重矩阵,所述方法包括:

2.根据权利要求1所述的方法,其中所述量子电路的所述O(log(n))个层中的所述BS门的数目等于(2n-1-d)*d/2。

3.根据权利要求1所述的方法,其中所述量子电路的所述O(log(n))个层仅包括BS门。

4.根据权利要求1所述的方法,其中所述量子电路的所述O(log(n))个层由量子计算系统执行,并且所述BS门被应用于所述量子计算系统的x>0个量子比特。

5.根据权利要求4所述的方法,其中所述量子比特的数目x等于所述神经网络的所述层的输入节点的数目n。

6.根据权利要求4所述的方法,其中每个BS门被应用于所述量子计算系统的相邻量子比特。

7.根据权利要求4所述的方法,其中所述量子电路的所述层包括:

8.根据权利要求7所述的方法,其中:

9.根据权利要求7所述的方法,其中:

10.根据权利要求4所述的方法,还包括:在所述量子计算系统的所述x个量子比特上准备一元量子态,所述一元量子态与要被应用于所述神经网络的所述层的输入数据相对应。

11.根据权利要求10所述的方法,其中通过至少执行所述O(log(n))个层而在所述x个量子比特上形成的输出量子态是一元量子态,所输出的所述一元量子态与所述神经网络的所述层的输出数据相对应。

12.根据权利要求10所述的方法,其中在所述x个量子比特上准备所述一元量子态包括:

13.根据权利要求4所述的方法,其中所述量子电路的所述O(log(n))个层包括:

14.根据权利要求4所述的方法,其中所述量子电路的所述O(log(n))个层包括:

15.根据权利要求1所述的方法,其中所述量子电路的所述O(log(n))个层由模拟量子计算系统的经典计算系统执行。

16.一种非瞬态计算机可读存储介质,包括用于执行量子电路的存储指令,所述存储指令在由计算系统执行时,使所述计算系统执行操作,所述操作包括:

17.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述O(log(n))个层中的所述BS门的数目等于(2n-1-d)*d/2。

18.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述量子电路的所述O(log(n))个层仅包括BS门。

19.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述计算系统包括量子计算系统,其中所述量子电路的所述O(log(n))个层由所述量子计算系统执行,并且所述BS门被应用于所述量子计算系统的x>0个量子比特。

20.根据权利要求19所述的非瞬态计算机可读存储介质,其中所述量子比特的数目x等于所述神经网络的所述层的输入节点的数目n。

21.一种用于利用正交权重矩阵训练神经网络的层的方法,所述方法包括:

22.根据权利要求21所述的方法,其中确定所述成本函数的梯度包括:确定所述成本函数相对于所述量子电路的每个BS门的所述参数的梯度。

23.根据权利要求21所述的方法,其中执行所述量子电路的BS门的层包括:在所述量子电路的每一层λ被执行之后测量所得到的量子态ζλ。

24.根据权利要求23所述的方法,还包括确定针对所述量子电路的层λ的误差δ。

25.根据权利要求24所述的方法,其中确定针对所述量子电路的层λ的误差δ包括根据下式以相反顺序确定针对所述量子电路的每一层的误差:

26.根据权利要求25所述的方法,其中所述成本函数C相对于作用于量子比特i和i+1的BS门的参数θi的梯度由下式定义:

27.根据权利要求26所述的方法,其中基于所述成本函数的所述梯度来更新所述量子电路的所述BS门的所述参数的值包括:

28.根据权利要求21所述的方法,其中量子计算系统执行所述量子电路的所述BS门的所述层。

29.一种非瞬态计算机可读存储介质,包括存储指令,所述存储指令在由计算系统执行时,使所述计算系统执行操作,所述操作包括:

30.根据权利要求29所述的非瞬态计算机可读存储介质,其中确定所述成本函数的梯度包括:确定所述成本函数相对于所述量子电路的每个BS门的所述参数的梯度。

31.根据权利要求29所述的非瞬态计算机可读存储介质,其中执行所述量子电路的BS门的层包括:在所述量子电路的每一层λ被执行之后测量所得到的量子态ζλ。

32.根据权利要求31所述的非瞬...

【技术特征摘要】
【国外来华专利技术】

1.一种用于执行量子电路以实现神经网络的层的方法,所述层具有n>0个输入节点、d>0个输出节点和正交权重矩阵,所述方法包括:

2.根据权利要求1所述的方法,其中所述量子电路的所述o(log(n))个层中的所述bs门的数目等于(2n-1-d)*d/2。

3.根据权利要求1所述的方法,其中所述量子电路的所述o(log(n))个层仅包括bs门。

4.根据权利要求1所述的方法,其中所述量子电路的所述o(log(n))个层由量子计算系统执行,并且所述bs门被应用于所述量子计算系统的x>0个量子比特。

5.根据权利要求4所述的方法,其中所述量子比特的数目x等于所述神经网络的所述层的输入节点的数目n。

6.根据权利要求4所述的方法,其中每个bs门被应用于所述量子计算系统的相邻量子比特。

7.根据权利要求4所述的方法,其中所述量子电路的所述层包括:

8.根据权利要求7所述的方法,其中:

9.根据权利要求7所述的方法,其中:

10.根据权利要求4所述的方法,还包括:在所述量子计算系统的所述x个量子比特上准备一元量子态,所述一元量子态与要被应用于所述神经网络的所述层的输入数据相对应。

11.根据权利要求10所述的方法,其中通过至少执行所述o(log(n))个层而在所述x个量子比特上形成的输出量子态是一元量子态,所输出的所述一元量子态与所述神经网络的所述层的输出数据相对应。

12.根据权利要求10所述的方法,其中在所述x个量子比特上准备所述一元量子态包括:

13.根据权利要求4所述的方法,其中所述量子电路的所述o(log(n))个层包括:

14.根据权利要求4所述的方法,其中所述量子电路的所述o(log(n))个层包括:

15.根据权利要求1所述的方法,其中所述量子电路的所述o(log(n))个层由模拟量子计算系统的经典计算系统执行。

16.一种非瞬态计算机可读存储介质,包括用于执行量子电路的存储指令,所述存储指令在由计算系统执行时,使所述计算系统执行操作,所述操作包括:

17.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述o(log(n))个层中的所述bs门的数目等于(2n-1-d)*d/2。

18.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述量子电路的所述o(log(n))个层仅包括bs门。

19.根据权利要求16所述的非瞬态计算机可读存储介质,其中所述计算系统包括量子计算系统,其中所述量子电路的所述o(log(n))个层由所述量子计算系统执行,并且所述bs门被应用于所述量子计算系统的x>0个量子比特。

20.根据权利要求19所述的非瞬态计算机可读存储介质,其中所述量子比特的数目x等于所述神经网络的所述层的输入节点的数目n。

21.一种用于利用正交权重矩阵训练神经网络...

【专利技术属性】
技术研发人员:I·克雷尼迪斯J·兰迪曼N·马特胡尔
申请(专利权)人:QC韦尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1