用于语音识别的处理器制造技术

技术编号:25000036 阅读:126 留言:0更新日期:2020-07-24 18:01
用于语音识别的处理器为一种分布式模式处理器,它根据自身存储的声学/语言模型对输入的语音数据进行语音识别。该处理器含有多个存储处理单元,每个存储处理单元都含有一个包括语音识别电路的模式处理电路和至少一个存储至少部分声学/语言模型的三维存储(3D‑M)阵列。模式处理电路中的所有晶体管均位于一半导体衬底中;3D‑M阵列中的所有存储元均不位于任何半导体衬底中。

【技术实现步骤摘要】
用于语音识别的处理器本申请是申请号为201710130887.X(针对的分案申请号201710460362.2)、申请日为2017年3月7日的专利技术专利申请的分案申请。
本专利技术涉及集成电路领域,更确切地说,涉及用于语音识别的处理器。
技术介绍
模式匹配和模式识别指在目标模式(被检索的模式,targetpattern)中查找与检索模式(用于检索的模式,searchpattern)相同或接近的模式。其中,模式匹配要求查找到相同的模式,模式识别仅要求查找到接近的模式。除了特别说明,本说明书不区分模式匹配和模式识别,并用模式处理来统称各种对模式进行的操作。模式处理(包括模式匹配和模式识别)应用广泛。常用的模式处理包括字符串匹配、代码匹配、语音识别和图像识别等。字符串匹配广泛用于大数据分析(如金融数据分析、电商数据分析、生物信息学)等领域:从大数据(目前多为文本数据库,含有目标字符串)中查找检索字符串,并进行统计分析。代码匹配广泛用于防恶意软件(anti-malware,如网络安全、计算机杀毒)等领域:从网络数据包中查找病毒标识(virussignature)或检查网络数据包是否符合网络规范(networkrules),从而决定网络数据包是否安全。语音识别将通过语音传感器搜集到、或存储在语音档案库中的语音信号与声学模型库和语言模型库匹配。图像识别将通过图像传感器搜集到、或存储到图像档案库中的图像信号与图像模型库匹配。随着大数据时代的到来,传统的模式库(包括检索模式库和目标模式库)已成为大型数据库(TB级到PB级,甚至EB级):检索模式库(包括所有用于检索的模式)的数据量已经很大,而目标模式库(包括所有被检索的模式,通常为用户数据库)的数据量则更为巨大。目前计算机采用的vonNeumann架构已不能满足大数据时代对模式处理的要求。在vonNeumann架构中,用于处理模式的处理器和用来存储模式的存储器是分离的:存储器(如硬盘、光盘、磁带等)仅用作存储模式数据,而不能对它进行任何模式处理;所有的模式处理都由外置处理器(如CPU、GPU)来完成。众所周知,分离的处理器和存储器之间带宽有限,光是从模式库中读出所有数据就需要很长时间,更何况对它们进行处理分析。因此,对大型模式库的模式处理需要耗费很长时间。模式处理的一个典型应用是语音识别。语音识别的一种手段是根据声学模型库和语言模型库对用户语音进行模式识别。其中,声学模型库存储大量的声学模型;语言模型库存储大量的语言模型。在识别时,模式处理器将用户语音数据与声学模型库中的声学模型或语言模型库中的语言模型进行模式识别,寻找最接近的声学模型和语言模型。由于传统语音处理器(如CPU、GPU)内核数量有限、模式识别平行度较低,且声学模型库和语言模型库存储在外存(如硬盘)中、语音处理器获取声学模型和语言模型耗时较长,故传统语音处理器在处理语音识别时效率低下。
技术实现思路
本专利技术的主要目的是提高语音识别的效率。本专利技术的另一目的是提供一种能高效地进行语音识别的处理器。为了实现这些以及别的目的,本专利技术提出一种用于语音识别的处理器,它是一种分布式模式处理器:该处理器不仅能存储声学/语言模型,还能根据自身存储的声学/语言模型对输入的语音数据进行语音识别。该处理器含有多个存储处理单元,每个存储处理单元都含有一个包括语音识别电路的模式处理电路和至少一个存储至少部分声学/语言模型的三维存储(three-dimensionalmemory,简称为3D-M)阵列。3D-M阵列与模式处理电路的垂直集成带来很多优势:由于3D-M阵列不占衬底面积,它可以集成在模式处理电路上,这能增加存储容量、减少芯片面积。更重要的是,由于3D-M阵列和模式处理电路处于同一芯片中且距离很近,它们之间能实现一大带宽电连接。通过采用大规模平行计算(每个分布式模式处理器芯片可以含有上万个存储处理单元),该处理器能对输入的大量语音数据基于自身存储的声学/语音模型库实现快速语音识别。相应地,本专利技术提出一种用于语音识别的处理器(200),其特征在于含有:一传输至少部分语音数据的输入总线(110);多个与所述输入总线(110)耦合的存储处理单元(100aa-100mn),所述多个存储处理单元(100aa-100mn)中每个存储处理单元(100ij)均含有一个语音识别电路(180)和至少一个三维存储(3D-M)阵列(170;或170A-170D);其中,所述3D-M阵列(170;或170A-170D)存储至少部分声学/语言模型;所述语音识别电路(180)根据所述声学/语言模型对所述至少部分语音数据进行模式识别;所述3D-M阵列(170;或170A-170D)有多个周边电路(15,15`,17,17`;或15A-15D,17A-17D),所述语音识别电路(180)和所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)中的所有晶体管(0t)均位于同一半导体衬底(0)之中,并位于所述半导体衬底(0)的上表面;所述3D-M阵列(170;或170A-170D)中的所有存储元(5aa)均位于所述半导体衬底(0)的上方,且不位于任何半导体衬底之中;所述3D-M阵列(170;或170A-170D)与所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)通过多个接触通道孔(1av)耦合,所述接触通道孔(1av)不穿透任何半导体衬底;所述语音识别电路(180)被所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)至少部分包围;所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)位于所述语音识别电路(180)之外。本专利技术还提出一种用于语音识别的处理器(200),其特征在于含有:一传输至少部分语音数据的输入总线(110);多个与所述输入总线(110)耦合的存储处理单元(100aa-100mn),所述多个存储处理单元(100aa-100mn)中每个存储处理单元(100ij)均含有一个语音识别电路(180)和多个三维存储(3D-M)阵列(170A-170D,170W-170Z),其中,所述3D-M阵列(170A-170D,170W-170Z)存储至少一声学/语言模型;所述语音识别电路(180)根据所述声学/语言模型对所述至少部分语音数据进行模式识别;所述3D-M阵列(170A-170D,170W-170Z)有多个周边电路(15A-15D,17A-17D;15W-15Z,17W-17Z),所述语音识别电路(180)和所述周边电路(15A-15D,17A-17D;15W-15Z,17W-17Z)中的所有晶体管(0t)均位于同一半导体衬底(0)之中,并位于所述半导体衬底(0)的上表面;所述3D-M阵列(170A-170D,170W-170Z)中的所有存储元(5aa)均位于所述半导体衬底(0)的上方,且不位于任何半导体衬底之中;所述3D-M阵列(170A-170D,170W-170Z)与所述周边电路(15A-15D,17A-17D,15W-15Z,本文档来自技高网
...

【技术保护点】
1.一种用于语音识别的处理器(200),其特征在于含有:/n一传输至少部分语音数据的输入总线(110);/n多个与所述输入总线(110)耦合的存储处理单元(100aa-100mn),所述多个存储处理单元(100aa-100mn)中每个存储处理单元(100ij)均含有一个语音识别电路(180)和至少一个三维存储(3D-M)阵列(170; 或170A-170D);其中,所述3D-M阵列(170; 或170A-170D)存储至少部分声学/语言模型;所述语音识别电路(180)根据所述声学/语言模型对所述至少部分语音数据进行模式识别;/n所述3D-M阵列(170; 或170A-170D)有多个周边电路(15, 15`, 17, 17`; 或15A-15D,17A-17D),所述语音识别电路(180)和所述周边电路(15, 15`, 17, 17`; 或15A-15D,17A-17D)中的所有晶体管(0t)均位于同一半导体衬底(0)之中,并位于所述半导体衬底(0)的上表面;/n所述3D-M阵列(170; 或170A-170D)中的所有存储元(5aa)均位于所述半导体衬底(0)的上方,且不位于任何半导体衬底之中;/n所述3D-M阵列(170; 或170A-170D)与所述周边电路(15, 15`, 17, 17`; 或15A-15D,17A-17D)通过多个接触通道孔(1av)耦合,所述接触通道孔(1av)不穿透任何半导体衬底;/n所述语音识别电路(180)被所述周边电路(15, 15`, 17, 17`; 或15A-15D, 17A-17D)至少部分包围;所述周边电路(15, 15`, 17, 17`; 或15A-15D, 17A-17D)位于所述语音识别电路(180)之外。/n...

【技术特征摘要】
20160307 CN 20161012798151.一种用于语音识别的处理器(200),其特征在于含有:
一传输至少部分语音数据的输入总线(110);
多个与所述输入总线(110)耦合的存储处理单元(100aa-100mn),所述多个存储处理单元(100aa-100mn)中每个存储处理单元(100ij)均含有一个语音识别电路(180)和至少一个三维存储(3D-M)阵列(170;或170A-170D);其中,所述3D-M阵列(170;或170A-170D)存储至少部分声学/语言模型;所述语音识别电路(180)根据所述声学/语言模型对所述至少部分语音数据进行模式识别;
所述3D-M阵列(170;或170A-170D)有多个周边电路(15,15`,17,17`;或15A-15D,17A-17D),所述语音识别电路(180)和所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)中的所有晶体管(0t)均位于同一半导体衬底(0)之中,并位于所述半导体衬底(0)的上表面;
所述3D-M阵列(170;或170A-170D)中的所有存储元(5aa)均位于所述半导体衬底(0)的上方,且不位于任何半导体衬底之中;
所述3D-M阵列(170;或170A-170D)与所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)通过多个接触通道孔(1av)耦合,所述接触通道孔(1av)不穿透任何半导体衬底;
所述语音识别电路(180)被所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)至少部分包围;所述周边电路(15,15`,17,17`;或15A-15D,17A-17D)位于所述语音识别电路(180)之外。


2.根据权利要求1所述的用于语音识别的处理器(200),其特征还在于:每个所述存储处理单元(100ij)含有一个3D-M阵列(170)。


3.根据权利要求2所述的用于语音识别的处理器(200),其特征还在于:所述3D-M阵列(170)在一个方向(X或Y)上有两个周边电路(15,15`;或17,17`)。


4.根据权利要求1所述的用于语音识别的处理器(200),其特征还在于:每个所述存储处理单元(100ij)含有四个3D-M阵列(170A-170D)。


5.根据权利要求4所述的用于语音识别的处理器(200),其特征还在于:所述3D-M阵列(170A)在一个方向(X或Y)上只有一个周边电路(15A或17A)。


6.一种用于语...

【专利技术属性】
技术研发人员:张国飙
申请(专利权)人:杭州海存信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1