System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及回复,尤其涉及一种回复方法、装置和电子设备。
技术介绍
1、目前,大规模预训练模型已经在计算机视觉、自然语言处理和语音处理等领域中表现出惊人的能力,但它们的训练和部署仍然面临许多问题的挑战。这些大模型基于transformer神经网络构造,由于transformer神经网络的参数量和计算量巨大,造成推理速度很慢,难以进行大模型的工业化部署。
2、因此,如何提升transformer神经网络的推理速度成为了一个亟待解决的问题。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种回复方法、装置和电子设备。
2、本公开的技术方案如下:
3、第一方面,本公开提供一种显示设备,包括:通信器,被配置为获取至少两个待识别文本对应的拼接矩阵、待识别文本对应的掩膜操作矩阵、以及待识别文本对应的前缀和矩阵;其中,拼接矩阵和前缀和矩阵一一对应,前缀和矩阵包括用于区分特征向量的间隔标识;处理器,被配置为基于通信器获取的拼接矩阵和通信器获取的前缀和矩阵,确定每个待识别文本的特征向量;处理器,还被配置为对每个特征向量执行如下操作:基于特征向量和通信器获取的掩膜操作矩阵二者进行编码,得到特性向量对应的编码结果;基于解码器的解码参数、编码结果、上一周期的解码结果、以及通信器获取的掩膜操作矩阵四者进行解码,得到特征向量的解码结果;处理器,还被配置为基于每个特征向量的解码结果,得到每个待识别文本的回复文本。
4、第二方面,本公开提供一种显示设备,包括:通
5、第三方面,本公开提供一种回复方法,包括:获取至少两个待识别文本对应的拼接矩阵、待识别文本对应的掩膜操作矩阵、以及待识别文本对应的前缀和矩阵;其中,拼接矩阵和前缀和矩阵一一对应,前缀和矩阵包括用于区分特征向量的间隔标识;基于拼接矩阵和前缀和矩阵,确定每个待识别文本的特征向量;对每个特征向量执行如下操作:基于特征向量和掩膜操作矩阵二者进行编码,得到特性向量对应的编码结果;基于解码器的解码参数、编码结果、上一周期的解码结果、以及掩膜操作矩阵四者进行解码,得到特征向量的解码结果;基于每个特征向量的解码结果,得到每个待识别文本的回复文本。
6、第四方面,本公开提供一种回复方法,包括:获取待识别文本,以及待识别文本对应的掩膜操作矩阵;基于掩膜操作矩阵和待识别文本的特征向量进行编码,得到特性向量对应的编码结果;基于解码器的解码参数、编码结果、上一周期的解码结果、以及掩膜操作矩阵四者进行解码,得到特征向量的解码结果;其中,解码参数包括第一拼接权值、第二拼接权值、以及融合偏置项,第一拼接权值基于解码器中每个全连接层的被查向量的第一权重进行拼接所得到的,第二拼接权值基于解码器中每个全连接层的内容向量的第二权重进行拼接所得到的,融合偏置项基于解码器中每个全连接层的偏置项进行拼接所得到的;基于解码结果,得到待识别文本的回复文本。
7、第五方面,本公开提供一种电子设备,包括:存储器和处理器,存储器用于存储计算机程序;处理器用于在执行计算机程序时,使得电子设备实现如第三方面提供的任一项的回复方法。
8、第六方面,本专利技术提供一种计算机可读存储介质,包括:计算机可读存储介质上存储计算机程序,计算机程序被处理器执行如第三方面提供的任一项的回复方法。
9、第七方面,本专利技术提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第三方面提供的任一项的回复方法。
10、第八方面,本公开提供一种电子设备,包括:存储器和处理器,存储器用于存储计算机程序;处理器用于在执行计算机程序时,使得电子设备实现如第四方面提供的任一项的回复方法。
11、第九方面,本专利技术提供一种计算机可读存储介质,包括:计算机可读存储介质上存储计算机程序,计算机程序被处理器执行如第四方面提供的任一项的回复方法。
12、第十方面,本专利技术提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第四方面提供的任一项的回复方法。
13、需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中,第一计算机可读存储介质可以与显示设备的处理器封装在一起的,也可以与显示设备的处理器单独封装,本公开对此不作限定。
14、本公开中第三方面、第五方面、第六方面以及第七方面的描述,可以参考第一方面的详细描述;并且,第三方面、第五方面、第六方面以及第七方面的描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
15、本公开中第四方面、第八方面、第九方面以及第十方面的描述,可以参考第一方面的详细描述;并且,第四方面、第八方面、第九方面以及第十方面的描述的有益效果,可以参考第二方面的有益效果分析,此处不再赘述。
16、在本公开中,上述显示设备的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似,属于本公开权利要求及其等同技术的范围之内。
17、本公开的这些方面或其他方面在以下的描述中会更加简明易懂。
18、本公开提供的技术方案与现有技术相比具有如下优点:
19、本公开提供的回复方法应用于transformer神经网络时,无需对待识别文本进行零填充,而是直接对待识别文本进行拼接,得到待识别文本对应的拼接矩阵。如此,可以降低进行零填充时所占用的时间。之后,基于掩膜操作矩阵和待识别文本的特征向量进行编码,得到特性向量对应的编码结果;基于解码器的解码参数、编码结果、上一周期的解码结果、以及掩膜操作矩阵四者进行解码,得到特征向量的解码结果;基于解码结果,得到待识别文本的回复文本。由于transformer神经网络在处理待识别文本时,需要进行零填充,从而可以缩短transformer神经网络的处理该待识别文本的时间。由于transformer神经网络在处理该待识别文本的时间更少了,因此可以提升transformer神经网络的推理速度,解决了如何提升transformer神经网络的推理速度的问题。
本文档来自技高网...【技术保护点】
1.一种显示设备,其特征在于,包括:
2.根据权利要求1所述的显示设备,其特征在于,所述处理器,进一步被配置为基于所述通信器获取的所述字符数和所述通信器获取的所述间隔标识,对所述拼接矩阵进行字符索引,得到每个所述待识别文本的特征向量。
3.根据权利要求1所述的显示设备,其特征在于,所述处理器,还被配置为对解码器中每个全连接层的被查向量的第一权重进行拼接,得到第一拼接权值;
4.根据权利要求1所述的显示设备,其特征在于,所述解码参数包括第一拼接权值、第二拼接权值、以及融合偏置项;
5.根据权利要求1所述的显示设备,其特征在于,所述间隔标识包括:所述待识别文本包含的字符数。
6.根据权利要求1所述的显示设备,其特征在于,所述间隔标识包括:当前处理的待识别文本的累积字符数。
7.一种显示设备,其特征在于,包括:
8.一种回复方法,其特征在于,包括:
9.一种回复方法,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,包括:所述计算机可读存储介质上存储有计算机程序,当所
...【技术特征摘要】
1.一种显示设备,其特征在于,包括:
2.根据权利要求1所述的显示设备,其特征在于,所述处理器,进一步被配置为基于所述通信器获取的所述字符数和所述通信器获取的所述间隔标识,对所述拼接矩阵进行字符索引,得到每个所述待识别文本的特征向量。
3.根据权利要求1所述的显示设备,其特征在于,所述处理器,还被配置为对解码器中每个全连接层的被查向量的第一权重进行拼接,得到第一拼接权值;
4.根据权利要求1所述的显示设备,其特征在于,所述解码参数包括第一拼接权值、第二拼接权值、以及融合偏置项;
5.根据...
【专利技术属性】
技术研发人员:王敏,杨善松,
申请(专利权)人:海信视像科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。