神经网络内部表示信息量确定方法、装置、设备、介质制造方法及图纸

技术编号：24518088 阅读：18 留言：0更新日期：2020-06-17 06:58

本公开提供了一种神经网络内部表示信息量确定方法、装置、设备、介质。所述神经网络内部表示信息量确定方法包括：利用所述神经网络对输入文本向量进行处理，并提取所述神经网络中的特征处理层生成的内部表示；利用探针解码器对目标文本向量以及所述内部表示进行拟合处理，得到概率值，其中，所述概率值表示由所述内部表示映射成所述目标文本向量的概率；基于所述概率值确定所述内部表示相对于所述目标文本向量的信息量。

Determination method, device, equipment and medium of information quantity of internal representation of neural network

全部详细技术资料下载

【技术实现步骤摘要】
神经网络内部表示信息量确定方法、装置、设备、介质
本公开涉及自然语言处理
，更具体地，涉及一种神经网络内部表示信息量确定方法、装置、设备、介质。
技术介绍
神经网络模型通过神经元之间的交互操作将输入信息编码映射到输出。在神经网络模型中，随着任务难度的增加，网络结构的复杂性随之增加，此外，完全相同的网络模块也存在被叠加多次的情形。目前，无法量化描述神经网络中各个网络模块所学到的信息，也即无法明确它们各自对于输出起到了怎样的作用，这限制了对于神经网络处理过程的深入理解。
技术实现思路
本公开提供一种神经网络内部表示信息量确定方法、装置、设备、介质，用于确定神经网络中的特征处理层生成的内部表示的信息量。根据本公开的一方面，提供了一种神经网络内部表示信息量确定方法，包括：利用所述神经网络对输入文本向量进行处理，并提取所述神经网络中的特征处理层生成的内部表示；利用探针解码器对目标文本向量以及所述内部表示进行拟合处理，得到概率值，其中，所述概率值表示由所述内部表示映射成所述目标文本向量的概率；以及基于所述概率值确定所述内部表示相对于所述目标文本向量的信息量。根据本公开的一些实施例，所述探针解码器包括自关注处理层、编码-解码注意力处理层和全连接处理层。根据本公开的一些实施例，所述神经网络是机器翻译神经网络，所述机器翻译神经网络包括编码器网络和解码器网络，所述解码器网络包括至少一个解码器，所述解码器包括自关注处理层、编码-解码注意力处理层和全连接处理层，其中，所述特征处理层是属于所述...

【技术保护点】
1.一种神经网络内部表示信息量确定方法，包括：/n利用所述神经网络对输入文本向量进行处理，并提取所述神经网络中的特征处理层生成的内部表示；/n利用探针解码器对目标文本向量以及所述内部表示进行拟合处理，得到概率值，其中，所述概率值表示由所述内部表示映射成所述目标文本向量的概率；以及/n基于所述概率值确定所述内部表示相对于所述目标文本向量的信息量。/n

【技术特征摘要】
1.一种神经网络内部表示信息量确定方法，包括：
利用所述神经网络对输入文本向量进行处理，并提取所述神经网络中的特征处理层生成的内部表示；
利用探针解码器对目标文本向量以及所述内部表示进行拟合处理，得到概率值，其中，所述概率值表示由所述内部表示映射成所述目标文本向量的概率；以及
基于所述概率值确定所述内部表示相对于所述目标文本向量的信息量。

2.根据权利要求1所述的方法，其中，所述探针解码器包括自关注处理层、编码-解码注意力处理层和全连接处理层。

3.根据权利要求1所述的方法，其中，所述神经网络是机器翻译神经网络，所述机器翻译神经网络包括编码器网络和解码器网络，所述解码器网络包括至少一个解码器，所述解码器包括自关注处理层、编码-解码注意力处理层和全连接处理层，
其中，所述特征处理层是属于所述解码器网络中的处理层。

4.根据权利要求1所述的方法，其中，所述基于所述概率值确定所述内部表示相对于所述目标文本向量的信息量包括：
基于所述概率值计算用于表征所述信息量的负对数似然相似度。

5.根据权利要求3所述的方法，其中，所述目标文本向量是所述输入文本向量的翻译文本向量，所述方法还包括：
基于所述内部表示相对于所述目标文本向量的信息量，改变所述机器翻译神经网络的网络结构。

6.根据权利要求5所述的方法，其中，所述全连接处理层包括加和归一化层和前馈层，其中，所述改变所述机器翻译神经网络的网络结构包括：
确定所述全连接处理层的内部表示相对于所述目标文本向量的第一信息量，并分别确定所述全连接处理层中的所述加和归一化层和所述前馈层的内部表示相对于所述目标文本向量的第二信息量和第三信息量；
基于所述第一信息量、第二信息量和第三信息量，确定删除所述全连接处理层中的至少一部分。

7.根据权利要求3所述的方法，其中，所述目标文本向量是以下中的一种：
所述输入文本向量；
所述输入文本向量的翻译文本向量，其中，所述输入文本向量对应于第一语言，所述翻译文本向量对应于不同于所述第一语言的第二语言。

8.一种神经网络内部表示信息量确定装置，包括：
内部表示单元，配置成利用所述神经网络对输入文本向量进行处理，并提取所述神经网络中的特征处理层生成的内部表示；
概率单元，...

【专利技术属性】
技术研发人员：王龙跃，杨依林，史树明，涂兆鹏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人