【技术实现步骤摘要】
词序识别性能的分析方法、装置、设备及存储介质
本申请涉及神经网络
,尤其涉及一种词序识别性能的分析方法、装置、设备及存储介质。
技术介绍
神经网络模型已经成为人工智能领域的一种核心模型。如,神经网络模型可以应用于自然语言处理中,以实现语音识别或者机器翻译等等任务。在自然语言处理中,词序信息是一种非常重要的信息维度,其中,词序是指词在词组或句子里的先后次序。由此可知,神经网络对于词序信息的识别能力(俗称的词序捕获能力)是评价神经网络对自然语言处理的处理性能的一种重要维度。而神经网络对自然语言处理任务的处理性能却与多种因素有关,如,利用神经网络进行机器翻译任务时,翻译质量不仅仅与词序有关,还会与词法、语义以及语句流畅度等因素有关,由此可知,基于神经网络对自然语言处理任务的处理结果很难有效评价神经网络的词序识别性能。基于此,如何分析出不同神经网络对于词序的识别性能是本领域技术人员迫切需要解决的技术问题。
技术实现思路
有鉴于此,本申请提供了一种词序识别性能的分析方法、装置、设备及存储介质,以实现有效的分析出神经网络对于词序的识别性能。为实现上述目的,本申请提供了如下方案:一方面,本申请提供了一种词序识别性能的分析方法,包括:获取至少一条已调序语句以及所述已调序语句中调序词的初始位置和调整后位置,所述已调序语句为通过调整初始语句中所述调序词的位置得到,所述初始位置为所述调序词在所述初始语句中的位置,所述调整后位置为所述调序词在所述已调序语句中的位置;利用待测试的神经网络模型转换出所述已调序语句对应的语句向量;针对每条所述已调序语句,依据所述已调序语句的语句向量以 ...
【技术保护点】
1.一种词序识别性能的分析方法,其特征在于,包括:获取至少一条已调序语句以及所述已调序语句中调序词的初始位置和调整后位置,所述已调序语句为通过调整初始语句中所述调序词的位置得到,所述初始位置为所述调序词在所述初始语句中的位置,所述调整后位置为所述调序词在所述已调序语句中的位置;利用待测试的神经网络模型转换出所述已调序语句对应的语句向量;针对每条所述已调序语句,依据所述已调序语句的语句向量以及训练出的位置预测模型,预测所述调序词的第一预测位置以及第二预测位置,所述第一预测位置为预测出的所述初始位置,所述第二预测位置为预测出的所述调整后位置;依据所述至少一条已调序语句中所述调序词各自对应的初始位置、调整后位置、第一预测位置以及第二预测位置,得到位置预测准确度,所述位置预测准确度用于表征所述神经网络模型识别词序信息的性能。
【技术特征摘要】
1.一种词序识别性能的分析方法,其特征在于,包括:获取至少一条已调序语句以及所述已调序语句中调序词的初始位置和调整后位置,所述已调序语句为通过调整初始语句中所述调序词的位置得到,所述初始位置为所述调序词在所述初始语句中的位置,所述调整后位置为所述调序词在所述已调序语句中的位置;利用待测试的神经网络模型转换出所述已调序语句对应的语句向量;针对每条所述已调序语句,依据所述已调序语句的语句向量以及训练出的位置预测模型,预测所述调序词的第一预测位置以及第二预测位置,所述第一预测位置为预测出的所述初始位置,所述第二预测位置为预测出的所述调整后位置;依据所述至少一条已调序语句中所述调序词各自对应的初始位置、调整后位置、第一预测位置以及第二预测位置,得到位置预测准确度,所述位置预测准确度用于表征所述神经网络模型识别词序信息的性能。2.根据权利要求1所述的词序识别性能的分析方法,其特征在于,所述依据所述已调序语句的语句向量以及训练出的位置预测模型,预测所述调序词的第一预测位置以及第二预测位置,包括:利用训练出的位置预测模型中语句向量与调整后位置的第一函数关系,并基于所述已调序语句的语句向量确定第一预测位置;利用所述位置预测模型中语句向量与初始位置的第二函数关系,并基于所述已调序语句的语句向量确定出第二预测位置。3.根据权利要求2所述的词序识别性能的分析方法,其特征在于,所述利用训练出的位置预测模型中语句向量与调整后位置的第一函数关系,并基于所述已调序语句的语句向量确定第一预测位置,包括:利用训练出的位置预测模型中语句向量与调整后位置的概率分布之间的第一函数关系,确定所述已调序语句的语句向量对应的第一概率分布,所述第一概率分布用于表征所述已调序语句中各个词所处的位置分别属于所述调整后位置的概率分布;基于所述第一概率分布,将所述已调序语句中各个词所处的位置中,对应的概率最大的位置确定为第一预测位置。4.根据权利要求3所述的词序识别性能的分析方法,其特征在于,所述利用所述位置预测模型中语句向量与初始位置的第二函数关系,并基于所述已调序语句的语句向量确定出第二预测位置,包括:利用所述位置预测模型中所述第一概率分布以及所述已调序语句的语句向量与调序词向量之间的转换函数,确定出所述调序词的预测向量;利用所述位置预测模型中所述已调序语句的语句向量以及所述调序词的预测向量与初始位置的概率分布之间的第二函数关系,确定出第二概率分布,所述第二概率分布用于表征所述已调序语句中各个词所处的位置属于所述初始位置的概率分布;基于所述第二概率分布,将所述已调序语句中各个词所处的位置中,对应的概率最大的位置确定为第二预测位置。5.根据权利要求3所述词序识别性能的分析方法,其特征在于,所述利用训练出的位置预测模型中语句向量与调整后位置的概率分布之间的第一函数关系,确定所述已调序语句的语句向量对应的第一概率分布,包括:基于训练出的位置预测模型中的如下第一函数关系,确定出所述已调序语句的语句向量对应的第一概率分布PI:其中,H为所述已调序语句的语句向量,UI为训练所述位置预测模型的过程中确定出的第一参数矩阵,WI为训练所述位置预测模型的过程中确定出的第二参数矩阵;softmax为归一化函数。6.根据权利要求4所述的词序识别性能的分析方法,其特征在于...
【专利技术属性】
技术研发人员:王龙跃,涂兆鹏,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。