【技术实现步骤摘要】
一种基于音素记忆的音译方法、电子设备及存储介质
[0001]本专利技术属于自然语言处理领域,具体的说是一种基于音素记忆的音译方法、电子设备及存储介质。
技术介绍
[0002]音译指的是把源语言中的人物姓名,例如Smith,翻译为目标语言,例如中文,的文本例如史密斯),而不改变源语言中姓名的发音。例如,把源语言英语中的人名“Smith”音译为中文的“史密斯”。
[0003]现有的方法大都把这个任务视为序列到序列的生成任务,并采用高级的编码器和解码器生成目标语言的姓名音译,并且缺乏对源语言和目标语言中语音特征,特别是音素特征,的利用从而导致音译生成的词失去了源语言的发音特征,导致音译的准确性降低。
技术实现思路
[0004]本专利技术是为了解决上述现有技术存在的不足之处,提出一种基于音素记忆的音译方法、电子设备及存储介质,以期能将音素特征融合进标准的文本生成过程,从而能够提高音译的质量和效果。
[0005]本专利技术为达到上述专利技术目的,采用如下技术方案:本专利技术一种基于音素记忆的音译方法的特点在于,是按如下步骤进行:步骤1、从源语言语料库中抽取若干个音译的单词,并将每个单词拆分为字母;其中,第i个单词X
i
拆分后的字母序列记为{x
i,1
,
…
x
i,j
,
…
,},x
i,j
表示第i个单词X
i
中的第j个字母,n
i
表示第i个单词X
...
【技术保护点】
【技术特征摘要】
1.一种基于音素记忆的音译方法,其特征在于,是按如下步骤进行:步骤1、从源语言语料库中抽取若干个音译的单词,并将每个单词拆分为字母;其中,第i个单词X
i
拆分后的字母序列记为{x
i,1
,
…
x
i,j
,
…
,},x
i,j
表示第i个单词X
i
中的第j个字母,n
i
表示第i个单词X
i
中字母的总数;步骤2、从音素库中选取与第j个字母x
i,j
关联的m个音素特征,并构成音素特征集合S
i,j
={s
i,j,1
…
s
i,j,u
,
…
s
i,j,m
},其中,s
i,j,u
为与第j个字母x
i,j
关联的第u个音素特征,m为关联的音素特征的总数;步骤3、构建音译网络,包括:L层的编码器、L层的音素记忆网络、L层的解码器和分类器;步骤3.1、编码器的处理:将第j个字母x
i,j
转换为第j个字母向量后输入所述编码器中,并依次经过L层的多头自注意力层的处理后,由L层分别得到L个字母编码向量{|l=1,2,
…
,L};其中,表示第l层的多头自注意力层输出的第j个字母编码向量;步骤3.2、音素记忆网络的处理:将音素特征集合S
i,j
转换为音素向量集合{|u=1,2,
…
,m}后,与{|l=1,2,
…
,L}一起输入所述音素记忆网络中进行处理,得到增强后的n
i
个字母编码向量{|l=1,2,
…
,L;j=1,2,
…
,n
i
},并记为第i个单词X
i
的字母编码矩阵H
i
;其中,表示第u个音素s
i,j,u
的音素向量;表示增强后的第j个字母编码向量;步骤3.3、解码器的处理:将字母编码矩阵H
i
和前t时刻分类器输出的目标字母一起输入L层的解码器中,并得到t时刻解码器输出的字母预测向量h
i,t
;当t=1时,令前t时刻分类器输出的字母为空;步骤3.4、分类器的处理:所述分类器利用全连接层对t时刻解码器输出的字母预测向量h
i,t
进行处理,得到当前t时刻对第i个单词X
i
预测的目标字母y
i,t
;步骤3.5、将t+1赋值给t后,返回步骤3.3顺序执行,直至T时刻为止,从而得到第i个单词X
i
的预测字母序列{y
i,1
,
…
, y
i,t
,
…
, y
i,T
}。2.根据权利要求1所述的基于音素记忆的音译方法,其特征在于,所述步骤2包括:步骤2.1、使用式(1)计算第j个字母x
i,j
与音素库中第q个音素特征s
q
的逐点互信息PMI(x
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。