【技术实现步骤摘要】
一种基于独立语言特征的朝汉机器翻译方法
[0001]本专利技术属于机器翻译领域,具体涉及一种基于独立语言特征的朝汉机器翻译方法
。
技术介绍
[0002]朝鲜族是我国的少数民族之一,主要通用语言为朝鲜语,文化交流是民族文化融会贯通和共同发展必不可少的手段与途径,因此朝汉机器翻译是汉朝两族文化交流的关键
。
机器翻译
(Machine Translation
,
MT)
是指利用计算机程序将某段文本从一种语言翻译成另一种语言的任务
。MT
主要经过了三个阶段,分别是基于规则的方法
、
基于统计的方法和基于深度学习的方法
。
前两种方法分别存在翻译成本过高和生成译文质量低下等问题,其翻译效果不够理想
。
神经机器翻译
(Neural Machine Translation
,
NMT)
是一种直接使用人工神经网络和深度学习以端到端方式进行翻译建模的机器翻译方法
。 >该方法在机器翻译方本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于独立语言特征的朝汉机器翻译方法,其特征在于,所述方法包括:
S1
数据准备:收集朝汉平行语料作为训练数据,并搜集英汉双语词典和英朝双语词典作为基础词典;
S2
利用基础词典中的朝语
‑
英语对和英语
‑
汉语对,通过枢纽语言英语来构建朝汉双语词典;
S3
利用
Hanjaro
方法提取平行语料中的汉字词对作为上述朝汉双语词典的补充词对;
S4
使用多语
MUSE
模型作为特征提取工具,通过多次迭代训练,将朝语
、
汉语和英语的词向量映射到一个共享的语义空间,提取独立的语言特征;
S5
利用汉字词的独立语言特征初始化对应词汇的词向量作为机器翻译模型的部分输入,并利用平行语料对翻译模型进行训练,实现朝汉双语机器翻译
。2.
根据权利要求1所述的基于独立语言特征的朝汉机器翻译方法,其特征在于,所述多语
MUSE
模型由编码器
、
解码器和辨别器组成
。3.
根据权利要求1所述的基于独立语言特征的朝汉机器翻译方法,其特征在于,针对汉字词的多义性问题,引入线性变换层进行微调
。4.
根据权利要求3所述的基于独立语言特征的朝汉机器翻译方法,其特征...
【专利技术属性】
技术研发人员:赵亚慧,刘帆,崔荣一,金国哲,卢星华,金哲俊,张振国,黄政豪,李永恒,孟嘉,
申请(专利权)人:延边大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。