【技术实现步骤摘要】
机器翻译方法、装置及可读存储介质
本申请实施例涉及机器翻译领域,特别涉及一种机器翻译方法、装置及可读存储介质。
技术介绍
机器翻译是通过计算机将一种自然语言的句子翻译成另一种自然语言的句子的翻译方式,通常,该机器翻译是通过训练好的机器学习模型对句子进行翻译,示意性的,机器学习模型通过大量的翻译语料样本进行训练后,用户将中文句子“房价持续增长”输入该机器学习后,输出得到英文翻译“Thehousingpricescontinuedtorise”,而针对某些特定领域的某些词汇的机器翻译,与普通的机器翻译中的翻译方式不同,如:在一些较为正式的报告中,地名“北京”被翻译为“Peking”,而在课本中,地名“北京”被翻译为“Beijing”。相关技术中,针对特定领域的机器翻译,需要设置特定的机器学习模型进行翻译,也即通过该特定领域的翻译语料样本对机器学习模型进行训练后,得到训练后的该特定领域的特定机器学习模型,并应用该特定机器学习模型对该特定领域的待翻译语句进行翻译。然而,当该机器翻译涉及的领域较多时,则需要对每个领域都设置一个特定的机器学习模型,也即需要对每个领域的机器学习模型分别进行训练,训练过程中需耗费大量的时间及人力,针对每个领域的机器翻译对机器学习模型的训练过程较为繁琐。
技术实现思路
本申请实施例提供了一种机器翻译方法、装置及可读存储介质,可以解决针对每个领域的机器翻译对机器学习模型的训练过程较为繁琐的问题。所述技术方案如下:一方面,提供了一种机器翻译方法,所述方法包括:接收待翻译的源端语句,所述源端语句为目标领域的语句;确定与所述目标领域对应的短语表,所述短 ...
【技术保护点】
1.一种机器翻译方法,其特征在于,所述方法包括:接收待翻译的源端语句,所述源端语句为目标领域的语句;确定与所述目标领域对应的短语表,所述短语表中包括所述目标领域的源端词汇和目标端词汇的对应关系,每个所述源端词汇与至少一个目标端词汇对应,所述源端词汇和所述源端语句对应第一自然语言,所述目标端词汇对应第二自然语言;通过机器学习模型根据所述短语表将所述第一自然语言的源端语句翻译为所述第二自然语言的目标语句。
【技术特征摘要】
1.一种机器翻译方法,其特征在于,所述方法包括:接收待翻译的源端语句,所述源端语句为目标领域的语句;确定与所述目标领域对应的短语表,所述短语表中包括所述目标领域的源端词汇和目标端词汇的对应关系,每个所述源端词汇与至少一个目标端词汇对应,所述源端词汇和所述源端语句对应第一自然语言,所述目标端词汇对应第二自然语言;通过机器学习模型根据所述短语表将所述第一自然语言的源端语句翻译为所述第二自然语言的目标语句。2.根据权利要求1所述的方法,其特征在于,所述通过机器学习模型根据所述短语表将所述第一自然语言的源端语句翻译为第二自然语言的目标语句,包括:在所述短语表中查找与所述源端语句对应的n个源端词汇;在所述对应关系中确定与所述n个源端词汇对应的m个目标端词汇,所述m个目标端词汇组合成为目标端词汇表,m和n为正整数;通过所述机器学习模型根据所述目标端词汇表将所述第一自然语言的源端语句翻译为所述第二自然语言的所述目标语句。3.根据权利要求2所述的方法,其特征在于,所述通过机器学习模型根据所述目标端词汇表将所述第一自然语言的源端语句翻译为第二自然语言的目标语句,包括:根据所述目标端词汇表确定所述机器学习模型中的目标分类矩阵,所述目标分类矩阵用于根据所述源端语句对所述目标端词汇表中每个目标端词汇生成所述目标语句的概率进行确定;将所述源端语句输入所述机器学习模型,输出得到所述目标语句。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标端词汇表确定所述机器学习模型中的目标分类矩阵,包括:通过所述目标端词汇表对初始分类矩阵进行过滤,得到所述目标分类矩阵,所述初始分类矩阵中包括至少两个领域对应的目标端词汇,所述至少两个领域中包括所述目标领域。5.根据权利要求2至4任一所述的方法,其特征在于,所述在所述短语表中查找与所述源端语句对应的n个源端词汇,包括:对所述源端语句进行分词处理,得到至少一个分词词汇;在所述短语表中查找包括所述至少一个分词词汇的n个源端词汇。6.根据权利要求2至4任一所述的方法,其特征在于,所述在所述对应关系中确定与所述n个源端词汇对应的m个目标端词汇,包括:在所述对应关系中确定与所述n个源端词汇对应的k个目标端词汇,所述k个目标端词汇中包括出现至少两次的词汇;对所述k个目标端词汇进行去重处理,得到所述m个目标端词汇。7.根据权利要求1至4任一所述的方法,其特征在于,所述确定与所述目标领域对应的短语表之前,还包括:接收参考内容,所述参考内容为与所述目标领域对应的内容,所述参考内容中包括属于所述目标领域的语料,所述语料包括源端语料以及与所述源端语料对应的已翻译语料;对所述源端语料和所述已翻译语料中的短语进行对应抽取,生成所述短语表;或,根据所述参考内容对初始短语表进行过滤,得到所述短语表...
【专利技术属性】
技术研发人员:黄江泉,谢军,王明轩,
申请(专利权)人:腾讯科技武汉有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。