商品标题文本翻译方法及其装置、设备、介质、产品制造方法及图纸

技术编号:33533151 阅读:28 留言:0更新日期:2022-05-19 02:08
本申请公开一种商品标题文本翻译方法及其装置、设备、介质、产品,所述方法包括:获取用于描述商品信息的标题文本,确认该标题文本所携带的至少一个词汇包含多个对应的译文;识别该确认的标题文本所属的领域类别,确定该领域类别相对应的领域词;构造包含所述领域词的示范模板,将其与该标题文本组合为源语言文本;采用已训练至收敛状态的机器翻译模型对所述源语言文本进行翻译,获得该源语言文本相对应的目标语言文本,从目标语言文本中获得标题文本的译文。本申请通过为待翻译的标题文本添加起引导作用的包含该标题文本的领域词的示范模板,可指导机器翻译模型准确翻译出标题文本所属领域相对应的术语,提升翻译准确度。提升翻译准确度。提升翻译准确度。

【技术实现步骤摘要】
商品标题文本翻译方法及其装置、设备、介质、产品


[0001]本申请涉及电商机器翻译
,尤其涉及一种商品标题文本翻译方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]在跨境类型的电商产品中,商品标题翻译是沟通跨境电商卖家与买家之间的关键桥梁,准确的商品标题翻译可以在商品展示描述搜索推荐场景起到至关重要的连接作用。准确的商品标题翻译文本可以大大提升商品在平台中的曝光程度,从而提升跨境电商平台的商品销量以及转化率,然而现有商品标题翻译主要存在以下问题:
[0003]机器翻译领域中,传统解决一词多义问题的方式,通常是采用添加不同翻译结果语料来解决,使相应的机器翻译模型经训练习得识别多义译文的能力,但该方法须依赖大量同一词汇的不同翻译语料,而实践中,很多时候数据量难以足量采集,导致模型优化效果较差,因此该方法费时费力且常无法得到理想结果。
[0004]改进的方法是对预训练的机器翻译模型实施微调训练,利用小数据集对预训练的机器翻译模型进行微调,但该方式对于语料所属领域信息较不敏感,无法准确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种商品标题文本翻译方法,其特征在于,包括如下步骤:获取用于描述商品信息的标题文本,确认该标题文本所携带的至少一个词汇包含多个对应的译文;识别该确认的标题文本所属的领域类别,确定该领域类别相对应的领域词;构造包含所述领域词的示范模板,将其与该标题文本组合为源语言文本;采用已训练至收敛状态的机器翻译模型对所述源语言文本进行翻译,获得该源语言文本相对应的目标语言文本,从目标语言文本中获得标题文本的译文。2.根据权利要求1所述的商品标题文本翻译方法,其特征在于,获取用于描述商品信息的标题文本,确认该标题文本所携带的至少一个词汇包含多个对应的译文,包括如下步骤:获取用于描述商品信息的标题文本,对所述标题文本进行分词,获得多个词汇;查询预设的翻译词典,以判断确认标题文本中的至少一个词汇是否包含多个译文;其中,所述翻译词典包含词汇的源语言文本与其多个不同译文的目标语言文本之间的映射关系数据。3.根据权利要求1所述的商品标题文本翻译方法,其特征在于,识别该确认的标题文本所属的领域类别,确定该领域类别相对应的领域词,包括如下步骤:对所获取的标题文本进行分词,获得多个词汇;检测所述标题文本的各个词汇是否命中各个领域词典,量化出标题文本命中各个领域词典相对应的命中率,每个领域词典关联一个领域词,且收藏属于其相对应的特定领域的词汇;判定所述命中率最大的领域词典为与所述标题文本相匹配的领域词典,确定该领域词典相对应的领域词以确定该标题文本相对应的领域类别。4.根据权利要求1所述的商品标题文本翻译方法,其特征在于,识别该确认的标题文本所属的领域类别,确定该领域类别相对应的领域词,包括如下步骤:采用预先训练至收敛状态的标题分类模型,对所获取的标题文本进行分类映射,获得该标题文本相对应的领域类别;根据所述领域类别获得其相对应的领域词。5.根据权利要求1所述的商品标题文本翻译方法,其特征在于,构造包含所述领域词的示范模板,将其与该标题文本组合为源语言文本,包括如下步骤:根据预设规则生成示范模板,使该示范模板中包含所述标题文本相对应的领域词及固定词;将所述示范模板作为前缀或后缀与所述标题文本相拼接,构成源语言文本。6.根据权利要求1至5中任意一项所述的商品标题文本翻...

【专利技术属性】
技术研发人员:钟裕滨庞磊
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1