四川语言桥信息技术有限公司专利技术

四川语言桥信息技术有限公司共有26项专利

  • 本发明属于内存占用统计技术领域,提供了一种基于linux页表统计进程的物理内存占用的方法、装置及计算机可读存储介质,其中,方法包括:(1)统计程序进入内核,在内核态下运行;(2)通过传入的参数获取到进程结构体;(3)通过所述进程结构体获...
  • 本发明属于机器翻译技术领域,提供了一种基于词对齐模型的标签还原方法、装置及计算机可读存储介质,方法包括:采用预设的分词方法训练一个词对齐模型;对翻译原文进行去标签处理;翻译去标签原文;将去标签原文和初始译文均进行分词处理;将分词处理后的...
  • 本发明属于计算机技术领域,提供了一种基于分布式缓存系统的防止表单重复提交方法、装置及计算机可读存储介质,其中,方法步骤S1:后端通过网关接收用户的表单提交请求,并随机分发至集群中的任意服务器上;步骤S2:后端使用分布式缓存系统,根据用户...
  • 本发明属于机器翻译技术领域,提供了一种基于机器翻译与语义相似度对比的句对齐方法、装置及计算机可读存储介质,本发明通过机器翻译以及语义相似度对比后,可以对分句后的句子分别进行语义匹配,能保证匹配到的句子是完整对译的,可以对不匹配的句子进行...
  • 本发明属于应用程序发布技术领域,提供了一种基于
  • 本发明属于机器翻译技术领域,提供了一种
  • 本发明属于机器翻译技术领域,提供了一种根据向量表示生成的提升机翻鲁棒性增强数据的方法
  • 本发明属于机器翻译技术领域,提供了一种基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质,其中方法包括:步骤S1:训练一个NMT模型作为预训练模型;步骤S2:将训练集的源语言句子输入NMT模型中,生成n个最佳翻译结果的译文...
  • 本发明属于机器翻译技术领域,提供了一种模块化神经网络机器翻译模型及人在闭环交互式人工智能辅助翻译系统、方法,其中,人在闭环交互式人工智能辅助翻译系统包括块化神经网络机器翻译模型,根据源语言输入,融合人类提示,输出目标语言翻译;提示训练集...
  • 本发明属于机器翻译技术领域,提供了一种基于细粒度特征的机翻评估指标的解释方法、解释器模型及计算机可读存储介质。本发明通过细粒度特征的机翻评估指标的解释方法/解释器模型,解决了机翻质量评估模型的可解释性不足的问题,并且为质量评估分数提供了...
  • 本发明适用于机器翻译技术领域,提供了一种基于噪声信道模型的重排序方法、装置及终端设备,所述噪声信道模型包括串联的正向翻译模型、语言模型和反向翻译模型,方法包括:获取待翻译原文、原始译文、正向翻译模型的输出、语言模型的输出和反向翻译模型的...
  • 本发明适用于机器翻译技术领域,提供了一种机器翻译方法、装置及终端设备,方法包括:通过语法解析器对待翻译原文进行翻译,获得译文;识别待翻译原文中具有单独样式的文字部分;对文字部分进行翻译,并根据翻译结果在译文中寻找相同的译文词语,其中,在...
  • 本发明适用于机器翻译技术领域,提供了一种基于模仿学习的机器翻译方法、装置及终端设备,方法包括:将待翻译原文输入非自回归模型获得第一初始译文;第一初始译文经过删除分类解码器时,删除第一初始译文中的错误单词,输出第二初始译文;第二初始译文经...
  • 本发明适用于人工智能技术领域,提供了一种基于语言处理的词向量表征方法、装置及终端设备,方法包括构建输入词表;设置输入词表中每个词汇的词频信息;根据词频信息将词汇分类为N簇,具有相同词频信息的词汇分类到同一集合中,获得具有N个子集的分簇集...
  • 本发明适用于计算语言学和翻译技术领域,提供了一种垂域语料提取方法、装置及终端设备,方法包括获取垂域语料与通用语料;基于垂域语料与通用语料计算垂域得分;根据垂域得分将目标句子划分至垂域语料数据库或非垂域语料数据库中。通过本发明可从大量的通...
  • 本发明公开了一种机器翻译的语料分词预处理方法,涉及机器翻译预处理技术领域,解决现有分词预处理中单词浪费占位和分词粒度大的问题,包括以下步骤:对原始语料按语言规则进行数据清洗;对清洗后的语料进行符号标准化处理;对符号标准化后的语料进行分词...
  • 本发明提供一种训练机器翻译模型的系统、方法、电子设备及存储介质,训练机器翻译模型的方法包括:获取待翻译的原译文;基于所述原译文搜集多语词典;基于所述多语词典搜集所述原译文对照的平行语料;通过所述多语词典将所述平行语料中所述原译文中的词语...
  • 本发明提供一种基于术语保护的机器翻译方法及装置,通过搜集海量平行语料,对其进行分词,得到第一集合,并将其输入训练后的IBM Model模型中,输出词对齐概率;根据词对齐概率,对原文中的词进行特殊符号的替换,对译文中的词进行特殊符号的替换...
  • 本发明提供一种基于IBMmodel的语料过滤方法及装置,通过搜集目标语言的海量训练语料,包含原文和其对应的标准译文;对原文和其对应的标准译文进行分词,得到第一集合;将所述第一集合输入IBMModel模型中训练,得出词对齐概率分布和词位置...
  • 本申请公开了一种稿件分配方法、装置、设备和存储介质。方法包括获取目标稿件和预设的译员库,并确定目标稿件的文件标识;根据文件标识以及目标稿件的翻译要求,对译员库中的多个译员进行筛选,得到第一译员集合,其中,第一译员集合包括多个目标译员以及...