中译语通科技股份有限公司专利技术

中译语通科技股份有限公司共有198项专利

  • 本发明公开基于后编辑译文的多任务机器翻译质量估计方法和系统,其中,基于后编辑译文的多任务机器翻译质量估计方法包括:使用跨语言预训练mBART模型作为基础框架,执行包括句子级翻译质量估计任务和基于后编辑译文任务的多任务联合训练,得到总体损...
  • 本申请提供了一种数据抓取策略的确定方法、装置及设备,其中,该方法包括:针对每个爬虫测试程序,从该爬虫测试程序中抽取该爬虫测试程序对应的爬虫行为特征,并确定该爬虫测试程序对应的测试爬取目标针对该爬虫测试程序的反馈结果;根据所有爬虫测试程序...
  • 本发明公开了一种人名翻译方法、系统、设备及计算机可读存储介质,所述方法包括以下步骤:根据越南姓氏的越南字母获取对应的英文字母,并将越南人名单词的越南字母转为英文字母形式;根据收集的越南姓氏以及越南人名对应的英文字母,将越南姓氏以及越南人...
  • 本申请提供了一种机器翻译方法、装置、电子设备和可读存储介质。所述方法包括:获取终端发送的请求包,其中,所述请求包中携带有请求通道和请求参数;根据所述请求参数,确定所述请求包对应的数据库中的请求包队列;在确定定时时长达到时长阈值或加入所述...
  • 本发明公开一种窗口级别的混合专家模型及其生成方法,其中,窗口级别的混合专家模型的生成方法包括:根据预定语句划分规则,将输入的语句划分为一个或多个窗口,其中,窗口的数量小于语句中词的数量;通过路由算法选择窗口对应的专家模型,将窗口发送至专...
  • 本发明公开了一种数据的处理方法、系统、设备及计算机可读存储介质,所述方法包括以下步骤:抽取待翻译句子中的数字;将抽取的数字转成无单位数字,具体包括:定义表示数字范围的符号;将所述抽取的数字与定义的数字范围的符号进行对比;根据对比结果,将...
  • 本说明书实施例提供了一种基于自动化模拟器的账号登入信息初始化方法及系统,其中,方法包括构建登入信息文件;系统遍历读取登入信息文件中的登入信息,根据登入信息通过访问协议登入邮件服务器,并打开INBOX收件箱;系统启动可视化网页浏览模拟器,...
  • 本申请提供了基于机器翻译的多语言字幕展示方法、系统、设备及介质,其中,在会议开始后,在现场显示器的图形用户界面中实时展示演示文稿和文字显示控件,文字显示控件中显示目标文本信息和目标翻译结果;现场端通过语音采集终端实时采集语音信息;现场端...
  • 本申请提供了一种社交数据爆发时间点的预测方法、装置及存储介质,预测方法包括:获取预设历史时间段内的历史社交数据下,以及历史社交数据在每一历史时间点下的行为交互数据;基于历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列...
  • 本申请提供了一种短视频质量的确定方法、装置、电子设备及存储介质,包括:对待检测的短视频进行特征提取,确定出待检测的短视频的时间序列特征;将待检测的短视频的时间序列特征输入至与预先训练好的视频质量检测模型之中,确定出待检测的短视频的质量等...
  • 本申请提供了一种目标多语言神经机器翻译模型的构建方法。所述方法包括:将平行语料和伪平行语料作为初始训练样本;采用预设清洗方案对所述初始训练样本进行数据清洗,得到目标训练样本,其中,所述预设清洗方案包括:去除所述初始训练样本中不符合预设条...
  • 本说明书实施例提供了一种公共社区用户地理位置标签预测方法、系统、设备及介质,其中,方法包括获取社区用户发布数据;获取的数据输入至训练好的用户地理位置标签预测模型,预测获得用户地理位置标签;用户地理位置标签预测模型通过社区历史数据训练得到...
  • 本公开实施例公开了一种机器翻译模型训练方法、装置、设备及存储介质。其中,机器翻译模型训练方法包括:S110:利用单语语料训练得到初始机器翻译模型;S120:基于正向双语语料和逆向双语语料,分别对初始机器翻译模型进行增量训练,得到正向机器...
  • 本发明属于人工智能技术领域,公开了一种基于信息融合的跨语言实体对齐方法、系统、设备及介质,包括:基于属性信息融合的向量空间映射,基于图神经网络的邻居实体融合,基于迭代关系共现的实体对齐。本发明通过融合属性信息对实体进行了向量空间映射,使...
  • 本申请提供了基于身份验证的远程会议同步方法、系统、设备及介质,其中,在会议开始后,在现场显示器的图形用户界面中实时展示演示文稿、文字显示控件和图像显示控件,文字显示控件中显示目标文本信息和目标翻译结果,图像显示控件中显示会议二维码;在用...
  • 本发明公开一种基于课程化预训练的机器翻译风格的迁移方法和系统,其中,基于课程化预训练的机器翻译风格的迁移方法,包括:对平行语料和单语语料分别进行分词处理,得到训练语料;使用训练语料以及训练语料对应的模型任务,对机器翻译模型进行课程化预训...
  • 本发明公开一种基于汉字形音义多元知识的文本语义匹配方法和系统,其中,文本语义匹配方法包括:获取一对比较文本,对其中每个文本的形音义进行解析,得到每个文本的汉字信息、拼音信息和释义信息;使用上述信息对一对比较文本进行形音义多元知识的融合,...
  • 本申请提供了基于术语库的多语言文字替换方法、系统、设备及介质,其中,在会议开始后,在所述现场显示器的图形用户界面中实时展示演示文稿和文字显示控件,文字显示控件中显示目标文本信息和目标翻译结果;现场端通过语音采集终端实时采集语音信息后通过...
  • 本申请公开了一种翻译文本的生成方法和装置、存储介质、电子装置。其中,该方法包括:获取第一文本,第一文本为采用第一语言的、待翻译为第二语言的文本;展示机器翻译模型对第一文本进行翻译得到的第二文本,第二文本为采用第二语言的文本;根据与用户的...
  • 本发明提出一种关系抽取方法、系统、设备及存储介质,该方法包括:获取待抽取目标文本;将所述待抽取目标文本输入到关系抽取模型中,获取所述待抽取目标文本对应的实体关系,其中,所述关系抽取模型为神经网络模型,所述关系抽取模型通过样本文本和样本标...