中译语通科技股份有限公司专利技术

中译语通科技股份有限公司共有198项专利

  • 本发明属于机器翻译技术领域,公开了一种提升多语言神经机器翻译模型零样本翻译能力的方法,包括:设计损失函数:计算训练样本中的源语言句子和目标语言句子对应的Encoder输出之间的相似度,并相应相似度添加到原有的Loss中,用所述Loss优...
  • 本发明属于新闻网页处理技术领域,公开了一种基于多模态机器学习的新闻网页正文抽取系统及方法,基于多模态机器学习的新闻网页正文抽取方法包括:进行不同类型特征的提取;多模态融合,进行特征的联合表示;进行网页正文分类模型训练。本发明使用多模态机...
  • 本发明属于语音翻译技术领域,公开了一种降低端到端语音翻译跨模态跨语言障碍的方法及系统,所述降低端到端语音翻译跨模态跨语言障碍的系统,包括语音编码器和文本解码器;所述降低端到端语音翻译跨模态跨语言障碍的方法包括:数据集以及数据处理;模型预...
  • 本申请适用于计算机技术领域,提供了一种病案编码方法、装置、终端设备及可读存储介质。病案编码方法包括:获取待编码病案;将所述待编码病案输入预先建立的实体抽取模型,输出所述待编码病案中包含的实体,得到目标实体;其中,所述实体抽取模型是将预先...
  • 本发明属于机器翻译断句处理技术领域,公开了一种面向波斯语机器翻译的断句方法、系统及应用,获取待处理的波斯语句子,对句子进行预处理,将其中波斯语数字转成阿拉伯数字;前向规则切分:利用正向匹配的方法,遇小数进行判断的方式,通过句子分隔符将波...
  • 本发明属于信息处理技术领域,公开了一种藏文分词信息处理方法、系统、存储介质、终端及应用,所述藏文分词信息处理方法通过词向量、卷积神经网络以及条件随机场对分词语料进行学习,生成藏文单词分界规则,最终实现对藏文的分词。所述藏文分词信息处理系...
  • 本发明公开了一种文本内容质量评估方法及系统,通过词性标签的N‑gram构建特征工程并建立分类模型的构思来有效识别文本中的无效信息,并为整体的文本内容打分,本发明可以应用于智能数据挖掘系统中,作为预处理的一部分,去除无价值信息,最大限度地...
  • 本发明属于机器翻译技术领域,公开了一种机器翻译领域自适应方法、系统、介质、计算机设备,包括:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译。本发明针对领域机器翻译的实际应用...
  • 本发明属于机器翻译技术领域,公开了一种神经网络机器翻译训练方法、系统、介质、设备,所述神经网络机器翻译训练方法包括:训练mBART模型;使用双语语料,基于mBART模型进行增量训练;翻译单语,构建伪平行数据;使用伪平行数据和双语语料,基...
  • 本发明属于同名消歧技术领域,公开了一种提升逐篇归档的效率的人物重名消歧方法、系统、设备,根据名称划分名称组;获取名称组对应的文本集;基于规则拆分文本集,划分文本组;计算文本组间的相似度;所述提升逐篇归档的效率的同名消歧系统包括:名称组划...
  • 本申请适用于计算机技术领域,提供了一种知识图谱本体构建方法、装置、终端设备及可读存储介质。知识图谱本体构建方法包括:获取目标领域的语料;将所述目标领域的语料输入目标实体抽取模型,输出目标主谓宾实体,其中,所述目标实体抽取模型是基于通用领...
  • 本公开提供了一种异步网络机器翻译请求的处理方法及装置,包括:以预设间隔时间获取网络机器翻译请求任务;解析所述请求任务,并将解析结果发送到不同的语言队列;基于每一所述语言队列,统计所述请求任务中待翻译文本的语句数量总和、字符数量总和以及时...
  • 本发明属于数据处理技术领域,公开了一种交互式无监督标签分类系统、方法、介质、终端,利用伪标签及预训练模型,对数据集进行无监督分类,通过增加拓展词汇,进行辅助分类,以及在所述预训练模型中增加负节点或负样本排除负样本作用范围内的空间。本发明...
  • 本发明属于网络信息数据处理技术领域,公开了一种事件认证和记录方法、系统、计算机设备及应用,所述事件认证和记录方法以区块链节点投票方式进行事件真实性验证;对参与投票的节点按照贡献度予以奖励;投票事件真实性结果保存区块链,并提供所有节点查询...
  • 本发明属于大数据监测分析技术领域,公开了一种基于新闻大数据的网络情绪波动指数监测分析方法及系统,采用风险放大理论与网络情绪波动心理传播,对数据库中的数据,按照网络情绪波动指数划分维度及指标进行实时统计,得出指标的具体数值;利用神经网络模...
  • 本发明属于数据处理技术领域,公开了一种基于图结构的别名合并及存储方法、系统、终端、介质,创建基础名称节点;挖掘关系,并构建辅助节点;构建边关系,生成图;重复创建基础名称节点、挖掘关系、构建辅助节点、构建边关系、生成图,对关系类型进行扩充...
  • 本发明实施例提供一种获取机构技术相似性的方法及装置。其中,方法包括:获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性...
  • 本发明实施例提供一种新闻传播速度测评方法和系统,核心是基于新闻媒体权重计算新闻事件主题的传播速度,再通过聚类分析确定传播速度测评体系,最后评定新闻事件主题的传播等级。其中方法包括:确定待测评的新闻事件主题,获取新闻事件主题的新闻数据;基...
  • 本发明公开了一种从电子病历中提取出ICD编码的方法及系统,该从电子病历中提取出ICD编码的方法包括:基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的一个...
  • 本发明公开了一种关键词提取方法及系统,该方法包括:对新闻文本进行分词从而将所述新闻文本切分成以词为最小语义单元的序列;对所述新闻文本进行实体识别;对所述序列中的位置相邻的至少两个词进行组合,获得组合后的词汇,判断所述组合后的词汇是否为某...