当前位置: 首页 > 专利查询>曾传德专利>正文

适用于机器学习的采集系统技术方案

技术编号:17007418 阅读:289 留言:0更新日期:2018-01-11 03:48
本发明专利技术公开了适用于机器学习的采集系统,包括:储存翻译原文和与翻译原文对应的翻译译文的翻译数据库;在翻译数据库中选取与样本原文最相似的翻译原文的对比模块;公开发布样本原文和对比模块选取出的与样本原文最相似的翻译原文的公开平台;公开平台还公开征集样本原文对应的样本译文和翻译原文对应的翻译译文;同一应征者必须完成一份样本译文和翻译译文;对比模块还将同一应征者完成的样本译文和翻译译文同时提取出来,并将翻译译文与翻译数据库中的翻译译文进行对比。本发明专利技术适机器学习的采集系统,由于的翻译原文与样本原文相似,则可以认为该应征者可以有效的完成样本原文的翻译工作,从而保证了翻译样本的质量,非常适合机器学习。

【技术实现步骤摘要】
适用于机器学习的采集系统
本专利技术涉及计算机
,具体涉及适用于机器学习的采集系统。
技术介绍
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。同时,机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。虽然机器翻译通过机器学习可以达到很好的翻译水平,但是机器学习需要大量的翻译样本,获取大量的翻译样本需要很高的人力成本,并且获取的翻译样本质量参差不齐,不适合机器学习。
技术实现思路
本专利技术所要解决的技术问题是现有的机器学习需要大量的翻译样本,获取大量的翻译样本需要很高的人力成本,并且获取的翻译样本质量参差不齐,不适合机器学习,目的在于提供适用于机器学习的采集系统,解决上述问题。本专利技术通过下述技术方案实现:适用于机器学习的采集系统,包括:用于储存翻译原文和与翻译原文对应的翻译译文的翻译数据库;用于选取样本原文的样本选取模块;用于在翻译数据库中选取与样本原文最相似的翻译原文的本文档来自技高网...
适用于机器学习的采集系统

【技术保护点】
适用于机器学习的采集系统,其特征在于,包括:用于储存翻译原文和与翻译原文对应的翻译译文的翻译数据库;用于选取样本原文的样本选取模块;用于在翻译数据库中选取与样本原文最相似的翻译原文的对比模块;用于公开发布样本原文和对比模块选取出的与样本原文最相似的翻译原文的公开平台;所述公开平台还用于公开公开征集样本原文对应的样本译文和翻译原文对应的翻译译文;同一应征者必须完成一份样本译文和翻译译文;所述对比模块还用于将同一应征者完成的样本译文和翻译译文同时提取出来,并将翻译译文与翻译数据库中的翻译译文进行对比;如果应征者完成的翻译译文与翻译数据库中的翻译译文的相似度大于通过阈值,则对比模块将该应征者完成的样...

【技术特征摘要】
1.适用于机器学习的采集系统,其特征在于,包括:用于储存翻译原文和与翻译原文对应的翻译译文的翻译数据库;用于选取样本原文的样本选取模块;用于在翻译数据库中选取与样本原文最相似的翻译原文的对比模块;用于公开发布样本原文和对比模块选取出的与样本原文最相似的翻译原文的公开平台;所述公开平台还用于公开公开征集样本原文对应的样本译文和翻译原文对应的翻译译文;同一应征者必须完成一份样本译文和翻译译文;所述对比模块还用于将同一应征者完成的样本译文和翻译译文同时提取出来,并将翻译译文与翻译数据库中的翻译译文进行对比;如果应征者完成的翻译译文与翻译数据库中的翻译译文的相似度大于通过阈值,则对比模块将该应征者完成的样本译文和原文样本放入翻译数据库。2.根据权利要求1所述的适用于机器学习的采集系统,其特征在于,所述对比模块对比两个...

【专利技术属性】
技术研发人员:曾传德
申请(专利权)人:曾传德
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1