【技术实现步骤摘要】
翻译语句结束判断方法与系统
本申请属于机器学习领域,尤其涉及一种翻译语句结束判断方法与系统。
技术介绍
在翻译过程中,通常需要对一个较长的待译文本进行切分。切分的一个必要条件是切分后的各个子部分都应该是一个完整独立的语料,不能将一个句子的上下半句切分到不同子部分中;此外,翻译过程通常需要机器翻译的辅助,翻译人员通常需要将待译文本上传至机器翻译工具中,虽然现有的机器翻译引擎支持整段的上传翻译,但是这种方式翻译结果较差,因此,翻译人员通常是需要一句一句的将单个的完整句子上传,才能得到相对比较完成的结果;在另一种场景中,还需要校对翻译后的结果是否正确,此时也需要以完整的句子为单位上传文本进行检查。在这个过程中,面临的一个重要问题就是:如何切分得到完整的句子。一个简单的判断方式是,以句子结束符号为判断依据,例如,通常认为如果某段连续的文本以句号、问号、感叹号结束,则认为该句子结束,可以认为该连续文本构成了一个完整的句子;基于这种思路,可以采用检测特定的符号的方式实现句子结束检测从而完成句子切分。当然,这种方式能够实现预定效果的前提是要处理的文本在形成时便严格遵守标点符号使 ...
【技术保护点】
1.一种翻译语句结束判断系统,该系统包括文本导入装置、段落识别装置、语句识别装置、语义组合装置以及可信度判别装置;所述文本导入装置导入待处理文本,所述段落识别装置对导入的待处理文本进行初步处理,得到以段落为单位的段落子部分集合;其特征在于:所述语句识别装置按照以段落为单位,对所述段落子部分集合进行处理,具体处理步骤包括:(1)从当前段落的第一个未读字符开始连续读取剩余字符,直到读取到停顿符号为止;读取的连续字符构成待处理句;(2)从所述待处理句中提取多个句子主干词;(3)将所述多个句子主干词输入所述语义组合装置,所述语义组合装置基于云端语料库输出至少一个比较句;(4)将所述 ...
【技术特征摘要】
1.一种翻译语句结束判断系统,该系统包括文本导入装置、段落识别装置、语句识别装置、语义组合装置以及可信度判别装置;所述文本导入装置导入待处理文本,所述段落识别装置对导入的待处理文本进行初步处理,得到以段落为单位的段落子部分集合;其特征在于:所述语句识别装置按照以段落为单位,对所述段落子部分集合进行处理,具体处理步骤包括:(1)从当前段落的第一个未读字符开始连续读取剩余字符,直到读取到停顿符号为止;读取的连续字符构成待处理句;(2)从所述待处理句中提取多个句子主干词;(3)将所述多个句子主干词输入所述语义组合装置,所述语义组合装置基于云端语料库输出至少一个比较句;(4)将所述待处理句、所述至少一个比较输入所述可信度判别装置;所述可信度判别装置输出判别结果。2.如权利要求1所述的系统,其中,所述语义组合装置基于云端语料库输出至少一个比较句,具体包括:云端语料库在从所述待处理句中提取的多个句子主干词的基础上生成比较句,所述比较句为一个具备完整意义的独立句。3.如权利要求1或2所述的系统,其中,所述可信度判别装置输出判别结果,具体包括:将当前待处理句和生成的比较句进行比较,基于比较条件是否满足预定条件,输出判别结果。4.如权利要求3所述的系统,其中,还包括预定条件设置模块,用于调节所述预定条件的范围。5.一种计算机实现的识别方法,其特征在于,所述方法包括如下步骤:S1:读取当前待处理文...
【专利技术属性】
技术研发人员:何恩培,郑丽华,王莲,
申请(专利权)人:传神语联网网络科技股份有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。