【技术实现步骤摘要】
本专利技术涉及。
技术介绍
日本未审查专利申请公开No. 2010-61643公开了一种专利技术,其涉及利用第一语言的句子和第三语言的对应句子之间的定义单词对齐以及第二语言的该句子和第三语言的该对应句子之间的定义单词对齐来确定多语语料库(multilingual corpus)中所述第一语言的句子和第二语言的对应句子之间的单词对齐。日本未审查专利申请公开No. 2008-102794公开了一种专利技术,其涉及基于统计信息(诸如每个单词对之间的翻译概率)确定短语对齐。日本未审查专利申请公开No. 2007-26256公开了一种专利技术,其涉及利用第三语言的对应字确定双语单词字典中第一和第二语言的单词对之间的对应关系。
技术实现思路
因此,本专利技术的一个目的是提供一种信息处理设备,其根据以第一语言所写的第一文本、具有与所述第一文本相同内容并以第二语言所写的第二文本、以及表明多种格式的短语中的每一个短语以第一语言所写时该短语中给定单词的位置与该短语以第二语言所写时该短语中对应于给定单词的单词的位置之间的对应关系的位置对应信息,来确定该第一文本所包含的子文本的翻译文本。根 ...
【技术保护点】
一种信息处理设备,包括:文本获取单元,其获取以第一语言所写的第一文本和以第二语言所写的第二文本,所述第二文本具有与所述第一文本相同的内容;位置对应信息获取单元,其针对多种格式的短语中的每一个获取位置对应信息,所述位置对应信息表明短语以第一语言所写时该短语中给定单词的位置与该短语以第二语言所写时该短语中对应于给定单词的单词的位置之间的对应关系;第一子文本产生单元,其将所述第一文本分割成多个第一子文本;第二子文本产生单元,其将所述第二文本分割成多个第二子文本;第一比较单元,其针对所述多种格式的短语中的每一个比较短语以第一语言所写时该短语中多个单词的布局和所述第一文本中的所述多个 ...
【技术特征摘要】
2011.09.26 JP 2011-2099381.一种信息处理设备,包括 文本获取单元,其获取以第一语言所写的第一文本和以第二语言所写的第二文本,所述第二文本具有与所述第一文本相同的内容; 位置对应信息获取单元,其针对多种格式的短语中的每一个获取位置对应信息,所述位置对应信息表明短语以第一语言所写时该短语中给定单词的位置与该短语以第二语言所写时该短语中对应于给定单词的单词的位置之间的对应关系; 第一子文本产生单元,其将所述第一文本分割成多个第一子文本; 第二子文本产生单元,其将所述第二文本分割成多个第二子文本; 第一比较单元,其针对所述多种格式的短语中的每一个比较短语以第一语言所写时该短语中多个单词的布局和所述第一文本中的所述多个第一子文本的布局; 第二比较单元,其针对所述多种格式的短语中的每一个比较短语以第二语言所写时该短语中多个单词的布局和所述第二文本中的所述多个第二子文本的布局;以及 翻译文本确定单元,其根据所述第一比较单元获得的比较结果、所述第二比较单元获得的比较结果、和所述位置对应关系,确定所述多个第一子文本中至少一个的翻译文本,所述翻译文本为所述多个第二子文本之一、且通过将所述多个第一子文本中的所述至少一个翻译成第二语言而获得。2.根据权利要求1所述的信息处理设备,还包括 布局信息获取单元,其针对所述多种格式的短语中的每一个获取第一布局信息和第二布局信息,所述第一布局信息表明短语以第一语言所写时该短语中多个单词的布局,所述第二布局信息表明短语以第二语言所写时该短语中多个单词的布局, 其中,所述翻译文本确定单元包括 布局信息确定单元,其根据所述第一比较单元...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。