【技术实现步骤摘要】
本专利技术涉及一种翻译过程中稿件预处理分析技术,具体说,就是在进行翻译前先 将稿件中的已知术语快速速标注出来的方法。
技术介绍
目前应用于翻译领域稿件预处理分析工具的标注主要采用了 “最大正向匹配”或 “最大逆向匹配”的方法,以尽可能获得一个最长最完整含义的术语。下面就上面两种方法 做一个简单介绍。“最大正向匹配”,即从目标术语的最小长度的一个子串开始逐个到术语库中进行 检索,每检索一次字串长度就加1,直到导到字串长度达到某个阀值为止,其中最后一次匹 配到的字串就是目标术语。与“最大正向匹配”相反,“最大逆向匹配”是先从一个设定的最大长度的字串开始 阻隔到术语库中检索,每检索一次字串长度就减1,一旦发现字串与术语库中的内容匹配就 停止,其中最后一次匹配到的字串就是目标术语。现在以“最大逆向匹配”为例做一个简单地分析。假设有句子S = “我们将有机 会与中国一批成功的商业人士和慈善家就中国的慈善工作进行交流。”,同时假设术语的最 大长度为10,句子中没有术语。根据上面的条件如果需要找到句子S中的所有术语则需要从句子S的第一个字开 始在术语库中检索第一个长度10的字串,我们记做S(l,10),如果术语库中没有检索到则 继续S(l,9)依此类推知道找到术语为止,如果到S(l,l)时仍未找到术语则从S(2,10)开 始继续直到匹配到术语或这一直进行到S(n,1)。具体过程如下表所示权利要求,包括建立前缀表,并将所述前缀表加载到内存中,读取文字,所述文字包括至少一个子串;提取所述文字中的一个子串,将所述子串在所述前缀表中进行术语的检索;将当前查找到的子串作为术语记 ...
【技术保护点】
一种术语快速标注方法,包括:建立前缀表,并将所述前缀表加载到内存中,读取文字,所述文字包括至少一个子串;提取所述文字中的一个子串,将所述子串在所述前缀表中进行术语的检索;将当前查找到的子串作为术语记录下来。
【技术特征摘要】
【专利技术属性】
技术研发人员:江潮,
申请(专利权)人:传神联合北京信息技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。