温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明提供一种基于众包的双语平行语料对齐方法,包括:采集可对齐的篇章级语料,存入对齐数据库中备用;对篇章级语料进行预处理;对预处理后文本进行断句,并按照语句的先后顺序依次编号;将不同语种的断句排列对齐;用户对行单位进行对齐操作;将用户的对齐...该专利属于中译语通科技(青岛)有限公司所有,仅供学习研究参考,未经过中译语通科技(青岛)有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明提供一种基于众包的双语平行语料对齐方法,包括:采集可对齐的篇章级语料,存入对齐数据库中备用;对篇章级语料进行预处理;对预处理后文本进行断句,并按照语句的先后顺序依次编号;将不同语种的断句排列对齐;用户对行单位进行对齐操作;将用户的对齐...