【技术实现步骤摘要】
一种通过差分法差异化标注句子的方法
[0001]本专利技术涉及计算机辅助翻译领域,具体涉及一种通过差分法差异化标注句子的方法
。
技术介绍
[0002]CAT
软件的功能是建立翻译记忆库并提供参考,既把过去翻译过的原文和译文的句子对存储在数据库中,在翻译新句子时就可以与翻译记忆库的句子对进行比较,如果有相同或相似的句子,调取出来供翻译新句子时参考,这样可以提高翻译的效率和质量
。
[0003]但是,当前
CAT
软件仍然存在一些不足,比如:在对两个句子存在差异的显示方法时,由于普遍采用的差分方法是把两个不同的句子合并到一个句子中显示,使得用户只能知道修改的位置,却无法直观地辨识修改前后句子结构的差异,导致用户在理解修改后的句子时存在诸多不便
。
技术实现思路
[0004]为了解决上述
技术介绍
中提到的至少一个问题,本专利技术提出了一种通过差分法差异化标注句子的方法
。
[0005]一种通过差分法差异化标注句子的方法,包括步骤:
[0006]步骤
S1
,读入需要标注的句子,将句子拆分为字词单元,对字词单元进行排序后,保存入字词单元表;
[0007]其中,字词单元的定义规则为:
[0008]对于存在空格切分符的句子,字词单元定义为两个空格之间的字符串;
[0009]对于没有空格切分符的句子,按照逐个字符拆分句子,字词词单元定义为单个字符;
[0010]具体步骤包括:
[0 ...
【技术保护点】
【技术特征摘要】
1.
一种通过差分法差异化标注句子的方法,其特征在于,包括步骤:步骤
S1
,读入需要标注的句子,将句子拆分为字词单元,对字词单元进行排序后,保存入字词单元表;步骤
S2
,将排序后得到的字词单元表进行差分运算,并记录差分运算后的结果;步骤
S3
,差异化显示不同字词单元的状态
。2.
根据权利要求1所述的一种通过差分法差异化标注句子的方法,其特征在于,步骤
S1
中所述的字词单元,其定义规则为:对于存在空格切分符的句子,字词单元定义为两个空格之间的字符串;对于没有空格切分符的句子,按照逐个字符拆分句子,字词词单元定义为单个字符
。3.
根据权利要求1所述的一种通过差分法差异化标注句子的方法,其特征在于,步骤
S1
包括步骤:步骤
S101
,读入待差分的句子1和句子2,将句子1和句子2拆分为字词单元;步骤
S102
,将句子1和句子2拆分得到的字词单元按照句子原有的顺序进行排序;步骤
S103
,对排序后的字词单元以阿拉伯数字进行编号,标记为字词单元的字序,得到句子1字序的字词单元表1和句子2字序的字词单元表
2。4.
根据权利要求3所述的一种通过差分法差异化标注句子的方法,其特征在于,步骤
S103
中所述的字词单元表1和字词单元表2,其中,字词单元表1的具体格式为:
{
句子1的字序,字词单元,状态,句子2中的字序
}
字词单元表2的具体格式为:
{
句子2的字序,字词单元,状态,句子1中的字序
}。5.
根据权利要求1所述的一种通过差分法差异化标注句子的方法,其特征在于,步骤
S2
包括步骤:步骤
S201
,导入需要进行差分运算的字词单元表1和字词单元表2,得到字词单元表1和字词单元表2所有排...
【专利技术属性】
技术研发人员:吴志武,
申请(专利权)人:杭州译友网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。