当前位置: 首页 > 专利查询>石胜文专利>正文

中文断词编排方法技术

技术编号:2883923 阅读:295 留言:0更新日期:2012-04-11 18:40
一种中文断词编排方法,其步骤为:依照稿件,顺序录入或置入每个汉字和字符,形成文稿,于上述过程进行中或过程结束后,依照稿件中所作的断词标记,在文稿的每个中文词和其它中文字词之间加入断词符;将经如上加入断词符编排后的文稿输出到记录载体上。按本发明专利技术方法编排的文章不容易产生阅读歧义,可大大提高判断与阅读效率,便于外国人学习与交流,便于人工翻译和机器翻译,可提高计算机等的输入效率和节省内存。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种。汉字历史渊远流长,几经变革,从最初的象形文字发展到如今以表形、表声、表义为主的2万余单字。我国古文在编排时是通篇无句读的(参见《说文解字》,许慎撰,中华书局,1963年第一版),阅读时极易产生歧义。如“下雨天留客天天留我不留”便是典型一例。近代白话文始有标点符号,但因一般一句一断,连字不断词成句,仍存在以下缺陷1.出现歧义著名例句“已结婚的和尚未结婚的青年”可解读为“已结婚的和尚、未结婚的青年”与“已结婚的和尚未结婚的青年”两种。又如“薛伟荣获一等奖”也可以析为“薛伟荣获一等奖”以及“薛伟荣获一等奖”。2.不断词编排,词法不发达,增加了学习难度。3.因为多字连续编排,长句可达几十字,从而降低了阅读、纠错效率。如“让人在不断燃起对清官意识的期盼的同时让人不丧失对民主法制意识的追求”(2000.12.18《南方周末》年度特刊文《我为什么要投这一票》)。4.外国人学习、交流困难,影响了汉字作为国际化语言在世界的推广。鉴于上述,本专利技术的目的就是要提出一种不容易产生阅读歧义、可提高阅读效率、也便于外国人学习交流的。为实现上述目的,本专利技术采用以下技术方案一种,其本文档来自技高网...

【技术保护点】
一种中文断词编排方法,其步骤如下:依照稿件,顺序录入或置入每个汉字和字符,形成文稿;于上述过程进行中或过程结束后,依照稿件中所作的断词标记,在文稿的每个中文词和其它中文字词之间加入断词符;将经如上加入断词符编排后的文稿输出到记录 载体上。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:石胜文
申请(专利权)人:石胜文
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1