当前位置: 首页 > 专利查询>姜赢专利>正文

一种基于XML规则的中文语法校正方法与系统技术方案

技术编号：7996345 阅读：242 留言：0更新日期：2012-11-22 05:10

一种基于XML规则的中文语法校正方法，包括：确定被检测中文文本，以输入或选择的方式确定被检测的中文文本；切词和标注词性，将确定被检测的中文文本分解成字或/和词，并分别将分解出来的字或/词标注词性；循环检测，将标注有词性的字或/和词，根据其词性、字符和位置关系，与以XML标记语言为基础所建立的中文语法错误规则数据库中的中文语法错误规则进行匹配，并得出匹配结果；匹配结果显示，将匹配结果或者与匹配结果相应的修改建议进行显示。本发明专利技术具有数据库数据容量要小，维护方便；特别适合于开放式的建立数据库；中文语法错误检测面广，准确率高的优点。?

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于XML规则的中文语法校正方法与系统，它主要通过中文分词和词性标注和中文语法纠错技术手段来纠正用户输入的多音字错误、字型、词型以及语法、句法等错误，解决用户在输入过程中字符替换错误、多字/漏字错误和字符位置错误等类型。并在此基础上扩展了基础功能，中文纠错技术，中文词性自主判断技术，XML规则循环检测及匹配，相关提示技术等，在智能纠错功能上更加完善，为用户提供更好的服务。
技术介绍
随着信息社会的发展，电脑已被广泛用来处理各种以汉字为基础的中文文件。通常汉字的输入主要基于两种方式，一种是以形码为主的输入方式，一种是以拼音为主的输入方式，前者以五笔输入法为典型代表，它具有输入快，准确率高的特点，但是，这种输入方法初学时比较困难，现在的年轻人难以接受；后者则有许多输入方法，如最初有全拼输入法，现在拼音输入法很多，并且大受年轻人的喜爱，拼音输入法学习起来较简单，但是，在输入时容易造成许多词法或/和语法错误；当然，中文语法错误的产生除了输入时产生外，还有用户语言文字表达能力局限性也会导致语法错误，用户对词语用法不熟悉等也会产生的语法错误。给中文文本设置输入纠错方法或/和文本错误检查和校正方法是十分必要的，输入纠错方法和文本错误检查和校正方法其实质上是一样的，只不过输入纠错方法是在输入汉字时自动纠错，而文本错误检查和校正方法是在人们输入一段文字后，再进行文本错误检查和校正，因此，为了叙述的方便，在下文中将输入纠错方法和文本错误检查和校正方法统称为中文纠错方法。由于中文与其它文字(如英文)比较存在两个方面的主要区别，一是英文中每个词之间有空格，不...

【技术保护点】
一种基于XML规则的中文语法校正方法，其特征在于，包括：确定被检测中文文本以输入或选择的方式确定被检测的中文文本；切词和标注词性将确定被检测的中文文本分解成字或/和词，并分别将分解出来的字或/词标注词性；循环检测将标注有词性的字或/和词，根据其词性、字符和位置关系，与以XML标记语言为基础所建立的中文语法错误规则数据库中的中文语法错误规则进行匹配，如果词性、字符和位置关系都匹配，则表示匹配成功，则得出匹配结果，如果词性、字符和位置关系任意一项不匹配，则表示匹配不成功，匹配结果为零；匹配结果显示将匹配结果列表，并显示与匹配结果相应的修改建议。

【技术特征摘要】

【专利技术属性】
技术研发人员：姜赢，林耿锐，程文婷，吕洋，闫洪滔，刘轩玮，
申请(专利权)人：姜赢，林耿锐，程文婷，吕洋，闫洪滔，刘轩玮，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人