一种文档查错方法和装置制造方法及图纸

技术编号:14642550 阅读:103 留言:0更新日期:2017-02-15 22:37
本发明专利技术公开了一种文档查错方法和装置,所述方法包括:根据同义字词句库,检查并记录文档中出现的同义字词句;通过语句比对的方式,检查文档中出现的同义字词句,并对检查到的同义字词句中不属于同义字词句库中的同义字词句进行记录。将记录的同义字词句修改为统一用词。本发明专利技术引入了同义字词句库和语句比对方案,实现了对文档中同义字词句的检查及修改,解决现有技术无法检测文档前后用词一致性的问题。

【技术实现步骤摘要】

本专利技术涉及计算机数据处理
,尤其涉及一种文档查错方法和装置
技术介绍
文档的自动查错技术能够自己检查出文档中出现的各种错误,有些还可以自动更正,提高了文档开发和修改的效率。目前的文档查错技术主要是搜索某个错误的字词搭配,发现后进行提醒或更正。这种方法有比较大的局限性,存在无法检测文档前后用词一致性的问题。所以,如何检查文档中字词句前后一致性,成为本专利技术所要解决的技术问题。
技术实现思路
本专利技术提供一种文档查错方法和装置,用以解决现有技术无法检测文档前后用词一致性的问题。依据本专利技术的一个方面,提供一种文档查错方法,包括:根据同义字词句库,检查并记录文档中出现的同义字词句;将记录的同义字词句修改为统一用词。可选地,本专利技术所述方法中,在将记录的同义字词句修改为统一用词之前,还包括:通过语句比对的方式,检查文档中出现的同义字词句,并对检查到的同义字词句中不属于同义字词句库中的同义字词句进行记录。可选地,本专利技术所述方法中,所述通过语句比对的方式,检查文档中出现的同义字词句,包括:根据配置信息,确定语句长度及语句比对方式;确定搜索起始位置,得到起始语句,将起始语句与该语句之后的所有语句进行比对,以确定起始语句与该语句之后的所有语句中是否存在同义字词句;其中,起始语句之后的所有语句为:在起始语句后,起始位置以字符为单位逐渐向后推移得到的各语句;将搜索起始位置向后移动一个字符,得到新的搜索起始位置后返回上述语句比对步骤。可选地,本专利技术所述方法中,所述语句比对方式包括:将语句划分为同义字词句前端字符串+同义字词句字符串+同义字词句后端字符串;将两个语句相同位置的字符串进行比对,若两个语句的前端字符串相同、后端字符串相同且同义字词句字符串不同,则判定两个语句中的同义字词句字符串为同义字词句字符串。可选地,本专利技术所述方法还包括:将通过语句对比方式记录的同义字词句写入同义字词句库。可选地,本专利技术所述方法中,根据同义字词句库,检测并记录文档中出现的同义字词句之前,还包括:调取历史修改数据库;将所述历史修改数据库中记录的被修改的内容进行全文档搜索;呈现搜索到的内容,并根据用户的指示按历史修改方式进行修改或忽略。可选地,本专利技术所述方法中,将记录的同义字词句修改为统一用词时,还包括:将被修改的内容和修改后的内容记录到所述历史修改数据库。可选地,本专利技术所述方法中,所述将记录的同义字词句修改为统一用词,具体包括:呈现记录的同义字词句信息;基于用户的修改指示,将文档中出现的同义字词句修改为统一用词;其中,所述统一用词为默认的或者用户指定的某一同义字词句。依据本专利技术的另一个方面,提供一种文档查错装置,包括:同义字词句检查模块,用于根据同义字词句库,检查并记录文档中出现的同义字词句;同义字词句处理模块,用于将记录的同义字词句修改为统一用词。可选地,本专利技术所述装置中,所述同义字词句检查模块,还用于通过语句比对的方式,检查文档中出现的同义字词句,并对检查到的同义字词句中不属于同义字词句库中的同义字词句进行记录。可选地,本专利技术所述装置中,所述同义字词句检查模块,具体包括:信息获取子模块,用于根据配置信息,确定语句长度及语句比对方式;语句比对子模块,用于确定搜索起始位置,得到起始语句,将起始语句与该语句之后的所有语句进行比对,以确定起始语句与该语句之后的所有语句中是否存在同义字词句;其中,起始语句之后的所有语句为:在起始语句后,起始位置以字符为单位逐渐向后推移得到的各语句;轮询处理子模块,用于将搜索起始位置向后移动一个字符,得到新的搜索起始位置后,触发所述语句比对子模块。可选地,本专利技术所述装置还包括:历史修改内容检查模块,用于调取历史修改数据库,将所述历史修改数据库中记录的被修改的内容进行全文档搜索,呈现搜索到的内容,并根据用户的指示按历史修改方式进行修改或忽略。本专利技术有益效果如下:本专利技术引入了同义字词句库和语句比对方案,实现了对文档中同义字词句的检查及修改,解决现有技术无法检测文档前后用词一致性的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种文档查错方法的流程图;图2为本专利技术利用同义字词句库搜索同义字词句的流程图;图3为本专利技术利用语句比对技术搜索文档内同义字词句的流程图;图4为本专利技术中语句比对技术示意图;图5为本专利技术对记录的同义字词句进行显示的效果图;图6为本专利技术应用示例中待检查文档的示意图;图7为本专利技术应用示例中同义字词句库中的记录情况示意图;图8为本专利技术应用示例中语句比对搜索同义字词句的示意图;图9为本专利技术应用示例中利用同义字词句和语句比对搜索得到的同义字词句示意图;图10为本专利技术应用示例中用户在显示的同义字词句中输入了统一用词的效果图;图11为本专利技术应用示例中将同义字词句修改为统一用词后的效果示意图;图12为本专利技术应用示例中更新后的同义字词句库的示意图;图13为本专利技术提供的一种文档查错装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一本专利技术实施例提供一种文档查错方法,用于检查文档中字词句前后一致性,如图1所示,所述方法包括:步骤S101,根据同义字词句库,检查并记录文档中出现的同义字词句;本实施例中,防止同义字词句库中记录的同义字词句不全,进而可能出现遗漏的问题,在步骤S101后,优选地,可通过语句比对的方式,检查文档中出现的同义字词句,并对检查到的同义字词句中不属于同义字词句库中的同义字词句进行记录。同时,将通过语句对比方式记录的同义字词句写入同义字词句库,以对同义字词句库进行更新。其中,所述通过语句比对的方式,检查文档中出现的同义字词句,包括:(1)根据配置信息,确定语句长度及语句比对方式;其中,所述语句比对方式包括但不限于为:将语句划分为同义字词句前端字符串+同义字词句字符串+同义字词句后端字符串;将两个语句相同位置的字符串进行比对,若两个语句的前端字符串相同、后端字符串相同且同义字词句字符串不同,则判定两个语句中的同义字词句字符串为同义字词句字符串。(2)确定搜索起始位置,得到起始语句,将起始语句与该语句之后的所有语句进行比对,以确定起始语句与该语句之后的所有语句中是否存在同义字词句;其中,起始语句之后的所有语句为:在起始语句后,起始位置以字符为单位逐渐向后推移得到的各语句。(3)将搜索起始位置向后移动一个字符,得到新的搜索起始位置后返回步骤(2)。步骤S102,将记录的同义字词句修改为统一用词。该步骤具体包括:呈现记录的同义字词句信息,基于用户的修改指示,将文档中出现的同义字词句修改为统一用词;其中,所述统一用词可以为默认的某一同义字词句,或者,用户指定的某一同义字词句。优选地,本实施例还提供一种按照历史修改本文档来自技高网...
一种文档查错方法和装置

【技术保护点】
一种文档查错方法,其特征在于,包括:根据同义字词句库,检查并记录文档中出现的同义字词句;将记录的同义字词句修改为统一用词。

【技术特征摘要】
1.一种文档查错方法,其特征在于,包括:根据同义字词句库,检查并记录文档中出现的同义字词句;将记录的同义字词句修改为统一用词。2.如权利要求1所述的方法,其特征在于,在将记录的同义字词句修改为统一用词之前,还包括:通过语句比对的方式,检查文档中出现的同义字词句,并对检查到的同义字词句中不属于同义字词句库中的同义字词句进行记录。3.如权利要求2所述的方法,其特征在于,所述通过语句比对的方式,检查文档中出现的同义字词句,包括:根据配置信息,确定语句长度及语句比对方式;确定搜索起始位置,得到起始语句,将起始语句与该语句之后的所有语句进行比对,以确定起始语句与该语句之后的所有语句中是否存在同义字词句;其中,起始语句之后的所有语句为:在起始语句后,起始位置以字符为单位逐渐向后推移得到的各语句;将搜索起始位置向后移动一个字符,得到新的搜索起始位置后返回上述语句比对步骤。4.如权利要求3所述的方法,其特征在于,所述语句比对方式包括:将语句划分为同义字词句前端字符串+同义字词句字符串+同义字词句后端字符串;将两个语句相同位置的字符串进行比对,若两个语句的前端字符串相同、后端字符串相同且同义字词句字符串不同,则判定两个语句中的同义字词句字符串为同义字词句字符串。5.如权利要求2至4任意一项所述的方法,其特征在于,所述方法还包括:将通过语句对比方式记录的同义字词句写入同义字词句库。6.如权利要求1至4任意一项所述的方法,其特征在于,根据同义字词句
\t库,检测并记录文档中出现的同义字词句之前,还包括:调取历史修改数据库;将所述历史修改数据库中记录的被修改的内容进行全文档搜索;呈现搜索到的内容,并根据用户的指示按历史修改方式进行修改或忽略。7.如权利要求...

【专利技术属性】
技术研发人员:张晋
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1