出版物的词条检查方法、装置、设备及存储介质制造方法及图纸

技术编号:25186201 阅读:28 留言:0更新日期:2020-08-07 21:13
本发明专利技术公开了一种出版物的词条检查方法、装置、设备及存储介质,通过获取出版物的待检查词条的标识信息,根据所述标识信息在内存数据库中进行匹配,若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息,其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。本方案中,编辑人员在对词条进行校对时,可从内存数据库中快速得到词条异常信息或没有异常的结果,可大大提高词条校对的效率,同时也能避免词条遗漏检查,大大提高词条校对的准确性。

【技术实现步骤摘要】
出版物的词条检查方法、装置、设备及存储介质
本专利技术涉及数字出版领域,尤其涉及一种出版物的词条检查方法、装置、设备及存储介质。
技术介绍
目前,在出版社工具书编纂过程中,一般都是再版书的编辑、升级,如《xx书籍》第五版升级到第六版、第六版升级到第七版,一般每一版过后都会积累一专有词库,然而,每一版升级和编辑过程中都需要对专有词库中的词条进行检查。传统工具书中的词条检查模式为:编辑人员选择需要检查的词条,点击检查操作后,后台用该词条对全库的库表进行匹配,发现编写有误的词条后,再对词条中错误的地方逐一修改,这个过程漫长且复杂,首先,大型工具书词条一般较多,约十几万个词条,逐个检校的工作量太大,容易遗漏,还有这个过程会频繁请求数据库,会造成数据库的访问压力,另外,每一个词条在专项检查过程中都要逐一与几十万的词库进行比对,导致词条检索过程也比较慢,一旦开始检校后,往往需要等待很久才可以看到结果,即时性较差,上述情况都会严重影响编辑人员的审校效率。
技术实现思路
有鉴于此,本专利技术实施例提供了一种出版物的词条检查方法、装置、设备及存储介质,以解决现有技术中词条检索过程较慢,严重影响编辑人员的审校效率的问题。第一方面,本专利技术实施例提供了一种出版物的词条检查方法,包括:获取出版物的待检查词条的标识信息;根据所述标识信息在内存数据库中进行匹配;若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述词条异常信息包括:量和单位异常数据、历史纪年异常数据、成套词异常数据。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述获取出版物的待检查词条的标识信息之前,还包括:获取出版物中发生变化的词条,并确定对应的变化类型;根据发生变化的各个词条的变化类型对内存数据库进行数据更新。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述变化类型包括:内容变化、被删除和被添加。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查;若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息;若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:若单个词条的变化类型为被添加,则对所述单个词条进行检查;若检查结果为存在异常,则将对所述单个词条进行检查得到的词条异常信息插入到内存数据库中。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述方法还包括:将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中之后,定时将所述内存数据库中的数据备份覆盖所述第一数据文件;若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件;若备份覆盖所述第一数据文件不成功,则停止备份覆盖所述第二数据文件。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述方法还包括:系统每次维护重启后,读取所述第一数据文件,并判断所述第一数据文件是否异常;若否,则将所述第一数据文件写入内存数据库中;若是,则读取所述第二数据文件,并将所述第二数据文件写入内存数据库中。在一种可能的实现方式中,在本专利技术实施例提供的上述方法中,所述判断所述第一数据文件是否异常,具体包括:判断所述第一数据文件的数据量是否小于预设数据量;若所述第一数据文件的数据量小于预设数据量,则为异常,反之,则为正常。第二方面,本专利技术实施例提供了一种出版物的词条检查装置,包括:标识获取模块,用于获取出版物的待检查词条的标识信息;匹配模块,用于根据所述标识信息在内存数据库中进行匹配;异常获取模块,用于若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述词条异常信息包括:量和单位异常数据、历史纪年异常数据、成套词异常数据。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述装置还包括:更新模块,用于在所述标识获取模块获取出版物的待检查词条的标识信息之前,获取出版物中发生变化的词条,并确定对应的变化类型;根据发生变化的各个词条的变化类型对内存数据库进行数据更新。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述变化类型包括:内容变化、被删除和被添加。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述更新模块,具体用于:若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查;若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息;若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述更新模块,具体用于:若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述更新模块,具体用于:若单个词条的变化类型为被添加,则对所述单个词条进行检查;若检查结果为存在异常,则将对所述单个词条进行检查得到的词条异常信息插入到内存数据库中。在一种可能的实现方式中,在本专利技术实施例提供的上述装置中,所述装置还包括:双备份模块,用于将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中之后,定时将所述内存数据库中的数据备份覆盖所述第一数据文件;若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件;若备份覆盖所述第一数据文件不成功,则停止备本文档来自技高网...

【技术保护点】
1.一种出版物的词条检查方法,其特征在于,包括:/n获取出版物的待检查词条的标识信息;/n根据所述标识信息在内存数据库中进行匹配;/n若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;/n其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。/n

【技术特征摘要】
1.一种出版物的词条检查方法,其特征在于,包括:
获取出版物的待检查词条的标识信息;
根据所述标识信息在内存数据库中进行匹配;
若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;
其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。


2.根据权利要求1所述的方法,其特征在于,所述词条异常信息包括:量和单位异常数据、历史纪年异常数据、成套词异常数据。


3.根据权利要求1或2所述的方法,其特征在于,所述获取出版物的待检查词条的标识信息之前,还包括:
获取出版物中发生变化的词条,并确定对应的变化类型;
根据发生变化的各个词条的变化类型对内存数据库进行数据更新。


4.根据权利要求3所述的方法,其特征在于,所述变化类型包括:内容变化、被删除和被添加。


5.根据权利要求4所述的方法,其特征在于,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:
若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查;
若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息;
若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。


6.根据权利要求4所述的方法,其特征在于,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:
若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。
<...

【专利技术属性】
技术研发人员:戴淼
申请(专利权)人:北大方正信息产业集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1