一种文档名称序号纠错方法、装置和设备制造方法及图纸

技术编号:31494510 阅读:27 留言:0更新日期:2021-12-18 12:33
本公开的实施例公开了一种文档名称序号纠错方法、装置和设备。该方法的一具体实施方式包括:在目标文档中查找包含数字的、目标格式的内容,得到序号字符串集合;对序号字符串集合中的每种序号字符串,确定序号字符串对应的文本字符串集合。该实施方式能够直接找出人们书写专利后的常见错误,并提高人们的工作效率。率。率。

【技术实现步骤摘要】
一种文档名称序号纠错方法、装置和设备


[0001]本专利技术属于文件检查领域,尤其涉及一种文档名称序号纠错方法。

技术介绍

[0002]在如今经济科技快速发展的大背景下,每个人或多或少都需要写一写自己的文档,这些文档也有不同的用途,例如:申请专利、报告等。但是撰写完成这些文档后,往往会出现各种各样的错误,这些错误往往需要人们一个一个的去检查出来,非常的浪费人力,甚至财力;并且在文件的检查方面,几乎查阅不到可以用以检查文件的文献成果。在本专利技术专利中,主要针对具有固定格式、且同时具备序号和名称文献的问题提出了一个检查方法。

技术实现思路

[0003]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]本公开的一些实施例提出了一种文档名称序号纠错方法,来解决以上
技术介绍
部分提到的技术问题。
[0005]第一方面,本公开的一些实施例提供了一种文档名称序号纠错方法,该方法包括:在目标文档中查找包含数字的、目标格式的内容,得到序号字符串集合;响应于序号字符串集合中各个序号字符串包含的数字之间不连续,将目标文档确定为包含错误信息的文档,否则执行以下步骤:对序号字符串集合中的每种序号字符串,确定序号字符串对应的文本字符串集合;响应于文本字符串集合中的文本字符串不一致,将目标文档确定为包含错误信息的文档,否则执行以下步骤:响应于文本字符串集合中的目标文本字符串在目标文档中出现的次数与序号字符串在目标文档中出现的次数不一致,将目标文档确定为包含错误信息的文档。
[0006]第二方面,本公开的一些实施例提供了一种文档名称序号纠错装备,装置包括:检测单元,被构建为对数字的目标格式进行文档内容提取,得到反映序号的序号字符串集合;第一确定单元,被配置为确定上述序号字符串集合中的目标数字之间是否连续,若连续,则按照序号字符串中的每种序号进行提取字符串,得到可疑名称文本串集合;第二确定单元,被配置为确定上述可疑名称字符串集合中的第一个字符是否为和错字集中元素一致,若不一致,则确定上述目标名称字符串集合为正确名称字符串集合;分类单元,被配置为对于上述可疑名称字符串集合中的每个可疑可疑名称字符串集合,基于上述可疑名称文本字符串中上述可疑名称字符串的第一个字符在上述错字集中,对上述可疑名称字符串集合进行分类,得到上述名称字符串集合的类别;生成单元,被配置为基于上述名称字符串集合的类别,生成检测结果。
[0007]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得
一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0008]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
[0009]本公开的上述各个实施例中的一个实施例具有如下有益效果:通过本公开的一些实施例的文档名称序号纠错方法可以提高文档中名称序号的纠错效率,减少文档名称序号纠错所需的人力和时间。具体来说,专利技术人发现,现有的文档名称序号纠错都是通过人为检查,检查效率低、效果也不能保证。基于此,本公开的一些实施例的序号纠错方法,通过对文档内容进行分析处理,实现了文档名称序号的自动纠错,提高了人们的效率。
附图说明
[0010]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0011]图1是根据本公开的文档名称序号纠错方法的实施例的流程图;
[0012]图2是根据本公开的文档名称序号纠错方法的一些实施例的流程图;
[0013]图3是根据本公开的专利申请文件的文档名称序号纠错方法的另一些实施例的流程图;
[0014]图4是根据本公开的文档名称序号纠错装置的一些实施例的结构示意图;
[0015]图5是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0016]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0017]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0018]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0019]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0020]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0021]下面将参考附图并结合实施例来详细说明本公开。
[0022]图1示出了可以应用本公开的一些实施例的文档名称序号纠错方法的一个应用场景的示意图。
[0023]在图1所示的应用场景中,首先,计算设备101可以在目标文档102中查找包含数字的、目标格式的内容,得到序号字符串集合103,接下来,响应于上述序号字符串集合103中各个序号字符串包含的数字之间不连续,将上述目标文档102确定为包含错误信息的文档,
否则执行以下步骤:
[0024]对上述序号字符串集合103中的每种序号字符串,确定上述序号字符串对应的文本字符串集合105,在本实施例中,以序号4为例,其对应的文本字符串集合105为[

激光部分(4)



激光部分(4)



激光部分(4)

]。
[0025]响应于文本字符串集合105中的文本字符串不一致,将上述目标文档确定为包含错误信息的文档,否则执行以下步骤。在本实施例中,以序号4为例,[

激光部分(4)



激光部分(4)



激光部分(4)

]中的文本字符串是一致的。
[0026]响应于上述文本字符串集合105中的目标文本字符串在上述目标文档102中出现的次数与上述序号字符串1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档名称序号纠错方法,包括:在目标文档中查找包含数字的、目标格式的内容,得到序号字符串集合;响应于所述序号字符串集合中各个序号字符串包含的数字之间不连续,将所述目标文档确定为包含错误信息的文档,否则执行以下步骤:对所述序号字符串集合中的每种序号字符串,确定所述序号字符串对应的文本字符串集合;响应于所述文本字符串集合中的文本字符串不一致,将所述目标文档确定为包含错误信息的文档,否则执行以下步骤:响应于所述文本字符串集合中的目标文本字符串在所述目标文档中出现的次数与所述序号字符串在所述目标文档中出现的次数不一致,将所述目标文档确定为包含错误信息的文档。2.根据权利要求1所述的方法,其中,所述确定所述序号字符串对应的文本字符串集合,包括:确定所述序号字符串在所述目标文档中出现的位置,得到位置集合;在所述位置集合中各个位置处,逐一向前检查字符;响应于当前检查的各个字符不同或者存在于预先设定的错字集中,将所述位置集合中各个位置处上一检查字符、所述序号字符串和所述上一检查字符和所述序号字符串之间的字符确定为所述序号字符串对应的文本字符串集合。3.根据权利要求1所述的方法,其中,所述目标文本字符串包括:所述文本...

【专利技术属性】
技术研发人员:程朋乐崔波孙冰剑
申请(专利权)人:北京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1