一种文字相似度自动检索判断方法技术

技术编号:37560858 阅读:11 留言:0更新日期:2023-05-15 07:43
本发明专利技术属于文字识别技术领域,尤其是一种文字相似度自动检索判断方法,针对目前的文字识别效果差,不能对形体相似的文字进行遗漏检索,使用效果差的问题,现提出如下方案,其以下步骤:S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;S2:录入需要识别的文字数据;将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;S3:提取文字数据按照结构、笔画进行分类;S4:将分类后的文字与模板进行对比;首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对。逐个比对。

【技术实现步骤摘要】
一种文字相似度自动检索判断方法


[0001]本专利技术涉及文字识别
,尤其涉及一种文字相似度自动检索判断方法。

技术介绍

[0002]专利检索就是科研立项和申请专利之前需要检索专利,以免重复研制,侵犯他人专利权,事先检索也可判断该项技术成果是否有可能获得专利权。可以去国家知识产权局专利文献馆手工检索专利,也可以用电脑上网检索,简单地说专利信息检索就是有关专利信息的查找。检索结果是否全面直接影响到整个新项目的成败,检索不全面、漏检,可能造成投入了大量人力物力后与其他企业的现有的技术雷同,不具有新颖性而白白浪费,因而检索是新项目立项的重要环节。对于单纯以文字类型注册的商标来说,由于汉字形体结构的特点,使得汉字存在众多的形近字,这就导致文字注册商标中经常出现相近商标,在出现相近商标的情况下,就需要对相近商标进行近似审核,在进行近似审核过程中就需要用到文字相似度检索分析方法。
[0003]目前的文字近似度检索分析方法大部分都是以待近似检索文字本身的偏旁部件作为近似度检索分析依据进行近似度检索分析,这种近似度检索分析方式由于检索分析依据单一,一方面只能检索到与待近似检索文字具有相同偏旁部件的文字,对于一些与待近似检索文字具有的偏旁部件不同但整体形状相似的文字通常会遗漏检索,导致检索范围有限。

技术实现思路

[0004]本专利技术的目的是为了解决目前的文字识别效果差,不能对形体相似的文字进行遗漏检索,使用效果差的缺点,而提出的一种文字相似度自动检索判断方法。
[0005]为了实现上述目的,本专利技术采用了如下技术方案:
[0006]一种文字相似度自动检索判断方法,包括以下步骤:
[0007]S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
[0008]S2:录入需要识别的文字数据;,将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;
[0009]S3:提取文字数据按照结构、笔画进行分类;
[0010]S4:将分类后的文字与模板进行对比;首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对;
[0011]S5:设置对比相似度比例值为50

70%;
[0012]S6:进行二次对比,并将对比值设置为71

99%;
[0013]S7:对文字综合近似度进行分析;
[0014]S8:将识别后文字进行排序显示。
[0015]优选的,所述S1中,建立候选文字模板并按照结构、笔画进行分类建模,建模的文
字设置三点坐标,三点坐标依次为上方、左下和右下。
[0016]优选的,所述S1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。
[0017]优选的,所述S2中,拍照录入采用图片文字提取的方式获取文字数据;
[0018]语音录入采用语音提取的方式获取文字数据;
[0019]人工键盘输入通过人工对文字数据进行录入。
[0020]优选的,所述S3中,将获取的文字数据按照结构、笔画进行分类,结构分类包括上下结构、左右结构、包围结构进行分类,笔画分类包括1

10笔画、11

20笔画、21

n笔画进行分类。
[0021]优选的,所述S5中,比对后按照50

70%的比对值,获取第一次对比的文字数据,删除剔除的文字数据。
[0022]优选的,所述S6中,将第一次对比的文字数据按照71

99%的比对值进行对比,获取第二次对比的文字数据。
[0023]优选的,所述S7中,对获取的文字进行分析,判断合格率,合格率设置在90

100%。
[0024]优选的,所述S8中,将识别后的文字进行排布显示。
[0025]与现有技术相比,本专利技术的优点在于:
[0026]本专利技术首先建立模板,并将录入的文字进行分类对比,采用二次对比,提高对比准确率,同时设置的比例值可以进行更改,提高对文字的检索分析识别效果。
附图说明
[0027]图1为本专利技术提出的一种文字相似度自动检索判断方法的流程图。
具体实施方式
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0029]实施例一
[0030]参照图1,一种文字相似度自动检索判断方法,包括以下步骤:
[0031]S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
[0032]S2:录入需要识别的文字数据;,将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;
[0033]S3:提取文字数据按照结构、笔画进行分类;
[0034]S4:将分类后的文字与模板进行对比;首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对;
[0035]S5:设置对比相似度比例值为50

70%;
[0036]S6:进行二次对比,并将对比值设置为71

99%;
[0037]S7:对文字综合近似度进行分析;
[0038]S8:将识别后文字进行排序显示。
[0039]本实施例中,分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和
右下。
[0040]本实施例中,S1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。
[0041]本实施例中,S2中,将需要识别的文字数据进行拍照录入;拍照录入采用图片文字提取的方式获取文字数据。
[0042]本实施例中,S3中,将获取的文字数据按照结构、笔画进行分类,结构分类包括上下结构、左右结构、包围结构进行分类,笔画分类包括1

10笔画、11

20笔画、21

n笔画进行分类。
[0043]本实施例中,S5中,比对后按照50

70%的比对值,获取第一次对比的文字数据,删除剔除的文字数据。
[0044]本实施例中,S6中,将第一次对比的文字数据按照71

99%的比对值进行对比,获取第二次对比的文字数据。
[0045]本实施例中,S7中,对获取的文字进行分析,判断合格率,合格率设置在90

100%。
[0046]本实施例中,S8中,将识别后的文字进行排布显示。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字相似度自动检索判断方法,其特征在于,包括以下步骤:S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;S2:录入需要识别的文字数据;,将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;S3:提取文字数据按照结构、笔画进行分类;S4:将分类后的文字与模板进行对比;首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对;S5:设置对比相似度比例值为50

70%;S6:进行二次对比,并将对比值设置为71

99%;S7:对文字综合近似度进行分析;S8:将识别后文字进行排序显示。2.根据权利要求1所述的一种文字相似度自动检索判断方法,其特征在于,所述S1中,建立候选文字模板并按照结构、笔画进行分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。3.根据权利要求1所述的一种文字相似度自动检索判断方法,其特征在于,所述S1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。4.根据权利要求1所述的一种文字相似度自动检索判断方法,其特征在于,...

【专利技术属性】
技术研发人员:余就裕崔龙强黎远伟
申请(专利权)人:深圳高新邦技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1