System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种楼层索引指示牌识别方法技术_技高网

一种楼层索引指示牌识别方法技术

技术编号:40420454 阅读:4 留言:0更新日期:2024-02-20 22:39
本发明专利技术提供了索引指示牌识别技术领域的一种楼层索引指示牌识别方法,包括如下步骤:步骤S10、获取索引指示牌图像,通过OCR模型获取所述索引指示牌图像中的文本字符以及检测框坐标;步骤S20、基于所述检测框坐标对各文本字符进行同列分组;步骤S30、基于分组后的各所述文本字符的同行位置关系,匹配楼层号码以及企业名称,基于所述楼层号码以及企业名称生成结构化数据,完成索引指示牌的识别。本发明专利技术的优点在于:极大的提升了楼层索引指示牌识别的准确性以及效率。

【技术实现步骤摘要】

本专利技术涉及索引指示牌识别,特别指一种楼层索引指示牌识别方法


技术介绍

1、商务楼宇聚集着众多优质中小企业,这些企业产生了规模巨大的服务市场。目前,部分服务商开始抢占商务楼宇蓝海市场,但若要对商务楼宇启动营销推广活动,需获取准确的商户入楼数据,即对应的楼层号码和企业名称,这将有助于统计商务楼宇的服务市场规模,辅助企业决策,支撑业务发展。

2、楼层号码和企业名称可通过商务楼宇内各楼层的索引指示牌获得,而传统上采取对索引指示牌进行拍照后,再人工录入商户入楼数据的方法,这需要投入大量的人力,耗费较多的时间,且容易出现错误;虽然已有一些文本识别技术,但现有的文本识别技术是针对非结构化数据识别,效率低下,如果想获得结构化的楼层号码和企业名称,还需进一步处理,即目前还未有相关的技术方法来对索引指示牌进行准确和高效的识别。

3、因此,如何提供一种楼层索引指示牌识别方法,实现提升楼层索引指示牌识别的准确性以及效率,成为一个亟待解决的技术问题。


技术实现思路

1、本专利技术要解决的技术问题,在于提供一种楼层索引指示牌识别方法,实现提升楼层索引指示牌识别的准确性以及效率。

2、本专利技术是这样实现的:一种楼层索引指示牌识别方法,包括如下步骤:

3、步骤s10、获取索引指示牌图像,通过ocr模型获取所述索引指示牌图像中的文本字符以及检测框坐标;

4、步骤s20、基于所述检测框坐标对各文本字符进行同列分组;

5、步骤s30、基于分组后的各所述文本字符的同行位置关系,匹配楼层号码以及企业名称,基于所述楼层号码以及企业名称生成结构化数据,完成索引指示牌的识别。

6、进一步的,所述步骤s10具体为:

7、获取索引指示牌图像,通过具备中文和英文识别功能的ocr模型,获取所述索引指示牌图像中的文本字符以及文本字符对应检测框的检测框坐标,基于各所述文本字符以及检测框坐标生成文本元素列表tl:

8、tl=[e0,e1,...,ei];

9、ei=[t,c,[(x0,y0),(x1,y1),(x2,y2),(x3,y3)]];

10、其中,ei表示第i个文本元素;各文本元素均包含文本字符的文本内容t,文本字符的置信度c、四个检测框坐标;(x0,y0)表示检测框的左上顶点,(x1,y1)表示检测框的右上顶点,(x2,y2)表示检测框的右下顶点,(x3,y3)表示检测框的左下顶点;各文本元素在文本元素列表tl中的顺序,按识别的文本字符从右到左、从上到下的顺序进行排列。

11、进一步的,所述步骤s20具体包括:

12、步骤s21、创建一包括若干个子列表的同列分组列表sc:

13、

14、其中,lm表示第m个子列表;wm表示子列表lm内检测框的最大宽度;表示子列表lm内的第一个文本元素;表示子列表lm内的最后一个文本元素;表示子列表lm内的第一个文本元素对应检测框的宽度;表示子列表lm内的最后一个文本元素对应检测框的宽度;表示子列表lm内的第一个文本元素对应检测框的左上顶点的横坐标;表示子列表lm内的第一个文本元素对应检测框的右上顶点的横坐标;表示子列表lm内的最后一个文本元素对应检测框的左上顶点的横坐标;表示子列表lm内的最后一个文本元素对应检测框的右上顶点的横坐标;

15、步骤s22、分别计算各文本元素ei与的检测框的横向位置关系以及框高度比值:

16、

17、

18、其中,d0表示ei与对应检测框的左上顶点的横坐标差值;d1表示ei对应检测框的右上顶点的横坐标与对应检测框的左上顶点的横坐标差值;表示对应检测框的左下顶点与左上顶点的纵坐标差值;表示ei对应检测框的左下顶点与左上顶点的纵坐标差值;

19、步骤s23、获取各文本元素中文本内容的首个字符的语言类型lg;

20、步骤s24、基于如下的分组条件对所述文本元素ei进行分组,添加进对应的所述子列表中:

21、

22、其中,α0、α1、β0、β1均表示阈值参数,取值分别为0.8、0.2、0.6、1.67;表示对应文本内容的首个字符的语言类型;表示ei对应文本内容的首个字符的语言类型。

23、进一步的,所述步骤s20还包括:

24、步骤s25、通过冒泡排序法对所述同列分组列表sc进行排序,得到同列分组列表rl:

25、

26、其中,表示冒泡排序后第m个子列表;表示内的第一个文本元素对应检测框的左上顶点的横坐标;表示冒泡排序后第m个子列表的所有文本元素的检测框的平均高度。

27、进一步的,所述步骤s30具体包括:

28、步骤s31、创建一商户入楼数据的匹配列表ml;

29、步骤s32、计算与的比值

30、步骤s33、筛选的子列表,计算子列表中的文本元素的检测框与子列表中的文本元素的检测框的位置关系:

31、

32、其中,表示的右下顶点的纵坐标;表示的右上顶点的纵坐标;表示的左上顶点的纵坐标;表示的左下顶点的纵坐标;

33、步骤s34、基于如下的匹配条件对内容为楼层号码或者企业名称的文本字符进行匹配,添加进所述匹配列表ml中,生成结构化数据,完成索引指示牌的识别:

34、

35、其中,α表示阈值参数,取值为0.4。

36、本专利技术的优点在于:

37、通过ocr模型获取索引指示牌图像中的文本字符以及检测框坐标,基于检测框坐标对各文本字符进行同列分组,基于分组后的各文本字符的同行位置关系,匹配楼层号码以及企业名称,基于楼层号码以及企业名称生成结构化数据,完成索引指示牌的识别;即基于图像文字识别和平面位置关系进行楼层号码和企业名称的识别,能快速通过索引指示牌图像生成结构化的商户入楼数据;通过将横向位置交叉、检测框高度接近,且首个字符的语言类型相同的文本字符,划分为同一组,依据冒泡排序法排列每一列之间的位置顺序,便于下一步对楼层号码和企业名称进行匹配;通过同行位置关系,计算每列检测框的平均高度,匹配同行且检测框高度接近的文本字符,实现楼层号码和企业名称的结构化数据生成,无需像传统上人工识别和录入商户入楼数据,最终极大的提升了楼层索引指示牌识别的准确性以及效率。

本文档来自技高网...

【技术保护点】

1.一种楼层索引指示牌识别方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种楼层索引指示牌识别方法,其特征在于:所述步骤S10具体为:

3.如权利要求2所述的一种楼层索引指示牌识别方法,其特征在于:所述步骤S20具体包括:

4.如权利要求3所述的一种楼层索引指示牌识别方法,其特征在于:所述步骤S20还包括:

5.如权利要求4所述的一种楼层索引指示牌识别方法,其特征在于:所述步骤S30具体包括:

【技术特征摘要】

1.一种楼层索引指示牌识别方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种楼层索引指示牌识别方法,其特征在于:所述步骤s10具体为:

3.如权利要求2所述的一种楼层索引指示牌识别方法,其特征在...

【专利技术属性】
技术研发人员:余印振王雷朱坚赵庆勇
申请(专利权)人:福建新大陆软件工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1