一种针对单层一对多和多对一股份图的识别方法技术

技术编号：28376037 阅读：20 留言：0更新日期：2021-05-08 00:03

本发明专利技术公开一种针对单层一对多和多对一股份图的识别方法，具体步骤为：步骤1，输入待识别股份图；步骤2，采用Faster R‑CNN网络提取公司(个人)、箭头和百分比的坐标；步骤3，根据箭头坐标确定角点坐标，根据箭头角点坐标确定箭头的走向，将公司(个人)划分为指向对象和被指向对象，将被指向对象和指向对象中个数多的一方与百分比绑定；利用OCR识别方法对公司(个人)中的文字进行识别；步骤4，根据指向关系，构建控股流程有向加权图。本发明专利技术利用深度学习框架Faster R‑CNN技术和图像识别技术对股份图进行识别与解析，克服了对于个人或公司进行股份分析时费时费力、难以理解的缺点，提供了高效、准确的方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对单层一对多和多对一股份图的识别方法
本专利技术属于图像识别
，涉及一种针对单层一对多和多对一股份图的识别方法。
技术介绍
随着互联网技术的日新月异，人工智能领域更加蓬勃发展，与之有关的技术以及产品在人们日常生活中的占比也随之上升。图像识别技术是人工智能中的一个重要领域，它是许多实用技术的基础，例如立体视觉、运动分析、数据融合等，也在导航、天气预报、自然资源分析、环境监测、生理病变研究等领域具有重要的应用价值。对复杂图像的具体识别解析是人工智能的一个重要领域，并且当前图像的目标识别对车牌、人脸、行人等特征识别已经较为成熟；因此，研究者希望对更加复杂的关系图像(如股份图)进行识别与解析，使相关人员摆脱传统人工进行股份分析的方法，能够高效、精准的掌握股权分布，提高工作效率。但是，现有的股份图都是大多来自于公司发表的年度或季度报告以及相关软件(如天眼查)，图片比较复杂，难以直观的了解公司股份的架构，再加上分析时不仅仅是对一张图、一个公司的股份进行分析，工作不仅时费时费力，而且难以理清。另外，目前国内外没有利用图像识别技术对股份图进行识别的研究，没有研究股份关系图解析等方面的技术。
技术实现思路
本专利技术的目的是提供一种针对单层一对多和多对一股份图的识别方法，解决了现有技术中存在的原有股份图难以直观反映出公司股份的问题。本专利技术所采用的技术方案是，一种针对单层一对多和多对一股份图的识别方法，具体步骤为：步骤1，输入一对多或多对一股份图作为待识别股份图；>步骤2，采用FasterR-CNN网络提取图片中公司(个人)、箭头和百分比的坐标；步骤3，根据箭头坐标确定角点坐标，根据箭头角点坐标确定箭头的走向；根据箭头的走向将公司(个人)划分为指向对象和被指向对象，之后将被指向对象和指向对象中个数多的一方与百分比一对一绑定；最后利用OCR识别方法对指向对象和被指向对象中的文字进行识别；步骤4，根据步骤3得到的指向关系，构建“对象—箭头—百分比—被指向对象”的控股流程有向加权图。其中步骤2包括：步骤2.1，采取大量股份图并对图中的公司(个人)、箭头和百分比进行人工标注后作为数据集；步骤2.2，建立VGG-16网络模型，VGG-16包括13个卷积层，3个全连接层，5个池化层；步骤2.3，VGG-16网络模型对数据集进行训练；步骤2.4，采用训练好的VGG-16网络模型对待识别股份图进行检测，输出检测结果，检测结果为公司(个人)、箭头和百分比的坐标。步骤2中13个卷积层采用的卷积核的尺寸是3x3卷积，采用步幅stride＝1，填充方式为padding＝same，每一个卷积层使用一个relu激活函数；分别生成positiveanchors和对应boundingboxregression偏移量，然后计算出proposals；的池化层的采用的池化核参数均为2×2，步幅stride＝2，max的池化方式；利用卷积层的proposals从featuremaps中提取proposalfeature送入后续全连接和softmax网络作classification(即分类proposal到底是什么object)。步骤3.1，根据箭头坐标确定角点坐标，根据箭头角点坐标确定箭头的方向：从步骤2中得到的其中某一箭头的三个角点设为(A(x1，y1)，B(x1，y1)，C(x3，y3))：假设y1,y2的差值小于给定的阈值e1，则认为角点A，B两点在一条水平线上，此时判断y3与y1的关系，若y3＞y1则认为箭头是向下的，若y3<y1则认为箭头是向上的；遍历全部箭头角点坐标，逐一判别指向；步骤3.2，根据箭头的指向将公司(个人)名称划分为指向对象和被指向对象，之后将被指向对象和指向对象中个数多的一方与百分比一对一绑定，由于输入的股份图都是单层的，所以可以根据公司名称的纵坐标的大小将其分成两组，根据步骤3.1得到的箭头的指向，若指向向上，则公司(个人)坐标中纵坐标最大的一组为被指向对象，若箭头的指向向下，则公司(个人)坐标中纵坐标最小的一组为被指向对象；然后进行将被指向对象和指向对象中个数多的一方与百分比一对一绑定：设被指向对象和指向对象中个数多的一方其中某个对象四个点的坐标中最小的横坐标和最大的横坐标为(xmin,xmax)，则寻找百分比的横坐标在(xmin,xmax)内的一个，然后将两者绑定在特定的数据结构(如字典)中，遍历个数多的一方的剩余对象，与百分比进行一对一绑定；步骤3.3，利用OCR技术对指向对象和被指向对象的坐标中文字进行识别。步骤4包括：步骤4.1，建立一个空的有向图G，利用步骤3.3中得到的公司(个人)名称，使其作为节点依次添加进有向图G中，得到基础的仅存节点的有向图G′；步骤4.2，在步骤4.1中有向图G′的基础上，将步骤3.2中的指向关系转化为三元组[u,v,w]，其中u为起点，代表指向对象；v为终点，代表被指向对象，w为权重代表占股百分比，利用转化成的三元组作为参数，添加进有向图G′中，最终形成控股流程有向加权图G″。本专利技术的有益效果是利用深度学习框架FasterR-CNN技术和图像识别技术对股份图进行了识别与解析，克服了对于个人或公司进行股份分析时费时费力、难以理解的缺点，弥补了国内外对此方面研究的缺失，提供了高效、准确的方法。附图说明图1是本专利技术对单层一对多或多对一股份图识别与解析方法示意图；图2是本专利技术对单层一对多或多对一股份图识别与解析方法中FasterR-CNN的VGG-16网络结构示意图；图3是本专利技术对单层一对多或多对一股份图识别与解析方法的实施例1中输入的股份图；图4是本专利技术对单层一对多或多对一股份图识别与解析方法的实施例1中最终得到的复杂网络图。具体实施方式下面结合附图和具体实施方式对本专利技术进行详细说明。如图1，一对多或多对一股份图识别与解析方法，其特征在于，具体步骤为：步骤1，输入一对多或多对一股份图作为待识别股份图；步骤2，采用FasterR-CNN网络提取图片中公司(个人)、箭头和百分比的坐标；步骤3，根据箭头坐标确定角点坐标，根据箭头角点坐标确定箭头的走向；根据箭头的走向将公司(个人)划分为指向对象和被指向对象，之后将被指向对象和指向对象中个数多的一方与百分比一对一绑定；最后利用OCR识别方法对指向对象和被指向对象中的文字进行识别；步骤4，根据步骤3得到的指向关系，构建“对象—箭头—百分比—被指向对象”的控股流程有向加权图。步骤1中对于多层控股关系的待识别股份图，需要先将其放缩至固定大小；步骤2包括：步骤2.1，采取大量股份图并对图中的公司(个人)、箭头和百分比进行人工标注后作为数据集。步骤2.2，如图2，建立VGG-16网络模型，VGG-16包括13个卷积层，3个全连接层，5个池化层，13个卷积本文档来自技高网...

【技术保护点】
1.一种针对单层一对多和多对一股份图的识别方法，，其特征在于，具体步骤为：/n步骤1，输入一对多或多对一股份图作为待识别股份图；/n步骤2，采用Faster R-CNN网络提取图片中公司(个人)、箭头和百分比的坐标；/n步骤3，根据箭头坐标确定角点坐标，根据箭头角点坐标确定箭头的走向；根据箭头的走向将公司(个人)划分为指向对象和被指向对象，之后将被指向对象和指向对象中个数多的一方与百分比一对一绑定；最后利用OCR识别方法对指向对象和被指向对象中的文字进行识别；/n步骤4，根据步骤3得到的指向关系，构建“对象—箭头—百分比—被指向对象”的控股流程有向加权图。/n

【技术特征摘要】
1.一种针对单层一对多和多对一股份图的识别方法，，其特征在于，具体步骤为：
步骤1，输入一对多或多对一股份图作为待识别股份图；
步骤2，采用FasterR-CNN网络提取图片中公司(个人)、箭头和百分比的坐标；
步骤3，根据箭头坐标确定角点坐标，根据箭头角点坐标确定箭头的走向；根据箭头的走向将公司(个人)划分为指向对象和被指向对象，之后将被指向对象和指向对象中个数多的一方与百分比一对一绑定；最后利用OCR识别方法对指向对象和被指向对象中的文字进行识别；
步骤4，根据步骤3得到的指向关系，构建“对象—箭头—百分比—被指向对象”的控股流程有向加权图。

2.如权利要求1所述的一种针对单层一对多和多对一股份图的识别方法，其特征在于，所述步骤2包括：
步骤2.1，采取大量股份图并对图中的公司(个人)、箭头和百分比进行人工标注后作为数据集；
步骤2.2，建立VGG-16网络模型，所述VGG-16包括13个卷积层，3个全连接层，5个池化层；
步骤2.3，VGG-16网络模型对数据集进行训练；
步骤2.4，采用训练好的VGG-16网络模型对待识别股份图进行检测，输出检测结果，所述检测结果为公司(个人)、箭头和百分比的坐标。

3.如权利要求1所述的一种针对单层一对多和多对一股份图的识别方法，其特征在于，步骤2中13个所述卷积层采用的卷积核的尺寸是3x3卷积，采用步幅stride＝1，填充方式为padding＝same，每一个卷积层使用一个relu激活函数；分别生成positiveanchors和对应boundingboxregression偏移量，然后计算出proposals；
所述的池化层的采用的池化核参数均为2×2，步幅stride＝2，max的池化方式；利用卷积层的proposals从featuremaps中提取proposalfeature送入后续全连接和softmax网络作classification(即分类proposal到底是什么object)。

4....

【专利技术属性】
技术研发人员：张贝贝，郭仲穗，仵晨伟，郑浩然，魏嵬，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人