一种基于神经网络的PPT边框识别方法及相关设备技术

技术编号：22502374 阅读：16 留言：0更新日期：2019-11-09 02:40

本发明专利技术提供了一种基于神经网络的PPT边框识别方法及相关设备，通过将含有PPT文档信息的图片输入所述特征提取层中进行特征提取，得到所述特征提取层输出的图片的特征图；将所述图片的特征图输入到所述轮廓分割层，得到所述轮廓分割层输出的轮廓分割图像；将所述轮廓分割图像输入到角点定位层，得到所述角点定位层输出的PPT边框的四个角点的位置信息；将所述角点位置信息输入角点回归层得到角点位置修正信息；根据所述四个角点的位置信息识别出所述PPT边框。本发明专利技术所提供的方法及设备，可以实现快捷的从图片文件中识别出PPT文档的边框，为从PPT文档中准确的提取PPT信息提供了前提，为用户从视频文件中提取PPT信息提供便利。

A method of PPT frame recognition based on neural network and related equipment

The invention provides a PPT frame recognition method and related equipment based on neural network. By inputting a picture containing PPT document information into the feature extraction layer for feature extraction, the feature map of the picture outputted by the feature extraction layer is obtained; inputting the feature map of the picture into the contour segmentation layer, the contour segmentation image outputted by the contour segmentation layer is obtained; Input the contour segmentation image to the corner positioning layer to obtain the position information of the four corners of the PPT frame output by the corner positioning layer; input the corner position information to the corner regression layer to obtain the corner position correction information; identify the PPT frame according to the position information of the four corners. The method and the device provided by the invention can quickly recognize the border of the PPT document from the picture file, provide a premise for accurately extracting the PPT information from the PPT document, and provide convenience for the user to extract the PPT information from the video file.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络的PPT边框识别方法及相关设备
本专利技术涉及信息处理
，尤其涉及的是一种基于神经网络的PPT边框识别方法及相关设备。
技术介绍
目前，在大型会议还是内部讨论会中，参会者都会利用PPT文档进行报告。演讲者通过将PPT投影到投影幕或显示器上来将演讲主要内容呈现给观众。观众主要是通过呈现出来的PPT文档和演讲者口头汇报的内容来获知PPT文档的信息，因此在会议中最主要内容是PPT文档内容和演讲中口诉内容。目前，观众或者主办方会利用录像设备来对会议中PPT文档内容、演讲者口头语言内容进行采集。这种视频录制方法能够有效地记录演讲者的PPT演示内容和口头演讲内容，但是针对录制好的视频文件可能会含有大量与PPT文档及其讲解不相关的内容，若未能参加现场会议的用户需要基于整个视频文件获取PPT文档的信息，则可能会因视频文件中含有的信息量大，并非是单一的关于PPT文档信息的视频文件，导致花费大量不必要的时间。而现有技术中，还未公开用于提取视频文件中的PPT文档内容或者演讲中的语言文字内容的方法，也未公开如何在提取视频文件中的PPT文档时准确识别其边框，从而实现准确的PPT画面的提取，因此如何快速的从视频文件中提取PPT文档相关信息的问题是亟待需要解决的问题。因此，现有技术有待于进一步的改进。
技术实现思路
鉴于上述现有技术中的不足之处，本专利技术的目的在于为用户提供一种基于神经网络的PPT边框识别方法及相关设备，克服现有技术中存在的技术还不含有从图片文件中获取PPT文档方法的缺陷。本专利技术提供了一种基于神经网络的PPT边框识别方法，其中，所述神经网络包括：...

【技术保护点】
1.一种基于神经网络的PPT边框识别方法，其特征在于，所述神经网络包括：特征提取层、轮廓分割层和角点定位层：所述PPT边框识别方法包括：将含有PPT文档信息的图片输入所述特征提取层中进行特征提取，得到所述特征提取层输出的图片的特征图；将所述图片的特征图输入所述轮廓分割层，得到所述轮廓分割层输出的轮廓分割图像；将所述轮廓分割图像输入所述角点定位层，得到所述角点定位层输出的PPT边框的四个角点的位置信息；根据所述四个角点的位置信息识别出所述PPT边框。

【技术特征摘要】
1.一种基于神经网络的PPT边框识别方法，其特征在于，所述神经网络包括：特征提取层、轮廓分割层和角点定位层：所述PPT边框识别方法包括：将含有PPT文档信息的图片输入所述特征提取层中进行特征提取，得到所述特征提取层输出的图片的特征图；将所述图片的特征图输入所述轮廓分割层，得到所述轮廓分割层输出的轮廓分割图像；将所述轮廓分割图像输入所述角点定位层，得到所述角点定位层输出的PPT边框的四个角点的位置信息；根据所述四个角点的位置信息识别出所述PPT边框。2.根据权利要求1所述的基于神经网络的PPT边框识别方法，其特征在于，所述特征提取层包括：第一卷积层和反卷积层；所述含有PPT文档信息的图片输入所述第一卷积层，所述第一卷积层输出所述图片所对应的图片特征层；将所述图片特征层输入所述反卷积层，所述反卷积层输出所述图片特征层所对应的特征图。3.根据权利要求2所述的基于神经网络的PPT边框识别方法，其特征在于，所述轮廓分割层包括：第一卷积核；所述特征图输入所述卷积核，经过卷积操作后，输出轮廓分割图像。4.根据权利要求3所述的基于神经网络的PPT边框识别方法，其特征在于，所述角点定位层包括：第二卷积核；将所述轮廓分割图像依次输入所述第二卷积核，重复四次，分别得到四次卷积操作后输出的所述四个角点的位置信息。5.根据权利要求4所述的基于神经网络的PPT边框识别方法，其特征在于，所述神经网络还包括：全连接层；所述方法还包括：根据所述四个角点的位置信息，从特征图中提取出其...

【专利技术属性】
技术研发人员：管明雷，汪驰升，
申请(专利权)人：深圳市容会科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人