图片识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33465037 阅读:44 留言:0更新日期:2022-05-19 00:44
本发明专利技术提供了一种图片识别方法、装置、电子设备及存储介质,所述识别方法首先需要构建图片数据集;然后在构建卷积神经网络并将所述图片数据集输入到所述卷积神经网络中;之后通过所述卷积神经网络对所述图片数据集进行训练得到图片识别模型;最后在验证所述图片识别模型正确性后使用所述图片识别模型对图片进行识别。本发明专利技术不需要人工抓包和人工筛查,依靠已训练好的模型可以使用机器直接识别广告的具体内容和品类并且可以进行大规模推广;本发明专利技术具有很好的时效性和扩展性,卷积神经网络可以在很短的时间内完成对广告图片的识别并且能保证较理想的识别准确率;还可以增加字符库中的汉字数,扩大训练样本的数量以适应广告样式与内容的更新变化。样式与内容的更新变化。样式与内容的更新变化。

【技术实现步骤摘要】
图片识别方法、装置、电子设备及存储介质


[0001]本专利技术涉及互联网流量采集识别领域,尤其涉及一种图片识别方法、装置、电子设备及存储介质。

技术介绍

[0002]目前没有特别高效且合适的自动化识别方案,基本都是通过人工抓包的方式手动实现广告的识别,具体步骤如下:
[0003]通过人工抓包,抓取互联网流量里面的广告图标,然后人工对广告进行分类,并标识特征;
[0004]根据已找到的特征,在大数据集群中对xDR话单进行匹配,能匹配上则认为是对应的广告流量;
[0005]如上所示,现有技术解决方法技术含量偏低,完全靠人工整理积累,与一般的抓包、业务分析没有明显区别。
[0006]现有技术存在以下几方面的问题:
[0007]纯人工抓包整理积累范围有限,同时人工投入太大,无论是工作模式还是覆盖范围,均不具备大规模推广的可行性;
[0008]技术假设存疑,现有技术的前提是假设特征一样内容则一样,而此假设未必完全100%成立,因此以一个样本去推断所有的结果,存在极大的误判;
[0009]实时性较差,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图片识别方法,其特征在于,所述图片识别方法包括:构建图片数据集;构建卷积神经网络并将所述图片数据集输入到所述卷积神经网络中;通过所述卷积神经网络对所述图片数据集进行训练得到图片识别模型;验证所述图片识别模型正确性后使用所述图片识别模型对图片进行识别。2.根据权利要求1所述的图片识别方法,其特征在于,所述构建图片数据集包括构建汉字图片数据集,所述构建汉字图片数据集包括:构建汉字字符库;对所述汉字字符库中的字符进行数据扩增;对数据扩增后的汉字字符进行编码生成汉字图片。3.根据权利要求1所述的图片识别方法,其特征在于,所述构建卷积神经网络并将所述图片数据集输入到所述卷积神经网络中包括:确定所述卷积神经网络的结构;其中,所述卷积神经网络包括卷积层、池化层、批标准化层、Flatten层、全连接层、Dropout层、Reshape层和Softmax回归层;对所述卷积神经网络各层中的参数进行初始化并设置激活函数。4.根据权利要求3所述的图片识别方法,其特征在于,所述数据扩增包括字符图片数量扩增,使用不同的字体文件对字符图片数量进行扩增。5.根据权利要求3所述的图片识别方法,其特征在于,所述数据扩增包括字符图片特征扩增,所述字符图片特征扩增包括高斯模糊、二值化、虚化边缘、横/竖线干扰、上下/左右运动模糊和污迹。6.根据权利要求1所述的图片识别方法,其特征在于,所述通过所述卷积神经网络对所述图片数据集进行训...

【专利技术属性】
技术研发人员:李林凤魏恩超郑茜云毛朱成
申请(专利权)人:北京浩瀚深度信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1