一种基于大数据的文字识别系统及方法技术方案

技术编号：27418753 阅读：16 留言：0更新日期：2021-02-21 14:36

本发明专利技术公开了一种基于大数据的文字识别系统及方法，包括：文件输入模块、文件类型识别模块、文件类型转换模块、播放截图模块、文字识别模块、智能处理模块、输出模块、通讯模块以及大数据库和九个使用步骤。其中，所述文件输入模块用于包含文字的文件，所述文件的类型包括图片和视频。本发明专利技术，功能更加全面，不仅可以识别静态图片中的文字，还能识别动态视频中的文字，可有效简化该基于大数据的文字识别系统的架构，从而提高该基于大数据的文字识别系统的运行速度，进而提高系统响应速度以及图像中文字识别效率，对图像中文字进行二级识别处理，从而提高图像中文字的识别准确率。从而提高图像中文字的识别准确率。从而提高图像中文字的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大数据的文字识别系统及方法

[0001]本专利技术涉及图像处理
，具体为一种基于大数据的文字识别系统及方法。

技术介绍

[0002]大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据有五大特点，即大量、高速、多样、低价值密度、真实性。它并没有统计学的抽样方法，只是观察和追踪发生的事情。大数据的用法倾向于预测分析、用户行为分析或某些其他高级数据分析方法的使用。
[0003]图像处理技术是用计算机对图像信息进行处理的技术。主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等。
[0004]现有技术中的图像中文字识别系统，不能全面的识别静态图片中的文字以及识别动态视频中的文字；其次，现有技术中的图像中文字识别系统，架构复杂，运行速度慢、系统响应速度以及图像中文字识别效率较低；另外，现有技术中的图像中文字识别系统，基本都是对图像中文字进行一级识别处理，从而导致图像中文字的识别准确率较差。
[0005]为此，提出一种基于大数据的文字识别系统及方法。

技术实现思路

[0006]本专利技术的目的在于提供一种基于大数据的文字识别系统及方法，功能更加全面，不仅可以识别静态图片中的文字，还能识别动态视频中的文字，可有效简化该基于大数据的文字识别系统的架构，从而提高该基于大数据的文字识别系统的运行速度，进而提高系统响应速度以及图像中文字识别效率，对图像中文字进行二级识别处理，从而提高图像中文字的识别准确率，以解决上述
技术介绍
中提出的...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的文字识别系统，其特征在于，包括：文件输入模块，所述文件输入模块用于包含文字的文件，所述文件的类型包括图片和视频；文件类型识别模块，所述文件类型识别模块用于识别输入的所述包含文字的文件的格式属性，并将所述包含文字的文件自动分类为图片类型或视频类型；文件类型转换模块，所述文件类型转换模块包括图片类型转换单元以及视频类型转换单元，所述图片类型转换单元用于将输入的所述包含文字的图片转换成统一图片格式的第一图片并保存在第一文件夹中，所述视频类型转换单元用于将输入的所述包含文字的视频转换成统一视频格式并保存在统一视频文件夹中；播放截图模块，所述播放截图模块用于播放被转换成统一视频格式的视频并将包含文字的画面截图生成统一图片格式的第二图片保存到第二文件夹中；文字识别模块，所述文字识别模块用于识别所述第一图片以及所述第二图片中包含的文字并生成第一文字；智能处理模块，所述智能处理模块用于接收所述第一文字，并对所述第一文字进行修正处理生成第二文字；输出模块，所述输出模块用于输出所述第二文字；通讯模块，所述通讯模块用于将该基于大数据的文字识别系统接入互联网；大数据库，所述大数据库包含标准文字集、标准符号集、标准字母集、标准数字集以及语法集。2.根据权利要求1所述的一种基于大数据的文字识别系统，其特征在于：所述文件输入模块、所述文件类型识别模块、所述文件类型转换模块、所述播放截图模块、所述文字识别模块、所述输出模块、所述通讯模块以及所述大数据库均与所述智能处理模块通信连接。3.根据权利要求1所述的一种基于大数据的文字识别系统，其特征在于：所述大数据库存储在云服务器中和/或本地主机中。4.根据权利要求1所述的一种基于大数据的文字识别系统，其特征在于：所述统一图片格式为JPEG格式，所述统一视频格式为AVI格式。5.根据权利要求1所述的一种基于大数据的文字识别系统，其特征在于：所述包含文字的文件的格式属性包括图片格式属性和视频格式属性；所述文件的格式属性包括BMP图片格式、TIFF图片格式、PNG图片格式以及JPEG图片格式；所述视频格式属性包括GIF视频格式、FLV视频格式、swf视频格式、rm视频格式、rmvb视频格式、MP4视频格式、3GP视频格式、AVI视频格式、MOV视频格式以及QT视频格式。6.根据权利要求1所述的一种基于大数据的文字识别系统，其特征在于：所述播放截图模块还包括播放调速单元，所述播放调速单元用于自动调节视频的播放速度，且调节视频的播放速度为20-30帧/秒。7.根据权利要求1所述的一种基于...

【专利技术属性】
技术研发人员：朱江，
申请(专利权)人：好活昆山网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人