一种基于大数据的文字识别系统及方法技术方案

技术编号:27418753 阅读:16 留言:0更新日期:2021-02-21 14:36
本发明专利技术公开了一种基于大数据的文字识别系统及方法,包括:文件输入模块、文件类型识别模块、文件类型转换模块、播放截图模块、文字识别模块、智能处理模块、输出模块、通讯模块以及大数据库和九个使用步骤。其中,所述文件输入模块用于包含文字的文件,所述文件的类型包括图片和视频。本发明专利技术,功能更加全面,不仅可以识别静态图片中的文字,还能识别动态视频中的文字,可有效简化该基于大数据的文字识别系统的架构,从而提高该基于大数据的文字识别系统的运行速度,进而提高系统响应速度以及图像中文字识别效率,对图像中文字进行二级识别处理,从而提高图像中文字的识别准确率。从而提高图像中文字的识别准确率。从而提高图像中文字的识别准确率。

【技术实现步骤摘要】
一种基于大数据的文字识别系统及方法


[0001]本专利技术涉及图像处理
,具体为一种基于大数据的文字识别系统及方法。

技术介绍

[0002]大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据有五大特点,即大量、高速、多样、低价值密度、真实性。它并没有统计学的抽样方法,只是观察和追踪发生的事情。大数据的用法倾向于预测分析、用户行为分析或某些其他高级数据分析方法的使用。
[0003]图像处理技术是用计算机对图像信息进行处理的技术。主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等。
[0004]现有技术中的图像中文字识别系统,不能全面的识别静态图片中的文字以及识别动态视频中的文字;其次,现有技术中的图像中文字识别系统,架构复杂,运行速度慢、系统响应速度以及图像中文字识别效率较低;另外,现有技术中的图像中文字识别系统,基本都是对图像中文字进行一级识别处理,从而导致图像中文字的识别准确率较差。
[0005]为此,提出一种基于大数据的文字识别系统及方法。

技术实现思路

[0006]本专利技术的目的在于提供一种基于大数据的文字识别系统及方法,功能更加全面,不仅可以识别静态图片中的文字,还能识别动态视频中的文字,可有效简化该基于大数据的文字识别系统的架构,从而提高该基于大数据的文字识别系统的运行速度,进而提高系统响应速度以及图像中文字识别效率,对图像中文字进行二级识别处理,从而提高图像中文字的识别准确率,以解决上述
技术介绍
中提出的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:
[0008]一种基于大数据的文字识别系统,包括:
[0009]文件输入模块,所述文件输入模块用于包含文字的文件,所述文件的类型包括图片和视频;
[0010]文件类型识别模块,所述文件类型识别模块用于识别输入的所述包含文字的文件的格式属性,并将所述包含文字的文件自动分类为图片类型或视频类型;
[0011]文件类型转换模块,所述文件类型转换模块包括图片类型转换单元以及视频类型转换单元,所述图片类型转换单元用于将输入的所述包含文字的图片转换成统一图片格式的第一图片并保存在第一文件夹中,所述视频类型转换单元用于将输入的所述包含文字的视频转换成统一视频格式并保存在统一视频文件夹中;
[0012]播放截图模块,所述播放截图模块用于播放被转换成统一视频格式的视频并将包含文字的画面截图生成统一图片格式的第二图片保存到第二文件夹中;
[0013]文字识别模块,所述文字识别模块用于识别所述第一图片以及所述第二图片中包含的文字并生成第一文字;
[0014]智能处理模块,所述智能处理模块用于接收所述第一文字,并对所述第一文字进行修正处理生成第二文字;
[0015]输出模块,所述输出模块用于输出所述第二文字;
[0016]通讯模块,所述通讯模块用于将该基于大数据的文字识别系统接入互联网;
[0017]大数据库,所述大数据库的内部包含标准文字集、标准符号集、标准字母集、标准数字集以及语法集。
[0018]作为优选,所述文件输入模块、所述文件类型识别模块、所述文件类型转换模块、所述播放截图模块、所述文字识别模块、所述输出模块、所述通讯模块以及所述大数据库均与所述智能处理模块通信连接。
[0019]作为优选,所述大数据库存储在云服务器中和/或本地主机中。
[0020]作为优选,所述统一图片格式为JPEG格式,所述统一视频格式为AVI格式。
[0021]作为优选,所述包含文字的文件的格式属性包括图片格式属性和视频格式属性;所述文件的格式属性包括BMP图片格式、TIFF图片格式、PNG图片格式以及JPEG图片格式;所述视频格式属性包括GIF视频格式、FLV视频格式、swf视频格式、rm视频格式、rmvb视频格式、MP4视频格式、3GP视频格式、AVI视频格式、MOV视频格式以及QT视频格式。
[0022]作为优选,所述播放截图模块还包括播放调速单元,所述播放调速单元用于自动调节视频的播放速度,且调节视频的播放速度为20-30帧/秒。
[0023]作为优选,所述文字识别模块用于识别图片中的文字区域并将所述文字区域中包含的文字生成第一文字,再将所述文字区域和生成的所述第一文字一同上传给所述智能处理模块进行处理。
[0024]作为优选,所述的基于大数据的文字识别系统,还包括字体设置模块,所述字体设置模块用于设置所述第二文字的字体,且所述字体设置模块内包含字体数据库,所述字体设置模块与所述智能处理模块通信连接。
[0025]作为优选,所述的基于大数据的文字识别系统,还包括缓存自动删除模块,所述缓存自动删除模块用于自动删除存储的第一图片、第二图片、被转换成统一视频格式的视频、输入的包含文字的图片、输入的包含文字的视频以及输出的文档,且所述缓存自动删除模块与所述智能处理模块通信连接。
[0026]本专利技术还提出一种基于大数据的图像中文字识别方法,包括如下步骤:
[0027]步骤一、打开基于大数据的文字识别系统,通讯模块自动将所述的基于大数据的文字识别系统接入互联网并与保存在云服务器中或者本地主机中的大数据库建立连接,同时设定视频播放速度、设定输出字体以及设定缓存自动删除模块自动执行删除任务的条件;
[0028]步骤二、输入文件,将包含文字的图片和包含文字的视频通过文件输入模块输入所述基于大数据的文字识别系统中;
[0029]步骤三、识别文件类型,文件类型识别模块自动识别输入的包含文字的文件的格式属性,和包含文字的视频格式属性,并将包含文字的图片自动分类为图片类型以及将包含文字的视频自动分类为视频类型;
[0030]步骤四、转换文件类型,图片类型转换单元将输入的包含文字的图片转换成统一图片格式的第一图片并保存在第一文件夹中;视频类型转换单元将输入的包含文字的视频
转换成统一视频格式并保存在统一视频文件夹中;
[0031]步骤五、播放截图,当统一视频文件夹中具有转换成统一视频格式的包含文字的视频时,播放截图模块播放被转换成统一视频格式的视频并将包含文字的画面截图生成统一图片格式的第二图片保存到第二文件夹中,当统一视频文件夹中没有转换成统一视频格式的包含文字的视频时,且在第一文件夹中具有第一图片时直接进入下一步;
[0032]步骤六、识别文字,文字识别模块自动识别所述第一图片以及所述第二图片中包含的文字并生成第一文字;
[0033]步骤七、修整处理,智能处理模块接收第一文字,并依据大数据库的内部包含的标准文字集、标准符号集、标准字母集、标准数字集以及语法集对所述第一文字进行修正处理生成第二文字;
[0034]步骤八、输出识别结果,输出模块将所述第二文字以文档的形式输出,并保存在设定的文件夹中;
[0035]步骤九、关闭系统,关闭所述的基于大数据的文字识别系统,同时缓存自动删除模块根据设置的自动执行删除任本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的文字识别系统,其特征在于,包括:文件输入模块,所述文件输入模块用于包含文字的文件,所述文件的类型包括图片和视频;文件类型识别模块,所述文件类型识别模块用于识别输入的所述包含文字的文件的格式属性,并将所述包含文字的文件自动分类为图片类型或视频类型;文件类型转换模块,所述文件类型转换模块包括图片类型转换单元以及视频类型转换单元,所述图片类型转换单元用于将输入的所述包含文字的图片转换成统一图片格式的第一图片并保存在第一文件夹中,所述视频类型转换单元用于将输入的所述包含文字的视频转换成统一视频格式并保存在统一视频文件夹中;播放截图模块,所述播放截图模块用于播放被转换成统一视频格式的视频并将包含文字的画面截图生成统一图片格式的第二图片保存到第二文件夹中;文字识别模块,所述文字识别模块用于识别所述第一图片以及所述第二图片中包含的文字并生成第一文字;智能处理模块,所述智能处理模块用于接收所述第一文字,并对所述第一文字进行修正处理生成第二文字;输出模块,所述输出模块用于输出所述第二文字;通讯模块,所述通讯模块用于将该基于大数据的文字识别系统接入互联网;大数据库,所述大数据库包含标准文字集、标准符号集、标准字母集、标准数字集以及语法集。2.根据权利要求1所述的一种基于大数据的文字识别系统,其特征在于:所述文件输入模块、所述文件类型识别模块、所述文件类型转换模块、所述播放截图模块、所述文字识别模块、所述输出模块、所述通讯模块以及所述大数据库均与所述智能处理模块通信连接。3.根据权利要求1所述的一种基于大数据的文字识别系统,其特征在于:所述大数据库存储在云服务器中和/或本地主机中。4.根据权利要求1所述的一种基于大数据的文字识别系统,其特征在于:所述统一图片格式为JPEG格式,所述统一视频格式为AVI格式。5.根据权利要求1所述的一种基于大数据的文字识别系统,其特征在于:所述包含文字的文件的格式属性包括图片格式属性和视频格式属性;所述文件的格式属性包括BMP图片格式、TIFF图片格式、PNG图片格式以及JPEG图片格式;所述视频格式属性包括GIF视频格式、FLV视频格式、swf视频格式、rm视频格式、rmvb视频格式、MP4视频格式、3GP视频格式、AVI视频格式、MOV视频格式以及QT视频格式。6.根据权利要求1所述的一种基于大数据的文字识别系统,其特征在于:所述播放截图模块还包括播放调速单元,所述播放调速单元用于自动调节视频的播放速度,且调节视频的播放速度为20-30帧/秒。7.根据权利要求1所述的一种基于...

【专利技术属性】
技术研发人员:朱江
申请(专利权)人:好活昆山网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1