图片处理方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:23707259 阅读:61 留言:0更新日期:2020-04-08 11:38
本申请的实施例揭示了一种图片处理方法、装置、设备以及计算机可读存储介质。该方法包括:获取待进行文本识别的图片;识别所述图片中含有的文本信息,获得识别文本,所述文本信息包括文字、数字、字母、标点符号中的至少一种,所述识别文本由所述文本信息拼接构成;对所述识别文本进行语音转换,获得所述识别文本对应的语音数据;播放所述识别文本对应的语音数据。本申请实施例的技术方案解决了现有技术无法以有声读物的形式进行图片中文字的语音播报的技术问题。

【技术实现步骤摘要】
图片处理方法、装置、设备及计算机可读存储介质
本申请涉及图像处理
,具体涉及一种图片处理方法、装置、设备和计算机可读存储介质。
技术介绍
随着知识、信息获取方式的多元化发展,尤其是数字化媒介不断冲击传统的纸质报刊书籍,社会阅读习惯逐渐发生着改变,例如人们更加地倾向于通过数字化的有声读物来达到阅读目的。目前,有声读物是预先对朗读书籍的音频进行录制和存储,有声读物的阅读过程则为相应音频的播放过程。在实际的应用场景中,图片中文本内容的阅读性较差,人们希望可以将图片作为一种有声读物,通过对图片中文字内容进行语音播报,以更加方便地获取图片所要传达的信息,但由于人们浏览图片的随机性,无法针对人们可能浏览的图片进行相应音频的预先录制和存储。因此,现有技术中存在无法以有声读物的形式对图片中的文字内容进行语音播报的技术问题。
技术实现思路
为解决上述技术问题,本申请的实施例提供了一种图片处理方法、装置、设备以及计算机可读存储介质,基于本申请实施例进行的图片处理,便于实现图片中文字内容的语音播报。其中,本申请所采用的技术方案为:一种图片处理方法,包括:获取待进行文本识别的图片;识别所述图片中含有的文本信息,获得识别文本,所述文本信息包括文字、数字、字母、标点符号中的至少一种,所述识别文本由所述文本信息拼接构成;对所述识别文本进行语音转换,获得所述识别文本对应的语音数据;播放所述识别文本对应的语音数据。一种图片处理装置,包括:图片获取模块,用于获取待进行文本识别的图片;文本识别模块,用于识别所述图片中含有的文本信息,获得识别文本,所述文本信息包括文字、数字、字母、标点符号中的至少一种,所述识别文本由所述文本信息拼接构成;语音转换模块,用于对所述识别文本进行语音转换,获得所述识别文本对应的语音数据;语音播放模块,用于播放所述识别文本对应的语音数据。一种图片处理设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的图片处理方法。一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的图片处理方法。在上述技术方案中,获取待进行文字识别的图片后,通过识别图片中含有的文本信息,获得图片对应的识别文本,然后通过对该识别文本进行语音转换,得到该识别文本对应的语音数据,通过播放该语音数据,即可实现图片所含有文本信息的语音播放。可以看出,本申请的技术方案无需预先针对图片中的文字内容进行音频录制和存储,而是通过对图片中文本信息进行实时识别和语音转换,并针对转换得到的音频数据实现语音播报,从而解决了现有技术无法以有声读物的形式进行图片中文字的语音播报的技术问题。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1是本专利技术涉及的一种实施环境的示意图;图2是根据一示例性实施例示出的一种图片处理方法的流程图;图3是图2所示实施例中的步骤120在一个实施例的流程图;图4是图3所示实施例中的步骤123在一个实施例的流程图;图5是图3所示实施例中的步骤121在一个实施例的流程图;图6是图2所示实施例中的步骤130在一个实施例的流程图;图7是根据一示例性实施例示出的一种用户交互界面的示意图;图8是一示例性的应用场景中示出一种图片处理方法的流程图;图9是根据一示例性实施例示出的一种图片处理装置的框图;图10是根据一示例性实施例示出的一种图片处理设备的结构示意图。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。请参阅图1,图1是本专利技术涉及的一种实施环境的示意图,该实施环境由终端设备100、文本识别服务器200和语音转换服务器300构成。其中,终端设备100用于提供一用户交互界面,用户可以在用户交互界面中进行相应操作,例如确定一张待进行文本识别的图片,然后触发终端设备100进行图片所含有文本信息的语音播报,便于用户获取图片所表达信息。终端100可以是智能手机、平板、或者其它任意能够触发进行图片所含有文本信息识别的电子设备,本处不进行限制。终端设备100预先与文本识别服务器200建立通信连接,以在处理图片所含有文本信息的语音播报过程中,从文本识别服务器200中获取相关服务,对图片所含有文本信息进行识别。终端设备100还预先与语音转换服务器300建立通信连接,以通过语音转换服务器300对识别的文本信息进行语音转换,得到图片所含有文本信息对应的语音数据。终端设备100通过对所得语音数据进行播放,即可实现图片所含有文本信息的语音播报。如前所述,在现有技术中,有声读物是通过预先对朗读书籍的音频进行录制和存储,有声读物的阅读过程即为音频的播放过程。为更加方便地获取图片中含有的文字内容,人们希望可以将图片作为一种有声读物,通过进行图片中文本内容的播报,而进行相关信息的获取。由于浏览图片的随机性,人们针对图片中文字信息的获取需求往往是多方面的,例如需要获取互联网上的图片含有的文字信息,或者需要获取拍摄的某张图片含有的文字信息,无法针对人们可能浏览的图片都进行相应音频的录制和存储,因此,采用现有的技术方案无法满足人们对于图片所含有文字内容的获取需求。为解决此技术问题,本专利技术一方面提供一种图片处理方法,另一方面还相应提供了一种图片处理装置,以针对任意的图片实时进行图片所含有文字内容的识别和语音转换,并进行相应语音数据的播放,实现图片所含有文本信息的方便获取。图2是根据一示例性实施例示出的一种图片处理方法的流程图,该方法可以被配置为由图1所示实施环境中的终端设备100具体执行,或者被配置为由其他设备执行,本实施例不进行限制。如图2所示,在一示例性实施例中,该图片处理方法可以包括以下步骤:步骤110,获取待进行文本识别的图片。在本实施例中,待进行文本识别的图片可以是任意图片,例如可以是通过摄像头实时拍摄的图片,也可以是存储介质中存储的图片,例如电子相册,还可以是互联网上的网络图片,本处不进行限制。针对不同的图片类型,获取图片的方式也相应不同,例如可以通过摄像头拍照获得图片,可以从电子相册中选择一张或者多张图片,或者通URL(UniformResource本文档来自技高网...

【技术保护点】
1.一种图片处理方法,其特征在于,包括:/n获取待进行文本识别的图片;/n识别所述图片中含有的文本信息,获得识别文本,所述文本信息包括文字、数字、字母、标点符号中的至少一种,所述识别文本由所述文本信息拼接构成;/n对所述识别文本进行语音转换,获得所述识别文本对应的语音数据;/n播放所述识别文本对应的语音数据。/n

【技术特征摘要】
1.一种图片处理方法,其特征在于,包括:
获取待进行文本识别的图片;
识别所述图片中含有的文本信息,获得识别文本,所述文本信息包括文字、数字、字母、标点符号中的至少一种,所述识别文本由所述文本信息拼接构成;
对所述识别文本进行语音转换,获得所述识别文本对应的语音数据;
播放所述识别文本对应的语音数据。


2.根据权利要求1所述的方法,其特征在于,所述识别所述图片中含有的文本信息,获得识别文本,包括:
将所述图片的图片格式转换为设定格式;
调用文本识别服务对应的文本识别接口,将所述设定格式的图片传入所述文本识别服务中,使所述文本识别服务进行所述图片中文本信息的识别;
获取所述文本识别服务所识别得到的文本信息,由所述文本信息拼接得到所述识别文本。


3.根据权利要求2所述的方法,其特征在于,所述将所述图片的图片格式转换为设定格式,包括:
根据所述图片的高度和宽度创建所述设定格式的画布,所述画布的高度和宽度与所述图片相匹配;
将所述图片绘制在所述画布上,获得所述设定格式的图片。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述设定格式的图片的质量超过预设的质量阈值,则通过调整所述画布的质量参数,使所述图片的质量低于所述质量阈值。


5.根据权利要求2所述的方法,其特征在于,所述获取所述文本识别服务所识别得到的文本信息,由所述文本信息拼接得到所述识别文本,包括:
接收所述文本识别服务返回的文本识别接口数据,所述文本识别服务识别得到的文本信息按照设定的数据结构在所述文本识别接口数据中排布;
根据所述文本信息对应的排布顺序,依次从所述接口数据中提取所述文本信息;
按照所述文本信息的提取顺序进行所述文本信息的拼接,得到所述识别文本。


6.根据权利要求1所述的方法,其特征在于,所述对所述识别文本进行语音转换,获得所述...

【专利技术属性】
技术研发人员:袁佳平
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1