信息处理方法和装置、电子设备、计算机可读存储介质制造方法及图纸

技术编号:19023970 阅读:30 留言:0更新日期:2018-09-26 19:12
本申请涉及一种信息处理方法、装置、电子设备和计算机可读存储介质。该方法包括:若识别被打开的文件的格式为指定格式,则扫描所述文件;从所述文件中提取文字得到纯文本信息;将所述纯文本信息中的文字转化为语音,并进行播放。上述信息处理方法、装置、电子设备、计算机可读存储介质,识别到文件的格式为特定格式文件时,从文件中提取文字得到文本信息,将文本信息中的文字转化为语音进行播放,实现了指定格式文件中内容的语音播放,方便以音频方式播放指定格式的文件。

【技术实现步骤摘要】
信息处理方法和装置、电子设备、计算机可读存储介质
本申请涉及信息处理领域,特别是涉及一种信息处理方法、装置、电子设备、计算机可读存储介质。
技术介绍
随着电子设备的普及,越来越多的用户携带电子设备查看文件、播放音乐,或者通过电子设备上的语音识别系统将文字信息识别为语音进行播放等。然而,电子设备无法通过语音播放一些格式的文件。
技术实现思路
本申请实施例提供一种信息处理方法、装置、电子设备、计算机可读存储介质,可以通过音频播放文件中的内容。一种信息处理方法,包括:若识别被打开的文件的格式为指定格式,则扫描所述文件;从所述文件中提取文字得到纯文本信息;将所述纯文本信息中的文字转化为语音,并进行播放。一种信息处理装置,包括:扫描模块,用于若识别被打开的文件的格式为指定格式,则扫描所述文件;提取模块,用于从所述文件中提取文字得到纯文本信息;播放模块,用于将所述纯文本信息中的文字转化为语音,并进行播放。一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的信息处理方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的信息处理方法的步骤。本申请实施例中的信息处理方法、装置、电子设备、计算机可读存储介质,识别到文件的格式为特定格式文件时,从文件中提取文字得到文本信息,将文本信息中的文字转化为语音进行播放,实现了指定格式文件中内容的语音播放,方便以音频方式播放指定格式的文件。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为一个实施例中信息处理方法的应用环境示意图;图2为一个实施例中信息处理方法的流程图;图3为另一个实施例中信息处理方法的流程图;图4为另一个实施例中信息处理方法的流程图;图5为一个实施例的信息处理装置的结构框图;图6为另一个实施例的信息处理装置的结构框图;图7为一个实施例中电子设备的内部结构示意图;图8为一个实施例中电子设备相关的手机的部分结构的框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一客户端称为第二客户端,且类似地,可将第二客户端称为第一客户端。第一客户端和第二客户端两者都是客户端,但其不是同一客户端。图1为一个实施例中信息处理方法的应用环境示意图。如图1所示,该应用环境包括电子设备110。电子设备110识别到被打开的文件的格式为指定格式,则扫描整个文件,从文件中提取文字得到纯文本信息,从纯文本信息中的文字转化为语音进行播放。实现了将指定格式的文件内容通过语音播放,方便播放非音频格式的文件。电子设备110可为智能手机、平板电脑或者个人数字助理或穿戴式设备等。图2为一个实施例中信息处理方法的流程图。本实施例中的信息处理方法,以运行于图1中的电子设备上为例进行描述。如图2所示,一种信息处理方法包括步骤202至步骤206。步骤202,若识别被打开的文件的格式为指定格式,则扫描所述文件。具体地,计算机文件是以计算机硬盘为载体存放在计算机上的信息集合。文件可以是文本文档、图片、程序等等。文件通常具有后缀名。后缀名用于指示文件的格式类型。例如,文件的后缀名为.jpg,则该文件为图片文件。指定格式是指系统默认的格式,或者用户选择的文件格式。指定格式可为包含图形的文件的格式。在一个实施例中,指定格式可为PDF(PortableDocumentFormat,便携式文档)格式、JPEG(JointPhotographicExpertsGROUP)格式、PPT(Powerpoint)格式等。PDF格式的文件是采用投影制作的,不能直接被音频播放。电子设备接收到点击某个文件的触发指令后,通过调用对应的应用程序读取该文件数据,并将该文件数据通过电子设备进行输出。电子设备识别被打开的文件的格式是否为指定格式,可通过将被打开的文件的格式与指定格式进行匹配,若相同,则被打开的文件的格式为指定格式,若不同,则被打开的文件不为指定格式。当电子设备识别到被打开的文件的格式为指定格式,则扫描整个文件。电子设备扫描文件可采用逐行扫描方式,或者采用多行同时扫描方式。步骤204,从所述文件中提取文字得到纯文本信息。具体地,电子设备可以对该指定格式的文件进行整体扫描,然后识别出文件中的文字,并将提取的文字按照在文件中出现的先后顺序排列组成纯文本信息。纯文本信息是指只包含文字。步骤206,将所述纯文本信息中的文字转化为语音,并进行播放。具体地,电子设备中的文字转语音系统可将纯文本信息中的文字转化为语音,然后将语音播放,通过电子设备的音频输出单元将声音放出。音频输出单元可为麦克风或扬声器。本实施例的信息处理方法,识别到被打开的文件的格式为指定格式时,对该文件进行扫描,提取文件中的文字得到文本信息,将文本信息中文字转化为语音进行播放,实现了对指定格式文件的语音播放,扩展了文件输出方式,方便以音频方式播放非音频格式的文件内容。在一个实施例中,识别被打开的文件的格式为指定格式的步骤包括:识别被打开的文件的后缀名是否包含预设字符串;当该文件的后缀名包含预设字符串,则该文件的格式为指定格式。具体地,后缀名是指文件的扩展名,用于表示文件的类型。例如文件的后缀名为.pdf,则文件为PDF文档;文件的后缀名为.doc,则文件为word文档。预设字符串是指指定格式的文件的后缀名所包含的字符串。可以将指定格式的文件的后缀名的字符串放置在字符串集合。电子设备识别被打开的文件的后缀名是否包含预设字符串,若包含,则该文件的格式为指定格式,则对该文件进行扫描,提取该文件中的文字。电子设备可将被打开的文件的后缀名与字符串集合中的预设字符串进行比对,若该文件的后缀名包含了字符串集合中的预设字符串,则该文件的格式为指定格式。在一个实施例中,从文件中提取文字得到纯文本信息,包括:获取文件中的图像,将该图像中的文字和图形分离,获取文字,得到纯文本信息。具体地,被打开的文件中包含图像,电子设备将图像中的文字和图形可通过影像成形方式分离。电子设备通过影像成形方式识别出文件中的文字行,将文字行切割,得到字符串,再将字符串切割得到单个字符,如此将文字和图形分类,去除图形得到纯文本信息。在一个实施例中,如图3所示,一种信息处理方法,包括步骤302至步骤308。其中:步骤302,若识别被打开的文件的格式为指定格式,则扫描所述文件。具体地,指定格式可为包含图形的文件的格式。指定格式可为PDF格式、JPEG格式、PPT格式等。步骤304,从所述文件中提取文字得到纯文本信息。步骤306,将所述纯文本信息存放在文本文件中。具体地,文本文件本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,包括:若识别被打开的文件的格式为指定格式,则扫描所述文件;从所述文件中提取文字得到纯文本信息;将所述纯文本信息中的文字转化为语音,并进行播放。

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:若识别被打开的文件的格式为指定格式,则扫描所述文件;从所述文件中提取文字得到纯文本信息;将所述纯文本信息中的文字转化为语音,并进行播放。2.根据权利要求1所述的方法,其特征在于,所述识别被打开的文件的格式为指定格式,包括:识别被打开的文件的后缀名是否包含预设字符串;当所述被打开的文件的后缀名包含预设字符串,则所述被打开的文件的格式为指定格式。3.根据权利要求1所述的方法,其特征在于,所述从文件中提取文字得到纯文本信息,包括:获取所述文件中的图像,将所述图像中的文字和图形分离,获取文字,得到纯文本信息。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述从所述文件中提取文字得到纯文本信息之后,还包括:将所述纯文本信息存放在文本文件中;所述将所述纯文本信息中的文字转化为语音,并进行播放,包括:对所述文本文件中的文字进行依次读取,转化为语音,并进行播放。5.根据权利要求1至3任一项所述的方法,其特征在于,所述将所述纯文本信息中的文字转化为语音,并进行播放,包括:将所述纯文本信息中的文字转化为语音,以预设播放速率进行播放。6.根据权利要求5所述的方法,其特...

【专利技术属性】
技术研发人员:曾鸿坤
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1