播放音频信息的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21361442 阅读:19 留言:0更新日期:2019-06-15 09:21
本申请提出一种播放音频信息的方法、装置、计算机设备及存储介质,其中方法包括步骤:控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;判断所述第一图像内是否有图书;若是,则获取每一本所述图书的书名,得到第一名单;接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。通过本申请的方法可以进行多本图书识别,并辅助用户选定最终想要阅读的图书并播放该图书的音频信息。

Method, Device, Computer Equipment and Storage Media for Playing Audio Information

This application proposes a method, device, computer equipment and storage medium for playing audio information. The method includes steps: controlling the camera to take the first area within the current viewing angle to obtain the first image; judging whether there are books in the first image; if so, obtaining the title of each book and obtaining the first list; receiving the user in the first image. The title of the target book selected in the list is played with audio information corresponding to the title of the target book. Through the method of this application, multiple books can be identified, and users can select the books they want to read and play the audio information of the books.

【技术实现步骤摘要】
播放音频信息的方法、装置、计算机设备及存储介质
本申请涉及到数据处理
,特别是涉及到一种播放音频信息的方法、装置、计算机设备及存储介质。
技术介绍
读书是我们获取知识,开拓视野,提升个人素质的途径。目前市场上,出现了很多可提供有声阅读的机器人,现有技术中的阅读机器人识别图书,是应用一种通过图像识别来进行图书识别的方法,通过照相机拍摄,进行图像处理和文字识别,最终生成语音文件,再播放该语音文件。但是,图书翻页时有时会漏页,还会使图书容易受损,加上图像处理缓慢等缺点,用户对图书的阅读体验不佳。而且对现有技术所采用的图像识别方法的应用,阅读机器人通过对图书的内容进行识别,导致在图书识别上有着识别错误率高,又不能提供用户的多次选择操作,出现用户不能很好地选择自己感兴趣的图书的问题;同时,阅读机器人的摄像头是固定的,只能同时识别单本图书,这给图书的阅读带来了一定的不便。
技术实现思路
本申请的目的在于提供一种播放音频信息的方法、装置、计算机设备及存储介质,以实现通过机器人多本图书识别,辅助用户选定最终想要阅读的图书,并播放该图书的音频信息的目的。本申请提出一种播放音频信息的方法,包括步骤:S1、控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;S2、判断所述第一图像内是否有图书;S3、若是,则获取每一本所述图书的书名,得到第一名单;S4、接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。进一步地,所述判断所述第一图像内是否有图书的步骤之后,包括:S211、若否,则发出语音信号,所述语音信号用于提示用户在所述当前视角范围内的区域内放置图书;S212、经过预设时间长度后,执行所述步骤S1。进一步地,所述接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息的步骤,包括:S41、将所述第一名单发送至服务器,以让服务器检索与所述第一名单中的书名对应的音频信息;S42、接收所述服务器返回的检索结果信息;S43、根据所述检索结果信息,将所述第一名单中没有音频信息的书名删除,形成第二名单;S44、将所述第二名单加载在显示屏上;S45、接收用户在所述第二名单中选择的目标书名,播放所述目标书名对应的音频信息。进一步地,所述将所述第二名单加载在显示屏上的步骤之后,还包括:S46、接收到用户发送的要求重新获取书名的指令;S47、调整摄像头的高度和/或角度,执行所述步骤S1。进一步地,所述将所述第一名单中没有音频信息的书名删除,形成第二名单的步骤,包括:S431、判断获取所述第一名单的次数是否大于两次;S432、若是,则将最后一次获得的第一名单中没有音频信息的书名删除,并删除历史的第一名单中的书名,形成第二名单。进一步地,所述获取每一本所述图书的书名,得到第一名单的步骤,包括:S31、对所述第一图像进行OCR识别,获取所述第一图像中的文字和符号;S32、根据所述文字和符号,确定每一本图书对应的书名,并通过汇总每一本图书对应的所述书名得到第一名单。进一步地,所述对所述第一图像进行OCR识别,获取所述第一图像中的文字和符号的步骤,包括:S311、对所述第一图像进行OCR识别;S312、若未识别到文字和符号,则调整控制摄像头的高度和/或角度拍摄,并拍摄摄像头调整后的高度和/或角度对应的第二区域,以获得第二图像;S313、对所述第二图像进行OCR识别,获取所述第二图像中的文字和符号。本申请提出一种播放音频信息的装置,包括:拍摄模块,用于控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;判断模块,用于判断所述第一图像内是否有图书;获取模块,用于若是,则获取每一本所述图书的书名,得到第一名单;播放模块,用于接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。本申请提出一种计算机设备,其包括处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的播放音频信息的方法。本申请还提出一种存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被执行时实现上述任一项所述的播放音频信息的方法。相比现有技术,本申请提供了一种播放音频信息的方法、装置、计算机设备及存储介质,具有以下有益效果:根据摄像头拍摄的图像,可以进行多本图书识别,通过识别书名获得对应图书的音频信息,降低了识别错误率,同时又增加了图书的使用寿命,用户可以进行多次选择,起到辅助用户选定最终想要阅读的图书并播放该图书的音频信息,提高阅读的便捷性。附图说明图1是本申请一个实施例的播放音频信息的方法的流程示意图;图2是本申请一个实施例的播放音频信息的方法的流程示意图;图3是本申请一个实施例的播放音频信息的方法的流程示意图;图4是本申请一个实施例的播放音频信息的方法的流程示意图;图5是本申请一个实施例的播放音频信息的方法的流程示意图;图6是本申请一个实施例的播放音频信息的装置的结构示意框图;图7是本申请的一个实施例的计算机设备的结构示意图;图8是本申请的一个实施例的存储介质的结构示意图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,在专利技术中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,一种播放音频信息的方法,包括步骤:S1、控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;S2、判断所述第一图像内是否有图书;S3、若是,则获取每一本所述图书的书名,得到第一名单;S4、接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。在本实施例中,如上述步骤S1所述,所述摄像头一般具有视频摄影/传播和静态图像捕捉等基本功能,可以是安装在任何电子设备(如手机、计算机、平板电脑、相机等等)上的摄像头,也可以是基于本申请而专门设计的在机器人上安装的摄像头;图像是人对视觉感知的物质再现,可以由光学设备获取,如照相机、摄像头等;所述第一图像是指通过摄像头拍摄物体而得到的照片,可以是物体的正面照片,也可以是物体的侧面照片。控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像,指的是机器人进入图像检测模式后,控制安装在机器人上的摄像头,摄像头是可伸缩旋转的,故调整摄像头的高度和角度,即将摄像头升高或者降低,也可以是向左转动或者向右转动,从而来使被拍摄物体在摄像头的拍摄范围内,当确定好摄像头与被拍摄物体之间的距离,通过摄像头拍摄得到视角范围内的照片,所述照片即第一图像。如上述步骤S2所述,图书的形状一般是扁平状的长方体,其外封面上印刷有字体。机器人识别出第一图像中各物体的形状以及对应的是否有文字,来判断第一图像中是否有图书。具体的实施方法有,机器人将第一图像输入到一个经训练后得到的图书识别模型中,然后输出第一图像中图书数量的结果。其中,图书识别模型是工作人员预先训练得到的,图书识别模型采用神经网络模型作为基础模型,工作人员采集多个包含有图书的图像,并对每一个图像标记有图书的数量,然后将所有的包本文档来自技高网...

【技术保护点】
1.一种播放音频信息的方法,其特征在于,包括步骤:S1、控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;S2、判断所述第一图像内是否有图书;S3、若是,则获取每一本所述图书的书名,得到第一名单;S4、接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。

【技术特征摘要】
1.一种播放音频信息的方法,其特征在于,包括步骤:S1、控制摄像头拍摄当前视角范围内的第一区域,以获得第一图像;S2、判断所述第一图像内是否有图书;S3、若是,则获取每一本所述图书的书名,得到第一名单;S4、接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息。2.如权利要求1所述的播放音频信息的方法,其特征在于,所述判断所述第一图像内是否有图书的步骤之后,包括:S211、若否,则发出语音信号,所述语音信号用于提示用户在所述当前视角范围内的第一区域内放置图书;S212、经过预设时间长度后,执行所述步骤S1。3.如权利要求1所述的播放音频信息的方法,其特征在于,所述接收用户在所述第一名单中选择的目标书名,并播放所述目标书名对应的音频信息的步骤,包括:S41、将所述第一名单发送至服务器,以让服务器检索与所述第一名单中的书名对应的音频信息;S42、接收所述服务器返回的检索结果信息;S43、根据所述检索结果信息,将所述第一名单中没有音频信息的书名删除,形成第二名单;S44、将所述第二名单加载在显示屏上;S45、接收用户在所述第二名单中选择的目标书名,播放所述目标书名对应的音频信息。4.如权利要求3所述的播放音频信息的方法,其特征在于,所述将所述第二名单加载在显示屏上的步骤之后,还包括:S46、接收用户发送的要求重新获取书名的指令;S47、调整摄像头的高度和/或角度,执行所述步骤S1。5.如权利要求3所述的播放音频信息的方法,其特征在于,所述将所述第一名单中没有音频信息的书名删除,形成第二名单的步骤,包括:S431、判断获取所述第一名单的次数是否大于两次;S...

【专利技术属性】
技术研发人员:魏仁
申请(专利权)人:深圳市沃特沃德股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1