多媒体文件的获取及播放方法以及装置制造方法及图纸

技术编号:17196160 阅读:44 留言:0更新日期:2018-02-03 22:51
本发明专利技术公开了一种多媒体文件的获取及播放方法以及装置,该方法包括:接收用户触发指令,响应触发指令并采集用户的语音信号指令;按照设定参数对语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件;接收多媒体文件,通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理;播放处理后的多媒体文件。通过上述方法,提升语音识别的准确率,改善多媒体文件的输出效果,提高用户体验。

【技术实现步骤摘要】
多媒体文件的获取及播放方法以及装置
本专利技术涉及智能终端领域,特别是涉及一种多媒体文件的获取及播放方法以及装置。
技术介绍
互联网技术以及与电子技术的结合程度越来越高,智能终端的功能越来越多样化,同时用户对智能终端产品智能化、人性化的要求也越来越高,特别是,人们希望能够更方便的搜索到喜欢的音视频,比如各种音频文件,并追求更好的音质效果。为了达到更好的音质效果,很多产品选择使用性能优质的器件,改善音质,但是此方法设计的产品成本的较高,而且需要耗费大量的人力物力进行音频指标测试。再者,目前业内基本上是把提升音质的器件设置在智能终端设备上,比如,通过智能终端的双喇叭输出,智能终端一般都比较轻薄,使得喇叭的尺寸收到限制,一般薄且小,从而使动圈的材料以及绕线工艺上都有限制,造成功率输出有限,音质不佳;另一方面,声腔结构的设计也受到智能终端的限制,造成了音质效果较差。另外,为了更方便的搜索到喜欢的音视频,一般会通过文字搜索或语音搜索,当采用语音搜索时,采集到的语音经常会有损失,识别的出错率较高,影响用户体验。
技术实现思路
本专利技术主要解决的技术问题是提供一种多媒体文件的获取及播放方法以及装置,提升语音识别的准确率,同时可改善多媒体文件的输出效果,提高用户体验。为解决上述技术问题,本专利技术采用的第一个技术方案是:提供一种多媒体文件的获取及播放方法,所述多媒体文件的获取及播放方法包括:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行处理,并将处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件。为解决上述技术问题,本专利技术采用的第二个技术方案是:提供一种智能终端,所述智能终端包括存储器、处理器以及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本专利技术任一所述多媒体文件的获取以及播放方法中的步骤。为解决上述技术问题,本专利技术采用的第三个技术方案是:提供一种具有存储功能的装置,其上存储有程序数据,所述程序能够被执行实现本专利技术任一所述多媒体文件的获取以及播放方法中的步骤。本专利技术的有益效果是:本专利技术基于人工智能和音效处理技术,从云端搜索下载符合语音信号指令的多媒体文件,并对多媒体文件进行相应的音效算法处理,改善多媒体文件的输出效果。同时,可对语音信号指令进行音效算法处理,使采集到的语音信号指令更完整清晰、易于识别,提升语音识别的准确率,提高用户体验。附图说明图1是本专利技术多媒体文件的获取及播放方法一实施方式的流程示意图;图2是本专利技术智能终端一实施方式的结构示意图;图3是本专利技术具有存储功能的装置一实施方式的结构示意图。具体实施方式专利技术提供一种多媒体文件的获取及播放方法和装置,为使本专利技术的目的、技术方案和技术效果更加明确、清楚,以下对本专利技术进一步详细说明,应当理解此处所描述的具体实施条例仅用于解释本专利技术,并不用于限定本专利技术。参阅图1,图1是本专利技术多媒体文件的获取及播放方法一实施方式的流程示意图。本实施方式的多媒体文件的获取及播放方法包括:101:接收用户触发指令,响应触发指令并采集用户的语音信号指令。在一个具体的实施方式中,智能终端接收到用户的触发指令之后,判断确定当前网络是否设置成功,如果当前网络设置成功,则根据用户的触发指令对通信通道和对应的设备参数进行配置,响应触发指令并采集用户的语音信号指令。其中,智能终端包括智能手机、平板电脑以及其他智能设备,比如智能音箱,在此不做限定。其中,触发指令为用户通过特定方式发出的操作指令,包括通过交互动作,如特定的物理按键或虚拟按键,触控输入或界面输入发出操作指令。为了清楚说明本实施方式,在此以长按智能终端的虚拟Home键触发AI(ArtificialIntelligence)功能为例解释说明。在本实施方式中,当智能终端接收到用户启动AI功能的操作指令之后,判断确定当前网络是否可用,如判断确定智能终端的wifi网络或无线数据网络是否可用,如果当前网络可用,则通过特定的总线发送相应的命令,如通过I2C总线发送命令给智能终端的DSP(DigitalSignalProcessing,数字处理器)进行通信通道配置以及硬件的初始化配置,并通过audio服务启动录音线程。如果当前网络不可用,则提醒用户当前网络不可用并提示用户设置网络,如弹出对话框提醒用户或语音提醒用户。进一步地,网络配置成功之后,智能终端响应AI功能,开始采集用户的语音信号指令,比如通过麦克风采集用户的语音信号指令。为了达到更好的录音效果,可以多次采集用户的同一语音信号指令。102:按照设定参数对语音信号指令进行配置。在一个具体的实施方式中,智能终端按照设定的参数对采集到的语音信号指令进行配置。其中,设定的参数为对语音信号处理时所设定的参数信息,如信号的格式、信号的频率等。具体地,采集到的语音信号是模拟信号,需要经过抽样、量化、编码转换为数字信号。如通过PCM(PulseCodeModulation,脉冲编码调制)对语音信号指令进行处理。即可以通过ADC模数转换处理采集到的语音信号指令,实现模拟信号的数字化。103:将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。在一个具体的实施方式中,将配置后的语音信号指令按照设定格式进行处理,并将处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。通常,语音信号指令的频宽一般在1Khz~8Khz之间,在采集语音信号和模数转换语音信号的过程中,相对于原始的语音信号来讲会有信号损失和音质损耗情况的发生。为了使语音信号更完整真实、识别率更高,根据语音信号的特点进行相应的修复。在其中的一个实施方式中,对语音信号指令进行频带拓宽处理,比如将语音信号的带宽从8Khz修复成16KHz,从而可以弥补损失的语音信号。可选地,也可以对语音信号指令进行混音处理。在本实施方式中,将处理之后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与其相匹配的多媒体文件。其中,多媒体文件包括音乐文件、视频文件。比如,语音信号指令包含歌名或一段歌词或歌手的名字,则云端服务器解析此语音信号指令,根据语音信号指令中的歌名或一段歌词或歌手的名字获取与此语音文件信号指令相匹配的多媒体文件。104:接收多媒体文件,通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。在一个具体的实施方式中,智能终端接收由云端服务器反馈的多媒体文件。具体地,智能终端判断确定当前网络是否可用,如智能终端的wifi网络或无线数据网络是否可用,如果当前网络可用,则通过特定的总线发送相应的命令,如通过I2C总线发送命令给智能终端的DSP(DigitalSignalProcessing,数字处理器)进行通信通道配置以及硬件的初始化配置,并通过audio服务启动播放线程。如本文档来自技高网...
多媒体文件的获取及播放方法以及装置

【技术保护点】
一种多媒体文件的获取及播放方法,其特征在于,所述多媒体文件的获取及播放方法包括:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件。

【技术特征摘要】
1.一种多媒体文件的获取及播放方法,其特征在于,所述多媒体文件的获取及播放方法包括:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件。2.根据权利要求1所述的多媒体文件的获取及播放方法,其特征在于,所述接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括:接收所述多媒体文件,对所述多媒体文件进行解析;从解析得到的特征信息中获取与所述多媒体文件相匹配的音效参数,根据所述音效参数确定与所述多媒体文件对应的音效算法;通过所述与所述多媒体文件对应的音效算法对所述多媒体文件进行音效处理。3.根据权利要求2所述的多媒体文件的获取及播放方法,其特征在于,所述音效参数包括所述多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。4.根据权利要求1所述的多媒体文件的获取及播放方法,其特征在于,所述将配置后的语音信号按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件的步骤具体包括:将配置后的语音信号指令进行频带拓宽处理;并将频带拓宽后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与...

【专利技术属性】
技术研发人员:陈琼
申请(专利权)人:捷开通讯深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1