推送语音数据的方法、终端、服务器及系统技术方案

技术编号：9240049 阅读：121 留言：0更新日期：2013-10-10 03:45

本发明专利技术公开了一种推送语音数据的方法、终端、服务器及系统，属于多媒体技术领域。方法包括：每隔预设时间获取一次背景噪音数据，并提取背景噪音数据的特征向量；将背景噪音数据的特征向量上传至服务器，由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型，并向终端推送与环境类型相对应的语音数据；接收服务器推送的语音数据。本发明专利技术通过获取背景噪音数据，并提取背景噪音数据的特征向量，进而将背景噪音数据的特征向量上传至服务器，由服务器确定特征向量对应的环境类型，并向终端推送与其相对应的语音数据，因此，可实现根据外部环境为用户推送语音数据，从而满足用户不同时间及地点的聆听需求，提高了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
推送语音数据的方法、终端、服务器及系统
本专利技术涉及多媒体
，特别涉及一种推送语音数据的方法、终端、服务器及系统。
技术介绍
随着科学技术的飞速发展，越来越多具有语音数据播放功能的终端进入大众的视野。例如，MP3（MovingPictureExpertsGroupAudioLayerIII，运动图像专家组音频层3）播放器、手机及平板电脑等等。用户通过点击终端的物理按键或显示在终端屏幕上的虚拟按键可自由进行语音数据的手动选择。然而，当用户处在相对拥挤的环境或面对无屏幕显示的终端，其不愿或难以进行语音数据的手动选择时，为了提升用户体验及满足用户的聆听需求，如何自动进行语音数据推送，成为了本领域技术人员较为关注的一个问题。
技术实现思路
本专利技术实施例提供了一种推送语音数据的方法、终端、服务器及系统。所述技术方案如下：第一方面，提供了一种推送语音数据的方法，所述方法包括：每隔预设时间获取一次背景噪音数据，并提取所述背景噪音数据的特征向量；将所述背景噪音数据的特征向量上传至服务器，由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型，并向终端推送与所述环境类型相对应的语音数据；接收所述服务器推送的语音数据。较佳地，所述每隔预设时间获取一次背景噪音数据，包括：首次获取背景噪音数据时，获取一段时长为第一预设时间长度的背景噪音数据；非首次获取背景噪音数据时，每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据；其中，所述第一预设时间长度小于所述第二预设时间长度。较佳地，所述提取所述背景噪音数据的特征向量，包括：对所述背景噪音数据...
推送语音数据的方法、终端、服务器及系统

【技术保护点】
一种推送语音数据的方法，其特征在于，所述方法包括：每隔预设时间获取一次背景噪音数据，并提取所述背景噪音数据的特征向量；将所述背景噪音数据的特征向量上传至服务器，由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型，并向终端推送与所述环境类型相对应的语音数据；接收所述服务器推送的语音数据。

【技术特征摘要】
1.一种推送语音数据的方法，其特征在于，所述方法包括：每隔预设时间获取一次背景噪音数据，并对所述背景噪音数据进行解码，得到所述背景噪音数据的声音信号，提取所述声音信号的频谱特征，得到所述声音信号的特征向量；将所述背景噪音数据的特征向量上传至服务器，由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型，并向终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据，所述喜好语音数据类型由所述服务器根据所述用户收听过的历史语音数据统计得到，所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的；接收所述服务器推送的语音数据；其中，所述每隔预设时间获取一次背景噪音数据，包括：首次获取背景噪音数据时，获取一段时长为第一预设时间长度的背景噪音数据；非首次获取背景噪音数据时，每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据；其中，所述第一预设时间长度小于所述第二预设时间长度。2.根据权利要求1所述的方法，其特征在于，所述得到所述背景噪音数据的声音信号之后，所述方法还包括：对得到的所述背景噪音数据的声音信号进行频域变换；所述提取所述声音信号的频谱特征，包括：提取进行频域变换后的所述声音信号的频谱特征。3.一种推送语音数据的终端，其特征在于，所述终端包括：获取模块，用于每隔预设时间获取一次背景噪音数据；提取模块，用于提取所述获取模块获取到的背景噪音数据的特征向量；上传模块，用于将所述提取模块提取到的背景噪音数据的特征向量上传至服务器，由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型，并向终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据，所述喜好语音数据类型由所述服务器根据所述用户收听过的历史语音数据统计得到，所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的；其中，所述获取模块，包括：第一获取单元，用于在首次获取背景噪音数据时，获取一段时长为第一预设时间长度的背景噪音数据；第二获取单元，用于在非首次获取背景噪音数据时，每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据；其中，所述第一预设时间长度小于所述第二预设时间长度；所述提取模块用于对所述背景噪音数据进行解码，得到所述背景噪音数据的声音信号；提取所述声音信号的频谱特征，得到所述声音信号的特征向量。4.根据权利要求3所述的终端，其特征在于，所述终端还包括：变换模块，用于对得到的所述背景噪音数据的声音信号进行频域变换；所述提取模块用于提取进行频域变换后的所述声音信号的频谱特征。5.一种推送语音数据的方法，其特征在于，所述方法包括：接收终端上传的背景噪音数据的特征向量，所述终端在首次获取背景噪音数据时，获取一段时长为第一预设时间长度的背景噪音数据，在非首次获取背景噪音数据时，每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据，所述第一预设时间长度小于所述第二预设时间长度，所述特征向量是由所述终端在对所述背景噪音数据进行解码，得到所述背景噪音数据的声音信号后，再提取所述声音信号的频谱特征得到的；根据预先存储的特征向量与环境类型...

【专利技术属性】
技术研发人员：郭涛，蔡经伟，刘伟，
申请(专利权)人：北京小米科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人