音频文件的推送方法及装置制造方法及图纸

技术编号：15763048 阅读：140 留言：0更新日期：2017-07-05 23:49

本发明专利技术公开了一种音频文件的推送方法及装置。其中，该方法包括：获取第一客户端采集到的第一清唱音频数据，其中，第一清唱音频数据包括多帧第一音频数据；根据多帧第一音频数据中每一帧第一音频数据上用于表示音高的基频数据获取用于表示第一清唱音频数据的音域的第一音频向量；根据第一音频向量从存储的音频文件集合中查找目标音频文件，其中，目标音频文件的第二音频向量与第一音频向量相匹配；将查找到的目标音频文件推送给第一客户端。本发明专利技术解决了现有的音频文件推送方式所存在的推送准确性较低的技术问题。

Method and device for pushing audio file

The invention discloses a method and a device for pushing audio files. Among them, the method includes: obtaining the first oratorio audio data collected by the client, the first, the first a cappella audio data including multi frame first audio data; according to the multi frame first audio data in each frame of the first audio data for data acquisition is used to represent fundamental pitch of said first audio vector first acappella audio data range; according to the first audio vector search from audio files stored in the collection target audio files, including audio and audio first second vector vector of target audio file matching; to search the target audio file to the first client. The invention solves the technical problems of low push accuracy existing in the existing audio file push mode.

全部详细技术资料下载

【技术实现步骤摘要】
音频文件的推送方法及装置
本专利技术涉及计算机领域，具体而言，涉及一种音频文件的推送方法及装置。
技术介绍
相比于在KTV唱歌的传统方式，在线K歌的方式不仅所需成本较低，而且还可以满足用户实时K歌的需求，因而，这种在线K歌的方式受到越来越多的用户关注。然而，用户在面对在线曲库中的海量歌曲时，往往不知道该选择哪首歌曲进行演唱。目前，在线K歌中的歌曲均是通过歌曲推送系统进行推送的，常用的方式是将主要的算法集中在如何找到用户喜欢唱的歌曲，例如，按照搜索量或点播量为用户推送较受欢迎的歌曲，但这些歌曲却并不一定适合用户演唱。比如某用户不擅长高音，但系统却推送一个对高音要求很高的歌曲给该用户，即使该用户很喜欢这首歌曲，但该用户却并不适合演唱这首歌曲。也就是说，由于采用现有技术中的推送方式所推送的歌曲准确性较低将造成所推送的歌曲并不适合用户演唱的问题。针对上述的问题，目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种音频文件的推送方法及装置，以至少解决现有的音频文件推送方式所存在的推送准确性较低的技术问题。根据本专利技术实施例的一个方面，提供了一种音频文件的推送...

【技术保护点】
一种音频文件的推送方法，其特征在于，包括：获取第一客户端采集到的第一清唱音频数据，其中，所述第一清唱音频数据包括多帧第一音频数据；根据所述多帧第一音频数据中每一帧第一音频数据上用于表示音高的基频数据获取用于表示所述第一清唱音频数据的音域的第一音频向量；根据所述第一音频向量从存储的音频文件集合中查找目标音频文件，其中，所述目标音频文件的第二音频向量与所述第一音频向量相匹配；将查找到的所述目标音频文件推送给所述第一客户端。

【技术特征摘要】
1.一种音频文件的推送方法，其特征在于，包括：获取第一客户端采集到的第一清唱音频数据，其中，所述第一清唱音频数据包括多帧第一音频数据；根据所述多帧第一音频数据中每一帧第一音频数据上用于表示音高的基频数据获取用于表示所述第一清唱音频数据的音域的第一音频向量；根据所述第一音频向量从存储的音频文件集合中查找目标音频文件，其中，所述目标音频文件的第二音频向量与所述第一音频向量相匹配；将查找到的所述目标音频文件推送给所述第一客户端。2.根据权利要求1所述的方法，其特征在于，所述多帧第一音频数据为M帧第一音频数据，所述每一帧第一音频数据包括一个所述基频数据，其中，根据所述多帧第一音频数据中每一帧第一音频数据上用于表示音高的基频数据获取用于表示所述第一清唱音频数据的音域的第一音频向量包括：将预定的基频段划分成N个连续的子段；获取每个所述子段中包含的所述多帧第一音频数据的基频数据的数量{X1，X2…XN}，其中，Xi表示第i个子段中包含的所述多帧第一音频数据的基频数据的数量，1≤i≤N，X1+X2+…XN＝M；将所述第一音频向量{x1,x2,...,xN}设置为{X1/M，X2/M…XN/M}。3.根据权利要求2所述的方法，其特征在于，在所述将预定的基频段划分成N个连续的子段之前，还包括：每隔预定帧移从所述第一清唱音频数据中获取帧长相同的所述多帧第一音频数据，其中，所述预定帧移表示相邻两帧所述第一音频数据的起始位置的间隔；在所述多帧第一音频数据中每一帧第一音频数据对应的频谱上提取最大值作为所述用于表示音高的基频数据。4.根据权利要求3所述的方法，其特征在于，所述预定帧移小于所述帧长。5.根据权利要求1所述的方法，其特征在于，在获取第一客户端采集到的清唱音频数据之前，还包括：获取所述音频文件集合中每一个音频文件对应的Q个第二清唱音频数据，并将每一个音频文件作为当前音频文件分别执行以下步骤：每隔预定帧移从所述当前音频文件对应的每一个第二清唱音频数据中获取帧长相同的多帧第二音频数据，其中，所述预定帧移表示相邻两帧所述第二音频数据的起始位置的间隔，所述多帧第二音频数据为P帧第二音频数据；获取所述每一个第二清唱音频数据中每一帧第二音频数据上一个用于表示音高的基频数据；依次令j＝1,2,…,P，分别对每帧执行以下操作，以得到P个基频数据，其中，每帧对应一个基频数据：从Q个第二清唱音频数据中的第j帧第二音频数据的基频数据中选择一个基频数据作为第j帧对应的基频数据；将预定的基频段划分成N个连续的子段；获取每个所述子段中包含的所述P个基频数据中的基频数据的数量{Y1，Y2…YN}，其中，Yi表示第j个子段中包含的所述P个基频数据中的基频数据的数量，1≤j≤N，Y1+Y2+…YN＝P；将所述当前音频文件的第二音频向量{y1,y2,...,yN}设置为{Y1/P，Y2/P…YN/P}。6.根据权利要求5所述的方法，其特征在于，获取所述每一个第二清唱音频数据中每一帧第二音频数据上一个用于表示音高的基频数据包括：在每一帧所述第二音频数据对应的频谱上提取最大值作为所述用于表示音高的基频数据；依次令j＝1,2,…,P，分别对每帧执行以下操作，以得到P个基频数据包括：根据所述每一个第二清唱音频数据中每一帧第二音频数据上用于表示音高的基频数据，从所述当前音频文件对应的所述Q个第二清唱音频数据中选择非0值的基频数据的个数靠前的R个第二清唱音频数据；依次令j＝1,2,…,P，分别对每帧执行以下操作，以得到P个基频数据，其中，每帧对应一个基频数据：从所述R个第二清唱音频数据中的第j帧第二音频数据的基频数据中选择取值为中间值的一个基频数据作为所述第j帧对应的基频数据。7.根据权利要求1所述的方法，其特征在于，根据所述清唱音频数据的所述音频向量从存储的音频文件集合中查找目标音频文件包括：在所述音频文件集合中查找所述第二音频向量与所述第一音频向量距离小于预定阈值的音频文件作为所述目标音频文件。8.根据权利要求1所述的方法，其特征在于，所述将查找到的所述目标音频文件推送给所述第一客户端包括：获取...

【专利技术属性】
技术研发人员：傅鸿城，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人