一种媒体文件处理方法、服务器及移动终端技术

技术编号:18240937 阅读:144 留言:0更新日期:2018-06-17 05:57
本发明专利技术提供了一种媒体文件处理方法、服务器及移动终端,涉及移动通信技术领域,所述方法应用于服务器,所述方法包括:获取待处理的媒体文件;按照所述媒体文件的声纹信息,对所述媒体文件进行分轨,得到多个音轨文件,每个所述音轨文件对应至少一种声纹。本发明专利技术通过对媒体文件进行分轨,得到多个音轨文件,便于移动终端对音轨文件进行处理,从而满足用户在播放媒体文件时的个性化需求,且操作便捷,易于使用。 1

A media file processing method, server and mobile terminal

The invention provides a media file processing method, a server and a mobile terminal, which involves the field of mobile communication technology, and the method is applied to a server. The method includes obtaining a media file to be processed, dividing the rails of the media file according to the sound print information of the media file, and obtaining a number of audio tracks. Each sound track file corresponds to at least one voiceprint. By dividing the media files into track files, the invention can get multiple audio track files to facilitate the mobile terminal to handle the sound track file, thus satisfying the personalized demand of the users when playing the media files, and the operation is convenient and easy to use. One

【技术实现步骤摘要】
一种媒体文件处理方法、服务器及移动终端
本专利技术实施例涉及移动通信
,尤其涉及一种媒体文件处理方法、服务器及移动终端。
技术介绍
随着移动通信技术的迅速发展,以智能手机为首的移动终端已成为人们生活中各方面不可或缺的工具,移动终端的各种的功能也逐渐完善,特别是拍摄功能。当前,利用手机拍摄成为不少用户的最佳选择,比如在参见会议过程中,不再需要用纸笔记录,可以用照片、录音等形式记录下会议内容,方便回看整理;或者出去游玩也可以用照片、视频记录下来,以供日后回忆。并且由于网络社交媒体的发达,进一步促进了用户的拍摄行为,分享、互相点赞使得照片、录音、短视频等媒体文件在互联网上广泛传播。目前,利用移动终端拍摄媒体文件时,存在声音效果较差的问题。为了解决该问题,现有技术通过专用软件对视频的声音进行编辑,或者通过多麦收音等方式获得多音轨,专业性较强,操作较为复杂,且无法满足用户播放媒体文件时的个性化需求。
技术实现思路
本专利技术提供了一种媒体文件处理方法、服务器及移动终端,其目的是为了解决现有技术操作较为复杂,且无法满足用户播放媒体文件时的个性化需求的问题。为了解决上述技术问题,本专利技术是这样实现的:一种媒体文件处理方法,所述方法应用于服务器,所述方法包括:获取待处理的媒体文件;按照所述媒体文件的声纹信息,对所述媒体文件进行分轨,得到多个音轨文件,每个所述音轨文件对应至少一种声纹。第一方面,本专利技术的实施例还提供了一种媒体文件处理方法,应用于移动终端,所述方法包括:接收服务器发送的多个音轨文件,所述多个音轨文件是由同一个媒体文件分轨得到的,每个所述音轨文件对应至少一种声纹;对至少一个所述音轨文件进行处理。第二方面,本专利技术的实施例还提供了一种服务器,所述服务器包括:第一获取模块,用于获取待处理的媒体文件;分轨模块,用于按照所述媒体文件的声纹信息,对所述媒体文件进行分轨,得到多个音轨文件,每个所述音轨文件对应至少一种声纹。第三方面,本专利技术的实施例还提供了一种移动终端,其特征在于,所述移动终端包括:接收模块,用于接收服务器发送的多个音轨文件,所述多个音轨文件是由同一个媒体文件分轨得到的,每个所述音轨文件对应至少一种声纹;处理模块,用于对至少一个所述音轨文件进行处理。第四方面,本专利技术的实施例还提供了一种移动终端,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述媒体文件处理方法中的步骤。第五方面,本专利技术的实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述媒体文件处理方法中的步骤。在本专利技术的实施例中,通过对媒体文件进行分轨,得到多个音轨文件,便于移动终端对音轨文件进行处理,从而满足用户在播放媒体文件时的个性化需求,且操作便捷,易于使用。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1表示本专利技术实施例提供的媒体文件处理方法的流程图之一;图2表示本专利技术实施例的具体示例的场景示意图;图3表示本专利技术实施例提供的服务器的框图之一;图4表示本专利技术实施例提供的服务器的框图之二;图5表示本专利技术实施例提供的媒体文件处理方法的流程图之二;图6表示本专利技术的实施例提供的移动终端的框图之一;图7表示本专利技术的实施例提供的移动终端的框图之二。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本专利技术的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。在本专利技术的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本专利技术实施例的实施过程构成任何限定。参见图1,本专利技术实施例提供了一种媒体文件处理方法,应用于服务器,所述方法包括:步骤101,获取待处理的媒体文件。其中,待处理的媒体文件可以是视频文件或音频文件,比如在视频文件中,移动终端可将视频文件上传至服务器,服务器从视频文件中提取出音频文件;若媒体文件本身是音频文件,则直接获取该媒体文件即可。步骤102,按照所述媒体文件的声纹信息,对所述媒体文件进行分轨,得到多个音轨文件,每个所述音轨文件对应至少一种声纹。其中,服务器接收到媒体文件之后,提取媒体文件中的声纹信息,进行声纹识别。具体地,声纹识别是一中提取声音特征和以及声音内容信息,自动核验说话人身份的技术。由于人的语音声学存在相对稳定性,通常可区别不同的人声,即使在嘈杂的环境中,也可较为精准的识别声纹。服务器提取出媒体文件中的一种或多种声纹,依据不同声纹对媒体文件进行分轨处理,处理后的媒体文件中包括多个音轨文件,每个所述音轨文件仅包括一种声纹,这样就将媒体文件的音频部分分成了多个独立的音轨文件,将处理后的媒体文件发送至移动终端之后,移动终端可根据需要提取所需的声纹的音轨文件,比如在播放视频时,过滤环境的杂音,仅播放特定的人的声音。在本专利技术的实施例中,通过对媒体文件进行分轨,得到多个音轨文件,便于移动终端对音轨文件进行处理,从而满足用户在播放媒体文件时的个性化需求,且操作便捷,易于使用。优选地,本专利技术的一具体实施例中,步骤102包括:步骤1021,提取所述媒体文件中的声纹数据;步骤1022,将每个所述声纹数据的文件,从所述媒体文件中分离,得到多个音轨文件。该实施例中,接收到媒体文件之后,通过声纹识别提取不同的声纹,并将不同声纹的数据从媒体文件中分离,得到每个声纹数据的音轨文件。本专利技术的一具体实施例中,优选地,步骤1021之后,还包括:步骤1023,为每个所述声纹数据添加标签。该实施例中,在分离出音轨文件之后,为每个音轨文件添加标签,以在反馈至移动终端时,将标签反馈至移动终端,使得移动终端的用户获知不同的声纹。本专利技术的一具体实施例中,优选地,步骤1023包括:步骤10231,将每个所述声纹数据与预先存储的声纹样本进行匹配;步骤10232,若匹配成功,为所述声纹数据添加与相匹配的声纹样本对应的标签;否则,为所述声纹数据添加表示匹配失败的预设标签。该实施例中,服务器端设置有数据库,数据库中包括多种声纹样本,便于为各类声纹数据设置标签;具体地,数据中主要包括两种类型的声纹样本:通用型和定制型;通用型样本包含自然界和现实中已公开的音频,如各种乐器,动物,环境音等,无需再进行二级标签识别。定制型数据包含用户自行上传且已定义标签的音频,或根据通话、录音、视频等数据中提取手机联系人的声纹样本等。服务器将每个所述声纹数据与预先存储的声纹样本进行匹配,并为匹配成功本文档来自技高网...
一种媒体文件处理方法、服务器及移动终端

【技术保护点】
1.一种媒体文件处理方法,应用于服务器,其特征在于,所述方法包括:

【技术特征摘要】
1.一种媒体文件处理方法,应用于服务器,其特征在于,所述方法包括:获取待处理的媒体文件;按照所述媒体文件的声纹信息,对所述媒体文件进行分轨,得到多个音轨文件,每个所述音轨文件对应至少一种声纹。2.根据权利要求1所述的方法,其特征在于,所述按照所述媒体文件的声纹信息,对所述媒体文件进行分轨,得到多个音轨文件的步骤,包括:提取所述媒体文件中的声纹数据;将每个所述声纹数据的文件,从所述媒体文件中分离,得到多个音轨文件。3.根据权利要求2所述的方法,其特征在于,所述提取所述媒体文件中的声纹数据的步骤之后,还包括:为每个所述声纹数据添加标签;包括:将每个所述声纹数据与预先存储的声纹样本进行匹配;若匹配成功,为所述声纹数据添加与相匹配的声纹样本对应的标签;否则,为所述声纹数据添加表示匹配失败的预设标签。4.根据权利要求2所述的方法,其特征在于,所述得到多个音轨文件的步骤之后,还包括:分别对所述音轨文件进行降噪处理和/或音量均衡处理。5.根据权利要求1所述的方法,其特征在于,包括:接收移动终端上传的包括未识别的声纹的文件,以及所述未识别的声纹的标签;提取所述未识别的声纹,作为声纹样本;将所述声纹样本与所上传的标签进行关联存储。6.根据权利要求1所述的方法,其特征在于,所述得到多个音轨文件的步骤之后,还包括:将所述音轨文件发送给移动终端。7.一种媒体文件处理方法,应用于移动终端,其特征在于,所述方法包括:接收服务器发送的多个音轨文件,所述多个音轨文件是由同一个媒体文件分轨得到的,每个所述音轨文件对应至少一种声纹;对至少一个所述音轨文件进行处理。8.根据权利要求7所述的方法,其特征在于,所述媒体...

【专利技术属性】
技术研发人员:李琳陈增
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1