字幕文件处理方法及装置制造方法及图纸

技术编号:14763255 阅读:99 留言:0更新日期:2017-03-03 17:04
本申请公开了一种字幕文件处理方法及装置。该方法应用于搜索服务器,包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,当从搜索客户端接收到针对字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给搜索客户端。利用这些技术方案,能够提高字幕文件搜索的准确性以及中央处理器(CPU)的利用率。

【技术实现步骤摘要】

本申请涉及信息处理
,尤其涉及一种字幕文件处理方法及装置
技术介绍
为了满足用户的视频播放需求,在播放视频文件的同时,加载相应的字幕文件进行同步展示。通常,字幕文件分为硬字幕和软字幕,其中,硬字幕也称为内嵌字幕,把字幕文件和视频流压制在同一组数据里,无法分离,其缺点是修正难度大,一旦出错必须重新制作整个视频文件,限制了用户对字体风格个人喜好的修改。软字幕也称外挂字幕,把字幕文件单独保存,只需与视频文件名相同,在播放时自动调用。目前,用户在搜索软字幕文件时,对用户输入的关键字进行简单的匹配,导致搜索到的某些字幕文件不准确,用户需要重复搜索才能找到合适的字幕文件,降低了用户终端的资源利用率。此外,搜索到的合适的字幕文件数量有限,无法提供不同格式、不同语种的字幕文件供用户选择,不能充分满足用户对字幕文件的不同需求,影响了用户的视频播放体验。
技术实现思路
本专利技术提供了一种字幕文件处理方法及装置,能够提高字幕文件搜索的准确性以及中央处理器(CPU)的利用率。本专利技术的技术方案是这样实现的:本专利技术提供了一种字幕文件处理方法,应用于搜索服务器,包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,当从搜索客户端接收到针对字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给搜索客户端。本专利技术还提供了一种字幕文件处理方法,应用于搜索客户端,方法包括:接收针对一视频文件的字幕文件的搜索请求;将搜索请求发送给搜索服务器,以使搜索服务器基于搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;接收搜索服务器返回的字幕文件列表,从字幕文件列表中选择一字幕文件,向搜索服务器发送携带所选择的字幕文件的下载请求;及,从搜索服务器将所选择的字幕文件下载到本地。本专利技术又提供了一种搜索服务器,包括:获取模块,用于从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;配置模块,用于针对每一视频文件,配置该视频文件的关键词;确定模块,用于针对该视频文件的每一资源包,通过将配置模块配置的该视频文件的关键词和获取模块获取的该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性;接收模块,用于从搜索客户端接收针对一视频文件的字幕文件的搜索请求,以及从搜索客户端接收针对字幕文件列表中一字幕文件的下载请求;查找模块,用于基于接收模块接收到的搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;生成模块,用于根据查找模块确定的相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,发送模块,用于将生成模块生成的字幕文件列表发送给搜索客户端,以及将接收模块接收到的下载请求中的字幕文件发送给搜索客户端。本专利技术提供了一种搜索客户端,包括接收模块、选择模块和发送模块,其中,接收模块用于接收针对一视频文件的字幕文件的搜索请求;发送模块用于将接收模块接收的搜索请求发送给搜索服务器,以使搜索服务器基于搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;接收模块用于接收搜索服务器返回的字幕文件列表;选择模块用于从接收模块接收的字幕文件列表中选择一字幕文件;发送模块用于向搜索服务器发送携带选择模块确定的字幕文件的下载请求;接收模块用于从搜索服务器将所选择的字幕文件下载到本地。根据本专利技术提供的方法,通过关键词与内容描述信息的匹配确定字幕文件的相关性,提高了搜索字幕文件的准确性,避免用户反复多次搜索,提高了电子设备中CPU的资源利用率,并且能够提供具备不同相关性的多个字幕文件供用户选择,充分满足了用户对字幕文件的不同需求,提高了用户的视频播放体验。附图说明图1为本专利技术实施例所涉及的实施环境示意图;图2为依据本专利技术一实施例的搜索服务器处理字幕文件的方法的流程示意图;图3为依据本专利技术一实施例的建立字幕文件库的示意图;图4为依据本专利技术一实施例的生成字幕文件列表的界面示意图;图5为依据本专利技术另一实施例的搜索服务器处理字幕文件的方法的流程示意图;图6为依据本专利技术一实施例的搜索客户端处理字幕文件的方法的流程示意图;图7为依据本专利技术另一实施例的搜索客户端处理字幕文件的方法的流程示意图;图8为依据本专利技术一实施例的字幕文件处理方法的交互示意图;图9为依据本专利技术一实施例的搜索服务器的结构示意图;图10为依据本专利技术另一实施例的搜索服务器的结构示意图;图11为依据本专利技术又一实施例的搜索服务器的结构示意图;图12为依据本专利技术一实施例的搜索客户端的结构示意图;图13为依据本专利技术另一实施例的搜索客户端的结构示意图;图14为依据本专利技术又一实施例的搜索客户端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例所涉及的实施环境示意图。参见图1,字幕文件处理系统100包括一个或多个视频服务器110-1…110-n、搜索服务器120、搜索客户端130和媒体播放器140。在媒体播放器140上播放一视频文件时,同步展示字幕文件。为了在媒体播放器140上展示和该视频文件对应的字幕文件,首先,搜索服务器120建立字幕文件库。针对每一视频文件,搜索一个或多个视频服务器110-1…110-n,获取各视频文件的资源包。其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件。针对每一视频文件,配置该视频文件的关键词;针对该视频文件的每一资源包,通过将自身配置的该视频文件的关键词和该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性。搜索客户端130接收用户输入的针对一视频文件的字幕文件的搜索请求,将该搜索请求发送给搜索服务器120。搜索服务器120根据接收到的搜索请求,生成该视频文件的字幕文件列表,该字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件,并将该字幕文件列表发送给搜索客户端130。搜索客户端130根据该字幕文件列表,选择一本文档来自技高网...
字幕文件处理方法及装置

【技术保护点】
一种字幕文件处理方法,其特征在于,应用于搜索服务器,所述方法包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于所述搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的所述相关性;根据所述相关性对所述查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给所述搜索客户端,所述字幕文件列表中列出了排序后的所述查找到的各资源包中的各字幕文件;当从所述搜索客户端接收到针对所述字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给所述搜索客户端。

【技术特征摘要】
1.一种字幕文件处理方法,其特征在于,应用于搜索服务器,所述方法包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于所述搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的所述相关性;根据所述相关性对所述查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给所述搜索客户端,所述字幕文件列表中列出了排序后的所述查找到的各资源包中的各字幕文件;当从所述搜索客户端接收到针对所述字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给所述搜索客户端。2.根据权利要求1所述的方法,其中,所述从视频服务器获取各视频文件的资源包包括:针对每一视频文件,执行如下处理:搜索一个或多个视频服务器,从各视频服务器获取和该视频文件相关的网页和各字幕文件的下载地址;针对每一视频服务器,从该视频服务器获取到的所述网页中抓取对应该视频文件的内容描述信息;访问所述下载地址,并下载得到各字幕文件;生成该视频文件的一个资源包,该资源包包括:抓取到的所述内容描述信息和下载到的所述各字幕文件。3.根据权利要求1所述的方法,其中,所述通过将自身配置的该视频文件的关键词和该资源包中的所述内容描述信息进行匹配,确定该资源包中各字幕文件的相关性包括:通过将该视频文件的各关键词和所述内容描述信息分别进行匹配,计算得到匹配度;根据所述匹配度确定该资源包中各字幕文件的相关性。4.根据权利要求3所述的方法,其中,所述匹配度为各关键词在所述内容描述信
\t息中出现的次数之和;所述根据所述匹配度确定该资源包中各字幕文件的相关性包括:将所述匹配度作为该资源包中各字幕文件的相关性的数值;或者,预设多个相关性级别,通过将所述匹配度和一个或多个预设阈值进行比较,确定所述匹配度所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。5.根据权利要求1所述的方法,其中,所述内容描述信息包括该视频文件的简介信息、推荐信息、用户评论信息中的任一项或任意几项;所述通过将自身配置的该视频文件的关键词和该资源包中的所述内容描述信息进行匹配,确定该资源包中各字幕文件的相关性包括:为所述内容描述信息中各项内容描述信息设置优先级;通过将所述关键词和各项内容描述信息分别进行匹配,计算得到所述关键词分别与各项内容描述信息之间的匹配度;根据所述关键词与各项内容描述信息之间的匹配度以及各项内容描述信息的优先级,确定该资源包中各字幕文件的相关性。6.根据权利要求5所述的方法,其中,所述关键词与每项内容描述信息的所述匹配度为所述关键词在该项内容描述信息中出现的次数;所述根据所述关键词与各项内容描述信息之间的匹配度以及各项内容描述信息的优先级,确定该资源包中各字幕文件的相关性包括:针对每项内容描述信息,将所述关键词与该项内容描述信息之间的匹配度和该项内容描述信息的优先级对应的分值相乘,得到该项内容描述信息的相关性值,将每项内容描述信息的相关性值相加之和作为该内容描述信息的相关性值;将该内容描述信息的相关性值作为该资源包中各字幕文件的相关性的数值;或者,预设多个相关性级别,通过将该内容描述信息的相关性值和一个或多个预设阈值进行比较,确定该内容描述信息的相关性值所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。7.根据权利要求1至6中任一项所述的方法,其中,所述搜索请求包括用户输入的针对该视频文件的搜索词;所述基于所述搜索请求查找该视频文件对应的各资源包包括:将所述搜索词分为多个词语;若所述多个词语中的任一词语与自身配置的该视频文件的任一关键词相同,则将该视频文件对应的一个或多个资源包作为查找到的各资源包。8.一种字幕文件处理方法,其特征在于,应用于搜索客户端,所述方法包括:接收针对一视频文件的字幕文件的搜索请求;将所述搜索请求发送给搜索服务器,以使所述搜索服务器基于所述搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据所述相关性对所述查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,所述字幕文件列表中列出了排序后的所述查找到的各资源包中的各字幕文件;接收所述搜索服务器返回的所述字幕文件列表,从所述字幕文件列表中选择一字幕文件,向所述搜索服务器发送携带所选择的字幕文件的下载请求;及,从所述搜索服务器将所选择的字幕文件下载到本地。9.根据权利要求8所述的方法,其中,所述字幕文件列表进一步列出各字幕文件各自对应的语言和/或文件格式,以使用户根据播放该视频文件时所需的语言和/或...

【专利技术属性】
技术研发人员:杨阳
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1