【技术实现步骤摘要】
本申请涉及信息处理
,尤其涉及一种字幕文件处理方法及装置。
技术介绍
为了满足用户的视频播放需求,在播放视频文件的同时,加载相应的字幕文件进行同步展示。通常,字幕文件分为硬字幕和软字幕,其中,硬字幕也称为内嵌字幕,把字幕文件和视频流压制在同一组数据里,无法分离,其缺点是修正难度大,一旦出错必须重新制作整个视频文件,限制了用户对字体风格个人喜好的修改。软字幕也称外挂字幕,把字幕文件单独保存,只需与视频文件名相同,在播放时自动调用。目前,用户在搜索软字幕文件时,对用户输入的关键字进行简单的匹配,导致搜索到的某些字幕文件不准确,用户需要重复搜索才能找到合适的字幕文件,降低了用户终端的资源利用率。此外,搜索到的合适的字幕文件数量有限,无法提供不同格式、不同语种的字幕文件供用户选择,不能充分满足用户对字幕文件的不同需求,影响了用户的视频播放体验。
技术实现思路
本专利技术提供了一种字幕文件处理方法及装置,能够提高字幕文件搜索的准确性以及中央处理器(CPU)的利用率。本专利技术的技术方案是这样实现的:本专利技术提供了一种字幕文件处理方法,应用于搜索服务器,包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端,字 ...
【技术保护点】
一种字幕文件处理方法,其特征在于,应用于搜索服务器,所述方法包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于所述搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的所述相关性;根据所述相关性对所述查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给所述搜索客户端,所述字幕文件列表中列出了排序后的所述查找到的各资源包中的各字幕文件;当从所述搜索客户端接收到针对所述字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给所述搜索客户端。
【技术特征摘要】
1.一种字幕文件处理方法,其特征在于,应用于搜索服务器,所述方法包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于所述搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的所述相关性;根据所述相关性对所述查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给所述搜索客户端,所述字幕文件列表中列出了排序后的所述查找到的各资源包中的各字幕文件;当从所述搜索客户端接收到针对所述字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给所述搜索客户端。2.根据权利要求1所述的方法,其中,所述从视频服务器获取各视频文件的资源包包括:针对每一视频文件,执行如下处理:搜索一个或多个视频服务器,从各视频服务器获取和该视频文件相关的网页和各字幕文件的下载地址;针对每一视频服务器,从该视频服务器获取到的所述网页中抓取对应该视频文件的内容描述信息;访问所述下载地址,并下载得到各字幕文件;生成该视频文件的一个资源包,该资源包包括:抓取到的所述内容描述信息和下载到的所述各字幕文件。3.根据权利要求1所述的方法,其中,所述通过将自身配置的该视频文件的关键词和该资源包中的所述内容描述信息进行匹配,确定该资源包中各字幕文件的相关性包括:通过将该视频文件的各关键词和所述内容描述信息分别进行匹配,计算得到匹配度;根据所述匹配度确定该资源包中各字幕文件的相关性。4.根据权利要求3所述的方法,其中,所述匹配度为各关键词在所述内容描述信
\t息中出现的次数之和;所述根据所述匹配度确定该资源包中各字幕文件的相关性包括:将所述匹配度作为该资源包中各字幕文件的相关性的数值;或者,预设多个相关性级别,通过将所述匹配度和一个或多个预设阈值进行比较,确定所述匹配度所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。5.根据权利要求1所述的方法,其中,所述内容描述信息包括该视频文件的简介信息、推荐信息、用户评论信息中的任一项或任意几项;所述通过将自身配置的该视频文件的关键词和该资源包中的所述内容描述信息进行匹配,确定该资源包中各字幕文件的相关性包括:为所述内容描述信息中各项内容描述信息设置优先级;通过将所述关键词和各项内容描述信息分别进行匹配,计算得到所述关键词分别与各项内容描述信息之间的匹配度;根据所述关键词与各项内容描述信息之间的匹配度以及各项内容描述信息的优先级,确定该资源包中各字幕文件的相关性。6.根据权利要求5所述的方法,其中,所述关键词与每项内容描述信息的所述匹配度为所述关键词在该项内容描述信息中出现的次数;所述根据所述关键词与各项内容描述信息之间的匹配度以及各项内容描述信息的优先级,确定该资源包中各字幕文件的相关性包括:针对每项内容描述信息,将所述关键词与该项内容描述信息之间的匹配度和该项内容描述信息的优先级对应的分值相乘,得到该项内容描述信息的相关性值,将每项内容描述信息的相关性值相加之和作为该内容描述信息的相关性值;将该内容描述信息的相关性值作为该资源包中各字幕文件的相关性的数值;或者,预设多个相关性级别,通过将该内容描述信息的相关性值和一个或多个预设阈值进行比较,确定该内容描述信息的相关性值所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。7.根据权利要求1至6中任一项所述的方法,其中,所述搜索请求包括用户输入的针对该视频文件的搜索词;所述基于所述搜索请求查找该视频文件对应的各资源包包括:将所述搜索词分为多个词语;若所述多个词语中的任一词语与自身配置的该视频文件的任一关键词相同,则将该视频文件对应的一个或多个资源包作为查找到的各资源包。8.一种字幕文件处理方法,其特征在于,应用于搜索客户端,所述方法包括:接收针对一视频文件的字幕文件的搜索请求;将所述搜索请求发送给搜索服务器,以使所述搜索服务器基于所述搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据所述相关性对所述查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,所述字幕文件列表中列出了排序后的所述查找到的各资源包中的各字幕文件;接收所述搜索服务器返回的所述字幕文件列表,从所述字幕文件列表中选择一字幕文件,向所述搜索服务器发送携带所选择的字幕文件的下载请求;及,从所述搜索服务器将所选择的字幕文件下载到本地。9.根据权利要求8所述的方法,其中,所述字幕文件列表进一步列出各字幕文件各自对应的语言和/或文件格式,以使用户根据播放该视频文件时所需的语言和/或...
【专利技术属性】
技术研发人员:杨阳,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。