基于HLS流的字幕显示方法及装置制造方法及图纸

技术编号:35844794 阅读:21 留言:0更新日期:2022-12-07 10:24
本发明专利技术实施例提供了一种基于HLS流的字幕显示方法及装置,该方法包括:将DASH媒体流转码为HLS流,并将所述DASH媒体流中的字幕流转码为图片编码格式的字幕文件;通过播放器下载并播放所述HLS流中的视频和音频文件;通过字幕解析器下载并解析所述字幕文件以获取字幕显示信息;通过所述字幕解析器获取所述播放器的当前播放时间,并根据所述字幕显示信息选取对应的字幕并进行同步显示。在本发明专利技术中,通过将DASH媒体流中的字幕流转码为图片字幕编码格式的字幕文件,通过字幕解析器下载并解析所述字幕文件,并进行同步显示,从而解决了IOS终端不支持DASH流的图片字幕显示的问题。端不支持DASH流的图片字幕显示的问题。端不支持DASH流的图片字幕显示的问题。

【技术实现步骤摘要】
基于HLS流的字幕显示方法及装置


[0001]本专利技术实施例涉及多媒体领域,具体而言,涉及一种基于HLS(HTTP Live Streaming)流的字幕显示方法及装置。

技术介绍

[0002]现今多媒体直播业务是音视频领域的重要应用,而多媒体直播协议主要采用DASH(Dynamic Adaptive Streaming over HTTP)、HLS(HTTP Live Streaming)和MSS(Microsoft Smoothing Streaming)等,其中MEPG

DASH标准是MEPG(Moving Picture Experts Group)为了对业界存在的多种自适应流技术进行规范而推出的基于HTTP(Hypertext Transfer Protocol)的动态自适应流协议,支持DRM(Digital Right Management)、HTTP传递、低延迟流以及许多其他功能,HLS是由苹果公司实现的基于HTTP的流媒体通信协议。作为直播标准的DASH协议应用广泛,很多终端播放器都对其进行了兼容,但是对于IOS终端(包括但不限于iphone、ipad、appleTV等)的原生播放器,主要兼容HLS格式与常见视频文件封装格式。
[0003]同时,很多播放器可兼容的字幕格式有限,主要包含常见的文本字幕格式,但是不支持内容更丰富的图片字幕,大大降低了用户的体验感与终端功能场景的完整性。常见的图片格式字幕包括DVB

subtitle,smpte
‑<br/>tt等格式。
[0004]对于常见的直播/点播频道,媒体服务器主要是采用DASH协议,若包含字幕信息,通常是基于DVB

subtitle标准的图形字幕,且无法同时提供文字字幕。而IOS终端原生播放器不支持DASH协议的媒体播放,且不支持DVB

subtitle图形字幕的解析显示。

技术实现思路

[0005]本专利技术实施例提供了一种基于HLS流的字幕显示方法及装置,以至少解决相关技术中IOS终端不支持DASH流的图片字幕显示的问题。
[0006]根据本专利技术的一个实施例,提供了一种基于HLS流的字幕显示方法,包括:将DASH媒体流转码为HLS流,并将所述DASH媒体流中的字幕流转码为图片编码格式的字幕文件;通过播放器下载并播放所述HLS流中的视频和音频文件;通过字幕解析器下载并解析所述字幕文件以获取字幕显示信息;通过所述字幕解析器获取所述播放器的当前播放时间,并根据所述字幕显示信息选取对应的字幕并进行同步显示。
[0007]在一个示例性实施例中,将DASH媒体流转码为HLS流,并将所述DASH媒体流中的字幕流转码为图片编码格式的字幕文件,包括:将所述DASH媒体流按照HLS协议进行切片和转码封装,其中,视频流和音频流转码为按照原编码格式的媒体文件,字幕流转码为图片字幕编码格式的字幕文件,并修改索引文件。
[0008]在一个示例性实施例中,所述索引文件包括主索引文件和子索引文件,其中,所述子索引文件包括视频索引文件、音频索引文件和字幕索引文件;修改索引文件包括:自定义扩展字段用于标识字幕信息。
[0009]在一个示例性实施例中,所述字幕显示信息至少包括以下之一:字幕的显示时间、显示图片内容、显示样式、显示位置尺寸、显示图片编码格式。
[0010]在一个示例性实施例中,通过播放器下载并播放所述HLS流中的视频和音频文件包括:通过所述播放器下载所述索引文件,根据所述索引文件对各媒体分片进行下载和解析;通过所述播放器对下载解析后的视频和音频文件进行解码和播放。
[0011]在一个示例性实施例中,通过字幕解析器下载并解析所述字幕文件以获取字幕显示信息包括:通过字幕解析器下载所述索引文件,并根据所述索引文件对字幕分片进行下载;对下载后的所述字幕文件进行解封装,并获取解码基准时间与字幕信息;对字幕信息按照对应的图片编码格式进行解码,获取所述字幕显示信息。
[0012]在一个示例性实施例中,根据所述字幕显示信息选取对应的字幕并进行同步显示之后,还包括:通过所述字幕解析器定时更新子索引文件。
[0013]在一个示例性实施例中,所述DASH媒体流中包含多个字幕流,根据所述字幕显示信息选取对应的字幕并进行同步显示之后,还包括:判断是否需要从当前的第一字幕流切换至第二字幕流,如果是,则将缓冲区中的所述第一字幕流的字幕信息清空;按照主索引文件中解析的第二字幕流信息更新第二字幕流的子索引文件;通过所述字幕解析器下载并解码所述第二字幕流的分片,并根据所述播放器的当前播放时间,同步显示所述第二字幕流对应的字幕。
[0014]根据本专利技术的另一个实施例,提供了一种基于HLS流的字幕显示装置,包括:转码模块,用于将DASH媒体流转码为HLS流,并将所述DASH媒体流中的字幕流转码为图片编码格式的字幕文件;播放器,用于下载并播放所述HLS流中的视频和音频文件;字幕解析器,用于下载并解析所述字幕文件以获取字幕显示信息,获取所述播放器的当前播放时间,并根据所述字幕显示信息选取对应的字幕并进行同步显示。
[0015]在一个示例性实施例中,所述转码模块,还用于将所述DASH媒体流按照HLS协议进行切片和转码封装,其中,视频流和音频流转码为按照原编码格式的媒体文件,字幕流转码为图片字幕编码格式的字幕文件,并修改索引文件。
[0016]在一个示例性实施例中,所述字幕显示信息至少包括以下之一:字幕的显示时间、显示图片内容、显示样式、显示位置尺寸、显示图片编码格式。
[0017]在一个示例性实施例中,所述播放器,还用于下载所述索引文件,根据所述索引文件对各媒体分片进行下载和解析,并对下载解析后的视频和音频文件进行解码和播放。
[0018]在一个示例性实施例中,所述字幕解析器包括:下载模块,用于下载所述索引文件,并根据所述索引文件对字幕分片进行下载;解析模块,用于对下载后的所述字幕文件进行解封装,并获取解码基准时间与字幕信息;解码模块,用于对字幕信息按照对应的图片编码格式进行解码,获取所述字幕显示信息;同步模块,用于获取所述播放器的当前播放时间;显示模块,用于根据所述字幕显示信息选取对应的字幕并进行同步显示。
[0019]在一个示例性实施例中,所述转码模块位于服务器侧,所述播放器和字幕解析器位于终端侧。
[0020]根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0021]根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0022]在本专利技术的上述实施例中,通过将DASH媒体流中的字幕流转码为图片字幕编码格式的字幕文件,通过字幕解析器下载并解析所述字幕文件,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于HLS流的字幕显示方法,其特征在于,包括:将DASH媒体流转码为HLS流,并将所述DASH媒体流中的字幕流转码为图片编码格式的字幕文件;通过播放器下载并播放所述HLS流中的视频和音频文件;通过字幕解析器下载并解析所述字幕文件以获取字幕显示信息;通过所述字幕解析器获取所述播放器的当前播放时间,并根据所述字幕显示信息选取对应的字幕并进行同步显示。2.根据权利要求1所述的方法,其特征在于,将DASH媒体流转码为HLS流,并将所述DASH媒体流中的字幕流转码为图片编码格式的字幕文件,包括:将所述DASH媒体流按照HLS协议进行切片和转码封装,其中,视频流和音频流转码为按照原编码格式的媒体文件,字幕流转码为图片字幕编码格式的字幕文件,并修改索引文件。3.根据权利要求1所述的方法,其特征在于,所述索引文件包括主索引文件和子索引文件,其中,所述子索引文件包括视频索引文件、音频索引文件和字幕索引文件;修改索引文件包括:自定义扩展字段用于标识字幕信息。4.根据权利要求1所述的方法,其特征在于,其中,所述字幕显示信息至少包括以下之一:字幕的显示时间、显示图片内容、显示样式、显示位置尺寸、显示图片编码格式。5.根据权利要求1所述的方法,其特征在于,其中,通过播放器下载并播放所述HLS流中的视频和音频文件包括:通过所述播放器下载所述索引文件,根据所述索引文件对各媒体分片进行下载和解析;通过所述播放器对下载解析后的视频和音频文件进行解码和播放。6.根据权利要求1所述的方法,其特征在于,其中,通过字幕解析器下载并解析所述字幕文件以获取字幕显示信息包括:通过字幕解析器下载所述索引文件,并根据所述索引文件对字幕分片进行下载;对下载后的所述字幕文件进行解封装,并获取解码基准时间与字幕信息;对字幕信息按照对应的图片编码格式进行解码,获取所述字幕显示信息。7.根据权利要求2所述的方法,其特征在于,根据所述字幕显示信息选取对应的字幕并进行同步显示之后,还包括:通过所述字幕解析器定时更新子索引文件。8.根据权利要求2所述的方法,其特征在于,其中,所述DASH媒体流中包含多个字幕流,根据所述字幕显示信息选取对应的字幕并进行同步显示之后,还包括:判断是否需要从当前的第一字幕流切换至第二字幕流,如果是,则将缓冲区中的所述第一字幕流的字幕信息清空;按照主索引文...

【专利技术属性】
技术研发人员:江平洪冲朱兴昌
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1