一种自适应的视频播放方法技术

技术编号:27813673 阅读:12 留言:0更新日期:2021-03-30 09:59
本发明专利技术提供了一种自适应的视频播放方法,包括:从待播放的视频中采样,得到采样语音Z;基于采用语音Z,得到采样语音的语速V1;如果V1>V0,那么根据V0和V1确定视频播放的倍速P,V0为预设的基准语速;使用倍速P播放所述待播放的视频。本发明专利技术能够自适应的调整视频播放的倍速。速。速。

【技术实现步骤摘要】
一种自适应的视频播放方法


[0001]本专利技术涉及一种视频播放方法和系统,具体涉及一种讲解类视频的倍速播放方法和系统。

技术介绍

[0002]随着互联网的快速发展,通过视频获知相关知识成为人们提升自身能力的一个重要手段,例如,通过讲解类视频获取相关知识,例如,一个专家讲解的相关领域的知识的视频,又例如,一个老师讲解某门课程的视频,又比如,一个经验丰富的行业人员通过PPT讲解从业知识的视频等。这类讲解类视频的特点是,一般只有一个主讲人讲解,相对来说语速和视频中的内容比较固定。这种情况下,主讲人的语速和用户需要一个匹配。例如有的主讲人语速比较慢,这个时候用户就可能使用较为快速的倍速播放,比如1.25倍1.5倍的倍速进行播放。
[0003]一些情况下,用户可能需要学习多个这样的视频,例如有些岗位的新员工上岗需要学习几十节课的视频;对于这些视频内容,由每个视频的主讲人可能不一样,导致语速不一致,主讲过慢的语速会带来时间上的浪费。因此对于每一个新员工而言,都需要自适应的调整视频播放的背速。因此亟待需要一种自适应的调整这类视频播放速度的改进方案。

技术实现思路

[0004]本专利技术一方面提供一种自适应的视频播放方法,能够根据待播放视频的语速来确定对应的播放倍速,从而能够自适应的调整视频播放的倍速。本专利技术另一方面还提供一种自适应的视频播放系统。
[0005]本专利技术采用的技术方案为:
[0006]本专利技术实施例提供一种自适应的视频播放方法,用于播放讲解类视频,所述讲解类视频具有相对固定的语速和视频内容,所述方法包括:
[0007]从待播放的视频中采样,得到采样语音Z;
[0008]基于采用语音Z,得到采用语音的语速V1;
[0009]如果V1>V0,那么根据V0和V1确定视频播放的倍速P,V0为预设的基准语速;
[0010]使用倍速P播放所述待播放的视频;
[0011]其中,所述采样语音Z包括m个固定时长T0的语音段,Z=(Z1,Z2,
……
,Zm),任意一个采样语音Zi包括元数据组(Ti,Wi)和音频内容,Ti为去除静音后的音频时长,,tj为音频内容中的第j段静音的静音时长,K为音频内容中的静音段数量;
[0012]或者
[0013]可选地,预设的基准语速V0为209~300字/分钟。
[0014]可选地,预设的基准语速根据用户输入的用户语音确定。
[0015]可选地,所述用户语音包括时长T和字数W,预设的基准语速V0=W/T。
[0016]可选地,倍速P=V1/V0。
[0017]可选地,根据V0和V1确定视频播放的倍速P包括:
[0018]计算语速比值(V1

V0)/V0;
[0019]根据计算的语速比值和预设的倍速列表E确定倍速P,E=(E1,E2,

,Eu),E1<E2<,

,<E
u

[0020]可选地,根据计算的语速比值和预设的倍速列表E确定倍速P,包括:如果E
s
‑1≤(V1

V0)/V0<E
s
,那么P=E
s
‑1,s的取值范围为1

u。
[0021]可选地,所述待播放的视频包括属于同一主讲ID的多个视频,所述主讲ID用于标识视频中的主讲人的身份。
[0022]本专利技术另一实施例提供一种自适应的视频播放系统,包括处理器和存储介质,所述存储介质有存储有计算机程序,所述处理器执行计算机程序,当获取语音播放指令时,实现前述的方法。
[0023]本专利技术实施例提供的自适应的视频播放方法和系统,根据从待播放视频采样得到的采样语音的语速来确定对应的播放倍速,能够自适应的调整视频播放的倍速。
附图说明
[0024]图1为本专利技术一实施例提供的自适应的视频播放方法的流程示意图;
[0025]图2为本专利技术一实施例提供的自适应的视频播放方法的流程示意图。
具体实施方式
[0026]为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0027]在本专利技术的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]在本专利技术实施例中,提供的自适应的视频播放方法,用于播放讲解类视频。讲解类视频是指在相对较长的时间内,具有相对固定的语速和视频内容的视频。这类视频通常只有一个主讲人,就某个问题进行讲解,语速基本固定,在相对较长的时间内,视频内容相对固定,例如PPT。
[0030]图1为本专利技术实施例提供的自适应的视频播放方法的流程示意图。如图1所示,本
专利技术实施例提供的自适应的视频播放方法包括以下步骤:
[0031]S100,从待播放的视频中采样,得到采样语音Z;
[0032]S200,基于采用语音Z,得到采用语音的语速V1;
[0033]S300,如果V1>V0,那么根据V0和V1确定视频播放的倍速P,V0为预设的基准语速;
[0034]S400,使用倍速P播放所述待播放的视频。
[0035]本专利技术实施例提供的自适应的视频播放方法,能够根据待播放视频的语速来确定对应的播放倍速,从而能够自适应的调整视频播放的倍速。
[0036]进一步地,在本专利技术实施例中,所述待播放的视频不一定是一段视频,也可能是多个视频。比如同一个主讲人讲的系列视频课程,但是要求在播放的视频的元数据中,视频中的主讲人必须是同一个ID,即待播放的视频可包括属于同一主讲ID的多个视频,所述主讲ID用于标识视频中的主讲人的身份。元数据中获取同一主讲人的方法,可以是现有技术,本专利技术省略对其的具体介绍。
[0037]进一步地,在本专利技术一实施例中,预设的基准语速V0可设置为新闻联播的播音速度,例如为209~300字/分钟。
[0038]在本专利技术的另一实施例中,预设的基准语速V0可根据用户输入的用户语音确定。具体地,用户输入的用户语音可包括时长T(例如3分钟)和对应的字数W,此时,预设的基准语速V0=W/T。
[0039]进一步地,在本专利技术实施例中,步骤S100中采样得到的采样语音Z可包括m个固定时长T0的语音段,Z=(Z1,Z2,
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应的视频播放方法,其特征在于,用于播放讲解类视频,所述讲解类视频具有相对固定的语速和视频内容,所述方法包括:从待播放的视频中采样,得到采样语音Z;基于采用语音Z,得到采用语音的语速V1;如果V1>V0,那么根据V0和V1确定视频播放的倍速P,V0为预设的基准语速;使用倍速P播放所述待播放的视频;其中,所述采样语音Z包括m个固定时长T0的语音段,Z=(Z1,Z2,......,Zm),任意一个采样语音Zi包括元数据组(Ti,Wi)和音频内容,Ti为去除静音后的音频时长,tj为音频内容中的第j段静音的静音时长,K为音频内容中的静音段数量;或者2.根据权利要求1所述的自适应的视频播放方法,其特征在于,预设的基准语速V0为209~300字/分钟。3.根据权利要求1所述的自适应的视频播放方法,其特征在于,预设的基准语速根据用户输入的用户语音确定。4.根据权利要求3所述的自适应的视频播放方法,其特征在于,所述用户语音包括时长T和字数W,预设的基准语速V0=W/T。5.根据权利要求1所述的自适应的视频播放方法,其特征在于,倍速P=V1/V0...

【专利技术属性】
技术研发人员:陈明于海遨钟学伟
申请(专利权)人:北京五街科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1