多媒体播放方法及装置制造方法及图纸

技术编号:10407990 阅读:77 留言:0更新日期:2014-09-10 17:28
本发明专利技术是关于一种多媒体播放方法及装置。所述方法包括:获取多媒体的暂停位置之前第一预设时长的音频数据和/或字幕数据;根据所述音频数据和/或字幕数据确定完整语句的语句起始位置;当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述语句起始位置继续播放所述多媒体。本发明专利技术用于使得在暂停后继续播放时用户可以捕捉并理解到完整的语句。

【技术实现步骤摘要】
多媒体播放方法及装置
本公开涉及多媒体处理
,尤其涉及一种多媒体播放方法及装置。
技术介绍
相关技术中,在播放视频的时候,经常会出现暂停,包括因为用户主观原因的主动暂停,也包括由于网络的原因,出现短暂的卡顿暂停。由于暂定的时刻机动性比较大,在继续播放的时候,视频里面出现的声音往往是从一个句子的中间开始,甚至从一个字或者词的一半开始,这样不便于人们连续地理解情节。相关技术中,一些多媒体播放软件或网页,在播放过程中关闭软件或网页后,当再次开启软件播放同一视频或重新打开上次关闭的视频网页时,也会采取在暂停位置返回固定时间量的回退播放方式。例如,返回的时间值固定设置为5秒,则当中断后重新开启软件或网页,继续播放原视频时,从中断点之前的5秒开始播放,以便用户接续到上次观看的记忆。这种回退播放方式,后退的时间值是预先设定的固定值,虽然给予用户一定回想的时间,但是切入的时间点比较生硬,不够人性化。因为即使后退5秒,也会出现从一个句子的中间开始继续播放的情况,不利于用户理解完整的语句。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供一种多媒体播放方法及装置。根据本公开实施例的第一方面,提供一种多媒体播放方法,包括:获取多媒体的暂停位置之前第一预设时长的音频数据和/或字幕数据;根据所述音频数据和/或字幕数据确定完整语句的语句起始位置;当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述语句起始位置继续播放所述多媒体。本实施例中,通过分析音频数据和/或字幕数据,确定一句完整语句的语句起始位置,根据确定的语句起始位置继续播放视频或音频,使得在暂停后继续播放时用户可以捕捉并理解到完整的语句,视频或音频里的对话更自然,情节更连续,提高用户对视频或音频播放的体验度。可选的,所述根据所述音频数据确定完整语句的语句起始位置,包括:检测所述音频数据中相邻两个音频信号之间的时间间隔;当相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,确定所述相邻两个音频信号之间的任一时间位置为所述语句起始位置。可选的,所述根据所述字幕数据确定完整语句的语句起始位置,包括:获取所述字幕数据中每条字幕的起始显示时间和/或终止显示时间;根据所述字幕的起始显示时间和/或终止显示时间确定所述语句起始位置。可选的,所述根据所述音频数据和字幕数据确定完整语句的语句起始位置,包括:检测所述音频数据中每个音频信号的播放时间;当相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,获取所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间;根据所述相邻两个音频信号的播放时间及所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间确定所述语句起始位置。在可选方案中,通过根据相邻音频信号之间的时间间隔或相邻字幕之间的时间间隔确定语句起始位置,使得后续可以根据语句起始位置继续播放音频或视频,用户继续播放时可以捕捉并理解到完整的语句,视频或音频里的对话更自然,情节更连续,提高用户对视频或音频播放的体验度。另外,同时对音频数据和字幕数据进行分析,确定两个完整语句之间的间隔位置,从而更精确地获得完整语句的起始点,不仅不会影响到用户对语句的理解,也不会影响到用户观看到字幕。可选的,所述根据所述音频数据确定完整语句的语句起始位置,包括:根据人声频率对所述音频数据进行过滤,得到人声音频数据;检测所述人声音频数据中相邻两个人声音频信号之间的时间间隔;当相邻两个人声音频信号之间的时间间隔大于所述第一预设间隔时长时,确定所述相邻两个人声音频信号间之间的任一时间位置为所述语句起始位置。在可选方案中,按照人声通常的频率先对音频数据过滤,从而单纯对人声音频信号进行分析,根据人声音频信号之间的时间间隔确定语句起始位置,使得对语句起始位置的确定更加准确。可选的,当根据所述音频数据和/或字幕数据确定出至少两个完整语句的语句起始位置时,所述根据所述语句起始位置继续播放所述多媒体,包括:从距离所述暂停位置最近的语句起始位置继续播放所述多媒体;或者当预设的回退语句数量为N时,从所述暂停位置之前的第N个语句起始位置继续播放所述多媒体,所述N为大于或等于2的整数。在可选方案中,当确定多个语句起始位置时,可以灵活选择其中一个作为暂停后继续播放音视频的起点,使得用户继续播放时可以捕捉并理解到完整的语句,视频或音频里的对话更自然,情节更连续,提高用户对视频或音频播放的体验度。可选的,当根据所述多媒体的暂停位置之前第一预设时长内的音频数据和/或字幕数据无法确定完整语句的语句起始位置时,所述方法还包括:按照时间从后往前的顺序,获取第一预设时长的音频数据和/或字幕数据,其中,本次获取的第一预设时长的音频数据和/或字幕数据的播放时间在上一次获取的第一预设时长的音频数据和/或字幕数据的播放时间之前;从本次获得的该第一预设时长的音频数据和/或字幕数据中确定完整语句的语句起始位置;若从本次获得的该第一预设时长的音频数据和/或字幕数据中无法确定完整语句的语句起始位置,则按照时间从后往前的顺序继续向前获取第一预设时长的音频数据和/或字幕数据并确定完整语句的语句起始位置,直到确定出至少一个完整语句的语句起始位置。可选的,所述获取多媒体的暂停位置之前第一预设时长内的音频数据和/或字幕数据,包括:获取多媒体的暂停位置之前的、且与所述暂停位置间隔第二预设时长的时间位置;获取所述时间位置之前第一预设时长内的音频数据和/或字幕数据;所述根据所述音频数据和/或字幕数据确定完整语句的语句起始位置,包括:根据所述时间位置之前第一预设时长内的音频数据和/或字幕数据,确定完整语句的语句起始位置。在可选方案中,可以先选取到暂停位置前一段时间的时间位置,以该时间位置作为往回寻找完整语句的语句起始位置的起点,使得用户可以获得提供更充裕的进入视频情节的时间。根据本公开实施例的第二方面,提供一种多媒体播放装置,包括:获取模块,用于获取多媒体的暂停位置之前第一预设时长的音频数据和/或字幕数据;分析模块,用于根据所述获取模块获取的音频数据和/或字幕数据确定完整语句的语句起始位置;播放模块,用于当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述分析模块确定的语句起始位置继续播放所述多媒体。所述分析模块包括:检测单元,用于检测所述获取模块获取的所述音频数据中相邻两个音频信号之间的时间间隔;分析确定单元,用于当所述检测单元检测到的相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,确定所述相邻两个音频信号之间的任一时间位置为所述语句起始位置。所述分析模块包括:获取单元,用于从所述获取模块获取的所述字幕数据中获取每条字幕的起始显示时间和/或终止显示时间;分析确定单元,用于根据所述获取单元获取的所述字幕的起始显示时间和/或终止显示时间确定所述语句起始位置。所述分析模块包括:检测单元,用于检测所述获取模块获取的所述音频数据中每个音频信号的播放时间;获取单元,用于当所述检测单元检测的相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,获取所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间;分析确定单元,用于根据所述获取单元获取的所述相邻两个音频信号的播放时间及所述相邻音频信号对应的字幕的起始显本文档来自技高网...
多媒体播放方法及装置

【技术保护点】
一种多媒体播放方法,其特征在于,包括:获取多媒体的暂停位置之前第一预设时长的音频数据和/或字幕数据;根据所述音频数据和/或字幕数据确定完整语句的语句起始位置;当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述语句起始位置继续播放所述多媒体。

【技术特征摘要】
1.一种多媒体播放方法,其特征在于,包括:获取多媒体的暂停位置之前第一预设时长的音频数据;或者,获取多媒体的暂停位置之前第一预设时长的音频数据和字幕数据;根据所述音频数据确定完整语句的语句起始位置;或者,根据所述音频数据和字幕数据确定完整语句的语句起始位置;当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述语句起始位置继续播放所述多媒体;所述根据所述音频数据确定完整语句的语句起始位置,包括:检测所述音频数据中相邻两个音频信号之间的时间间隔;当相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,确定所述相邻两个音频信号之间的任一时间位置为所述语句起始位置,或者;所述根据所述音频数据和字幕数据确定完整语句的语句起始位置,包括:检测所述音频数据中每个音频信号的播放时间;当相邻两个音频信号之间的时间间隔大于第一预设间隔时长时,获取所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间;根据所述相邻两个音频信号的播放时间及所述相邻音频信号对应的字幕的起始显示时间和/或终止显示时间确定所述语句起始位置;所述根据所述音频数据确定完整语句的语句起始位置,还包括:根据人声频率对所述音频数据进行过滤,得到人声音频数据;检测所述人声音频数据中相邻两个人声音频信号之间的时间间隔;当相邻两个人声音频信号之间的时间间隔大于所述第一预设间隔时长时,确定所述相邻两个人声音频信号间之间的任一时间位置为所述语句起始位置。2.根据权利要求1所述的方法,其特征在于,当根据所述音频数据和/或字幕数据确定出至少两个完整语句的语句起始位置时,所述根据所述语句起始位置继续播放所述多媒体,包括:从距离所述暂停位置最近的语句起始位置继续播放所述多媒体;或者当预设的回退语句数量为N时,从所述暂停位置之前的第N个语句起始位置继续播放所述多媒体,所述N为大于或等于2的整数。3.根据权利要求1所述的方法,其特征在于,当根据所述多媒体的暂停位置之前第一预设时长内的音频数据和/或字幕数据无法确定完整语句的语句起始位置时,所述方法还包括:按照时间从后往前的顺序,获取第一预设时长的音频数据和/或字幕数据,其中,本次获取的第一预设时长的音频数据和/或字幕数据的播放时间在上一次获取的第一预设时长的音频数据和/或字幕数据的播放时间之前;从本次获得的该第一预设时长的音频数据和/或字幕数据中确定完整语句的语句起始位置;若从本次获得的该第一预设时长的音频数据和/或字幕数据中无法确定完整语句的语句起始位置,则按照时间从后往前的顺序继续向前获取第一预设时长的音频数据和/或字幕数据并确定完整语句的语句起始位置,直到确定出至少一个完整语句的语句起始位置。4.根据权利要求1所述的方法,其特征在于,所述获取多媒体的暂停位置之前第一预设时长内的音频数据和/或字幕数据,包括:获取多媒体的暂停位置之前的、且与所述暂停位置间隔第二预设时长的时间位置;获取所述时间位置之前第一预设时长内的音频数据和/或字幕数据;所述根据所述音频数据和/或字幕数据确定完整语句的语句起始位置,包括:根据所述时间位置之前第一预设时长内的音频数据和/或字幕数据,确定完整语句的语句起始位置。5.一种多媒体播放装置,其特征在于,包括:获取模块,用于获取多媒体的暂停位置之前第一预设时长的音频数据;或者,获取多媒体的暂停位置之前第一预设时长的音频数据和字幕数据;分析模块,用于根据所述获取模块获取的音频数据确定完整语句的语句起始位置;或者,根据所述音频数据和字幕数据确定完整语句的语句起始位置;播放模块,用于当检测到继续播放所述多媒体的指令或满足继续播放所述多媒体的条件时,根据所述分析模块确定的语句起始位置继续播放所述多媒体;过滤模块,用于根据人声频率对所述获取模块获取的所述音频数据进行过滤,得到人声音频数据;检测模块,用于检测所述过滤单元过滤后的所述人声音频数据中相邻两个人声音频信号之间的时间间隔;所述...

【专利技术属性】
技术研发人员:王斌郑志光纪东方
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1