影视对白数据库的建立方法、建立装置及存储介质制造方法及图纸

技术编号:20425183 阅读:21 留言:0更新日期:2019-02-23 08:30
本发明专利技术公开了一种影视对白数据库的建立方法,包括:解析获取的影视资源,得到视频对象和音频对象;识别并获取所述音频对象中的人声片段;将所述人声片段中的每句对白标记预设标签;根据标记有所述预设标签的所述对白获取第一对白文本;将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库。同时本发明专利技术还公开了一种影视对白数据库的建立装置及计算机存储介质,实现根据影视片中的经典对白建立数据库,重新整理影视片资源,达到影视资源的二次利用的目的。

【技术实现步骤摘要】
影视对白数据库的建立方法、建立装置及存储介质
本专利技术涉及影视
,尤其涉及影视对白数据库的建立方法、影视对白数据库的建立装置及计算机存储介质。
技术介绍
目前市面上拥有数以万计的影视片资源,这些影视片资源通常包括一些当下热门的影视片和许多以往的经典电影,而在这些影视的对白里,都会有一些让人印象深刻的经典桥段或是经典对白,这些对白的内容非常精彩丰富,有些对白很生活化,却又深藏智慧,有一些经典的对白,已经成为大家的口头禅。这些对白各有不同的表达方式,再配上各大明星或者演员不同的面部表情和肢体动作,塑造出一个又一个经典场景。然而这些影视片除了用作观赏以外,没有其他用途,这样导致大量的影视资源浪费,特别是那些因为不再热门而受冷落的经典影视片,渐渐淡出人们的视野,失去了其应有的价值。
技术实现思路
本专利技术的主要目的在于提供一种影视对白数据库的建立方法、影视对白数据库的建立装置及计算机存储介质,旨在解决目前大量影视片用途单一,资源浪费的问题。为实现上述目的,本专利技术提供一种影视对白数据库的建立方法,所述影视对白数据库的建立方法的步骤包括:解析获取的影视资源,得到视频对象和音频对象;识别并获取所述音频对象中的人声片段;将所述人声片段中的每句对白标记预设标签;根据标记有所述预设标签的所述对白获取第一对白文本;将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库。优选地,所述识别并获取所述音频对象中的人声片段的步骤包括:通过语音活动检测方法对所述音频对象进行人声识别,识别出所述音频对象中的人声片段;从所述音频对象中切分出所述人声片段。优选地,所述将所述人声片段中的每句对白标记预设标签的步骤包括:对所述对白标记电影年代标签;对所述对白进行声纹识别,并标记演员姓名标签和演员性别标签。优选地,所述将所述人声片段中的每句对白标记预设标签的步骤还包括:对所述对白进行情感识别,并标记情感标签。优选地,所述根据标记有所述预设标签的所述对白获取第一对白文本的步骤包括:对所述对白进行语音识别,得到第一字幕;识别所述对白对应的所述视频对象中的自带字幕,得到第二字幕;根据所述第二字幕对所述第一字幕进行修正,得到第一对白文本。优选地,其特征在于,所述影视对白数据库的建立方法的步骤还包括:在接收到用户输入的搜索指令时,获取所述搜索指令的类型;在所述搜索指令为文本指令时,从所述第一对白文本中获取与所述文本指令内容相似度最高的第二对白文本;从所述影视对白数据库中搜索出与所述第二对白文本关联的影视片段。优选地,所述获取所述搜索指令的类型的步骤之后还包括:在所述搜索指令为语音指令时,对所述语音指令进行语音识别,得到文本指令,从所述第一对白文本中获取与所述文本指令内容相似度最高的第二对白文本;从所述影视对白数据库中搜索出与所述第二对白文本关联的影视片段。优选地,所述获取所述搜索指令的类型的步骤之后还包括:在所述搜索指令为语音指令时,对所述语音指令进行语音识别和情感识别,得到对应情感标签的文本指令,从所述第一对白文本中获取标记有所述情感标签且与所述文本指令内容相似度最高的第二对白文本;从所述影视对白数据库中搜索出与所述第二对白文本关联的影视片段。此外,为实现上述目的,本专利技术还提供一种影视对白数据库的建立装置,其特征在于,所述影视对白数据库的建立装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的影视对白数据库的建立程序,所述影视对白数据库的建立程序被所述处理器执行时实现如上所述中任一项所述的影视对白数据库的建立方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机存储介质,所述计算机存储介质上存储有影视对白数据库的建立程序,所述影视对白数据库的建立程序被所述处理器执行时实现如上所述中任一项所述的影视对白数据库的建立方法的步骤。本专利技术提出的影视对白数据库的建立方法、影视对白数据库的建立装置及计算机存储介质,通过解析获取的影视资源,得到视频对象和音频对象,再识别并获取所述音频对象中的人声片段,再将所述人声片段中的每句对白标记预设标签,再根据标记有所述预设标签的所述对白获取第一对白文本,再将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库,实现根据影视片中的经典对白建立数据库,重新整理影视片资源,达到影视资源的二次利用的目的。进一步地,本专利技术提出的技术方案可用于影视对白的搜索,实现根据输入文本或语音指令在所述影视对白数据库中搜索相应的影视片段。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图;图2为本专利技术影视对白数据库的建立方法第一实施例的流程示意图;图3为本专利技术影视对白数据库的建立方法第二实施例的流程示意图;图4为本专利技术影视对白数据库的建立方法第三实施例的流程示意图;图5为本专利技术影视对白数据库的建立方法第四实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例的主要解决方案是:解析获取的影视资源,得到视频对象和音频对象;识别并获取所述音频对象中的人声片段;将所述人声片段中的每句对白标记预设标签;根据标记有所述预设标签的所述对白获取第一对白文本;将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库。由于现有技术中,这些影视片除了用作观赏以外,没有其他用途,这样导致大量的影视资源浪费,特别是那些因为不再热门而受冷落的经典影视片,渐渐淡出人们的视野,失去了其应有的价值。同时这些影视片资源巨大,种类繁多,用户在搜索时难以查找出包含特定经典对白的影片资源。本专利技术提供一种解决方案,通过解析获取的影视资源,得到视频对象和音频对象,再识别并获取所述音频对象中的人声片段,再将所述人声片段中的每句对白标记预设标签,再根据标记有所述预设标签的所述对白获取第一对白文本,再将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库,实现根据影视片中的经典对白建立数据库,重新整理影视片资源,达到影视资源的二次利用的目的。进一步地,本专利技术提出的技术方案可用于影视对白的搜索,实现根据输入文本或语音指令在所述影视对白数据库中搜索相应的影视片段。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图。本专利技术实施例终端为智能电视。如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的终本文档来自技高网...

【技术保护点】
1.一种影视对白数据库的建立方法,其特征在于,所述影视对白数据库的建立方法的步骤包括:解析获取的影视资源,得到视频对象和音频对象;识别并获取所述音频对象中的人声片段;将所述人声片段中的每句对白标记预设标签;根据标记有所述预设标签的所述对白获取第一对白文本;将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库。

【技术特征摘要】
1.一种影视对白数据库的建立方法,其特征在于,所述影视对白数据库的建立方法的步骤包括:解析获取的影视资源,得到视频对象和音频对象;识别并获取所述音频对象中的人声片段;将所述人声片段中的每句对白标记预设标签;根据标记有所述预设标签的所述对白获取第一对白文本;将所述人声片段和对应的所述视频对象压缩成影视片段,并与所述第一对白文本关联存储以形成影视对白数据库。2.如权利要求1所述的影视对白数据库的建立方法,其特征在于,所述识别并获取所述音频对象中的人声片段的步骤包括:通过语音活动检测方法对所述音频对象进行人声识别,识别出所述音频对象中的人声片段;从所述音频对象中切分出所述人声片段。3.如权利要求1所述的影视对白数据库的建立方法,其特征在于,所述将所述人声片段中的每句对白标记预设标签的步骤包括:对所述对白标记电影年代标签;对所述对白进行声纹识别,并标记演员姓名标签和演员性别标签。4.如权利要求3所述的影视对白数据库的建立方法,其特征在于,所述将所述人声片段中的每句对白标记预设标签的步骤还包括:对所述对白进行情感识别,并标记情感标签。5.如权利要求1所述的影视对白数据库的建立方法,其特征在于,所述根据标记有所述预设标签的所述对白获取第一对白文本的步骤包括:对所述对白进行语音识别,得到第一字幕;识别所述对白对应的所述视频对象中的自带字幕,得到第二字幕;根据所述第二字幕对所述第一字幕进行修正,得到第一对白文本。6.如权利要求1至5中任一项所述的影视对白数据库的建立方法,其特征在于,所述影视对白数据库的建立方法的步骤还包括:在接...

【专利技术属性】
技术研发人员:赖长明徐永泽
申请(专利权)人:深圳TCL新技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1