【技术实现步骤摘要】
字幕显示方法、装置、电子设备及计算机可读存储介质
[0001]本公开涉及计算机领域,尤其涉及一种字幕显示方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]目前,在相关技术中,STT字幕(Speech To Text,语音识别字幕)功能很受用户的欢迎。STT字幕的出现,可以很方便地让用户利用音频内容生成字幕内容。这些字幕内容能够让视频作品在互联网范围内广泛传播,使得视频的观看者更容易和更清晰地了解视频创作者的创作内容以及视频中的音频的文字信息。但是,这些利用语音识别功能识别出来的STT字幕,往往存在体现音频内容单一的问题。
[0003]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本公开提供一种字幕显示方法、装置、电子设备及计算机可读存储介质,以至少解决相关技术中基于音频显示字幕时,存在体现音频内容单一的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种字幕显示方法,包括:接收音频内容;响应于字幕添加操作,对所述音频内容进行识 ...
【技术保护点】
【技术特征摘要】
1.一种字幕显示方法,其特征在于,包括:接收音频内容;响应于字幕添加操作,对所述音频内容进行识别,得到文本内容;响应于旋律识别操作,对所述音频内容的旋律信息进行识别,得到旋律内容;基于所述文本内容和所述旋律内容,生成字幕并在显示界面上显示。2.根据权利要求1所述的方法,其特征在于,基于所述文本内容和所述旋律内容,生成字幕并在显示界面上显示,包括:将所述文本内容拆分为独立文字,并记录各独立文字在所述音频内容中的时间信息;对所述音频内容的旋律信息进行识别,得到旋律内容包括:分别基于所述各独立文字在所述音频内容中的时间信息,选择与所述时间信息对应的部分音频内容的旋律信息进行识别,得到所述各独立文字对应的独立旋律内容,其中,所述各独立文字对应的独立旋律内容构成所述文本内容对应的旋律内容;基于所述各独立文字与对应的所述独立旋律内容,生成字幕并在所述显示界面上显示。3.根据权利要求2所述的方法,其特征在于,在所述时间信息包括所述各独立文字在所述音频内容中的开始时间点,和时长的情况下,分别基于所述各独立文字在所述音频内容中的时间信息,选择与所述时间信息对应的部分音频内容的旋律信息进行识别,得到所述各独立文字对应的独立旋律内容,包括:分别基于所述各独立文字在所述音频内容中的所述开始时间点,以及所述时长,选择与所述开始时间点和所述时长对应的部分音频内容;对所述部分音频内容进行处理,得到所述部分音频内容的频谱分布;基于所述频谱分布,得到所述各独立文字对应的独立旋律内容。4.根据权利要求3所述的方法,其特征在于,所述基于所述频谱分布,得到所述各独立文字对应的独立旋律内容,包括:在所述音频内容为音乐,所述独立旋律内容为音乐旋律的情况下,确定所述频谱分布中的最高频率为所述各独立文字的主频率;将所述主频率转...
【专利技术属性】
技术研发人员:卢家辉,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。