用于处理语音数据的方法、装置、设备和介质制造方法及图纸

技术编号:46624477 阅读:1 留言:0更新日期:2025-10-14 21:20
提供了用于处理语音数据的方法、装置、设备和介质。在一种方法中,响应于接收到目标对象的语音数据,获取与语音数据相关联的字幕文本。在音频直播页面中提供字幕文本。利用本公开的示例性实现方式,可以在音频直播应用中呈现更多的视觉元素,从而提供更为丰富的视觉效果,并且支持用户理解音频直播的更多信息。

【技术实现步骤摘要】

本公开的示例性实现方式总体涉及语音数据处理,特别地涉及用于在音频直播应用中处理语音数据的方法、装置、设备和计算机可读存储介质。


技术介绍

1、随着计算机技术的发展,目前已经可以在客户端设备处提供音频直播应用。用户可以在客户端设备上安装直播应用并且访问直播间。在音频直播应用中,可以提供直播的语音数据,此时用户仅能听到主播和/或嘉宾的声音,然而在音频直播应用中缺乏视觉内容。


技术实现思路

1、在本公开的第一方面,提供了一种用于处理语音数据的方法。在该方法中,响应于接收到目标对象的语音数据,获取与语音数据相关联的字幕文本。在音频直播页面中提供字幕文本。

2、在本公开的第二方面,提供了一种用于处理语音数据的装置。该装置包括:获取模块,被配置用于响应于接收到目标对象的语音数据,获取与语音数据相关联的字幕文本;以及提供模块,被配置用于在音频直播页面中提供字幕文本。

3、在本公开的第三方面,提供了一种电子设备。该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单本文档来自技高网...

【技术保护点】

1.一种用于处理语音数据的方法,包括:

2.根据权利要求1所述的方法,其中提供所述字幕文本包括:在与所述目标对象的标识相关联的位置处呈现所述字幕文本。

3.根据权利要求2所述的方法,其中呈现所述字幕文本包括:在所述音频直播页面中提供文本框,所述文本框包括所述目标对象的标识符以及所述字幕文本。

4.根据权利要求3所述的方法,其中呈现所述字幕文本包括:按照获取所述字幕文本的时间顺序,在所述文本框中呈现所述字幕文本。

5.根据权利要求3所述的方法,进一步包括:响应于检测到用于调整所述文本框的调整动作,基于所述调整动作来更新所述文本框,所述调整动作...

【技术特征摘要】

1.一种用于处理语音数据的方法,包括:

2.根据权利要求1所述的方法,其中提供所述字幕文本包括:在与所述目标对象的标识相关联的位置处呈现所述字幕文本。

3.根据权利要求2所述的方法,其中呈现所述字幕文本包括:在所述音频直播页面中提供文本框,所述文本框包括所述目标对象的标识符以及所述字幕文本。

4.根据权利要求3所述的方法,其中呈现所述字幕文本包括:按照获取所述字幕文本的时间顺序,在所述文本框中呈现所述字幕文本。

5.根据权利要求3所述的方法,进一步包括:响应于检测到用于调整所述文本框的调整动作,基于所述调整动作来更新所述文本框,所述调整动作用于调整以下至少任一项:所述文本框的大小、所述文本框的位置、所述字幕文本的颜色、字体、大小、以及底色。

6.根据权利要求1所述的方法,其中所述字幕文本是基于以下来获取的:响应于确定所述目标对象启动字幕功能,

7.根据权利要求1所述的方法,其中获取所述字幕文本包括:从与所述音频数据相关联的音频流的补充增强信息中提取所述字幕文本。

8.根据权利要求3所述的方法,其中所述目标对象包括第一目标对象和第二目标对象,以及呈现所述字幕文本包括:按照获取所述第一目标对象的第一语音数据的第一字幕文本以及所述第二目标对象的第二语音数据的第二字幕文本的时间...

【专利技术属性】
技术研发人员:黄洁林
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1