【技术实现步骤摘要】
一种字幕的展示方法、装置及设备
[0001]本文件涉及计算机
,尤其涉及一种字幕的展示方法、装置及设备。
技术介绍
[0002]随着计算机技术的飞速发展,实时字幕的展示需求越来越多,如在观看网络直播课、参与视频会议等场景下,为使得用户能够更直观的获取到讲解人员讲解的内容,需要将讲解人员讲解的语音转换成字幕进行展示。
[0003]通常,可以将语音流划分为多个语音片段,并根据每个语音片段与服务器之间建立一个连接,通过创建的连接分别将语音片段发送至服务器进行文本转换处理,得到与语音流对应的文本数据,在根据文本数据实现字幕的实时展示。
[0004]但是,在语音转换需求量较大的情况下,基于上述方法就需要在设备(包括语音采集设备、字幕展示设备等)与服务器之间建立数量较多的连接,由于在设备与服务器之间频繁的建立数量较多的连接,并且需要将语音流划分为多个语音片段分别进行识别,从而使得获取完整字幕所需要的时间很长,造成语音与字幕很难同步,文本展示准确性低,基于此,需要提供一种提高资源利用率以及针对语音数据的文本展示效率和 ...
【技术保护点】
【技术特征摘要】
1.一种字幕的展示方法,所述方法包括:与第一设备建立长连接,并通过所述长连接接收所述第一设备采集的待转换的目标语音流;对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据,以及对所述第一文本数据进行校正处理,得到所述目标语音流对应的第二文本数据;基于所述第一文本数据和所述第二文本数据,确定所述字幕为所述目标语音流对应的目标文本展示数据。2.根据权利要求1所述的方法,所述方法还包括:通过所述长连接将所述目标文本展示数据返回至所述第一设备,并触发所述第一设备将所述目标语音流对应的所述目标文本展示数据作为字幕进行展示。3.根据权利要求1所述的方法,所述方法还包括:与第二设备建立长连接,并通过与所述第二设备建立的所述长连接将所述目标文本展示数据发送至所述第二设备,触发所述第二设备展示所述目标语音流对应的所述目标文本展示数据。4.根据权利要求1所述的方法,所述对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据,包括:基于第一时间间隔对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据。5.根据权利要求4所述的方法,所述基于第一时间间隔对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据,包括:通过所述长连接接收所述第一设备发送的目标参数,所述目标参数包含所述目标语音流的格式参数和采样参数;基于所述目标参数,对所述目标语音流进行校验,并基于校验结果确定是否能够对所述目标语音流进行文本转换;若确定能够对所述目标语音流进行文本转换,则基于所述第一时间间隔对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据。6.根据权利要求5所述的方法,所述基于所述第一时间间隔对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据,包括:基于所述目标参数,确定目标格式转换算法,所述目标格式转换算法用于对所述目标语音流进行格式转换;基于所述目标格式转换算法,对所述目标语音流进行格式转换,得到格式转换后的目标语音流;基于所述第一时间间隔对所述格式转换后的目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据。7.根据权利要求1所述的方法,所述基于所述第一文本数据和所述第二文本数据,确定所述字幕为所述目标语音流对应的目标文本展示数据,包括:获取所述第一文本数据和所述第二文本数据之间的匹配度;基于所述匹配度、所述第一文本数据和所述第二文本数据,确定所述字幕为所述目标语音流对应的目标文本展示数据。
8.根据权利要求1所述的方法,所述对所述目标语音流进行文本转换处理,得到所述目标语音流对应的第一文本数据,以及对第一文本数据进行校正处理,得到所述目标语音流对应的第二文本数据,包括:确定所述目标语音流中的一个或多个目标语音片段,所述目标语音片段为包含人声数据的语音数据的片段;将所述目标语音片段划分为一个或多个子语音片段,并对每个所述子语音片段进行文本转换处理,得到所述目标语音片段对应的中间文本数据;对所述目标语音片段对应的中间文本数据进行校正处理,得到所述目标语音片段对应的校正文本数据;基于所述目标语音片段对应的中间文本数据,确定所述目标语音流对应的第一文本数据,并基于所述目标语片段对应的校正文本数据,确定所述目标语音流对应的第二文本数据。9.根据权利要求8所述的方法...
【专利技术属性】
技术研发人员:迟海波,周健,王洪斌,郝征鹏,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。