音频播放方法、音频转换方法及装置制造方法及图纸

技术编号:37795135 阅读:12 留言:0更新日期:2023-06-09 09:25
本公开提供了一种音频播放方法、音频转换方法及装置,其中,所述音频播放方法包括:响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;基于所述目标音频文件进行音频播放。标音频文件进行音频播放。标音频文件进行音频播放。

【技术实现步骤摘要】
音频播放方法、音频转换方法及装置


[0001]本公开涉及计算机
,具体而言,涉及一种音频播放方法、音频转换方法及装置。

技术介绍

[0002]随着互联网技术和移动终端技术的快速发展,用户的信息来源越来越依赖于互联网和手机,传统的文本阅读方式由于信息获取效率较低已经不能满足用户的信息获取需求,因此用户可以借用相关技术,将文本转换成音频,并通过音频来获取信息。
[0003]相关技术中,在进行音频转换的过程中,往往只能使用机器合成出的声音对文本内容进行音频转换,转换后得到的音频在播放过程中的播放效果较差。

技术实现思路

[0004]本公开实施例至少提供一种音频播放方法、音频转换方法及装置。
[0005]第一方面,本公开实施例提供了一种音频播放方法,应用于第一用户端,包括:
[0006]响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;
[0007]接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;
[0008]基于所述目标音频文件进行音频播放。
[0009]一种可能的实施方式中,所述方法还包括根据以下步骤确定与所述第一用户端关联的第二用户端:
[0010]获取所述第一用户端与其他用户端的交互数据;
[0011]基于所述交互数据确定与所述第一用户端关联的第二用户端。
[0012]一种可能的实施方式中,所述方法还包括根据以下方法获取所述第二用户端对应的声学特征:
[0013]响应针对至少一个第二用户端的标识的触发操作,通过服务器向所述至少一个第二用户端发送语音包录制请求,以指示所述至少一个第二用户端基于所述语音包录制请求进行语音包录制,所述第二用户端对应的声学特征为所述服务器在接收到所述至少一个第二用户端基于所述语音包录制请求上传的第一音频文件后,从所述第一音频文件中提取的。
[0014]一种可能的实施方式中,所述第二用户端对应的声学特征为,所述第二用户端发起针对所述第一用户端的语音包分享请求后,所述服务器基于所述第二用户端上传的第二音频文件进行特征提取后得到的。
[0015]一种可能的实施方式中,所述方法还包括:
[0016]在播放所述目标音频文件的同时,对展示的所述目标文本内容中已阅读的文本内
容进行标记。
[0017]一种可能的实施方式中,在响应针对当前展示的目标文本内容的播放触发操作之前,所述方法还包括:
[0018]响应检测到当前展示的所述目标文本内容满足语音播放条件,展示语音播放提示信息,所述语音播放提示信息用于指示执行所述播放触发操作;
[0019]其中,所述语音播放条件包括以下至少一种:
[0020]所述目标文本内容的字数超过预设字数、所述目标文本内容的展示时长超过预设时长、展示所述目标文本内容的时间在目标时间段内。
[0021]第二方面,本公开实施例还提供一种音频转换方法,应用于服务器,包括:
[0022]接收第一用户端发送的针对当前展示的目标文本内容的音频获取请求;
[0023]基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容对应的目标音频文件;
[0024]将所述目标音频文件发送至所述第一用户端,以使所述第一用户端基于所述目标音频文件进行音频播放。
[0025]一种可能的实施方式中,所述基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容匹配的目标音频文件,包括:
[0026]在与所述第一用户端关联的第二用户端的数量为多个的情况下,基于各第二用户端分别对应的声学特征,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端;
[0027]基于所述目标用户端对应的声学特征,生成与所述目标文本内容匹配的目标音频文件。
[0028]一种可能的实施方式中,所述基于各第二用户端分别对应的声学特征,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端,包括:
[0029]基于各第二用户端对应的第一文本内容类型与所述目标文本内容所属的第二文本内容类型,确定与所述目标文本内容匹配的目标用户端,其中,所述第二用户端对应的第一文本内容类型为基于预设的声学特征类型与文本内容类型的映射关系,和所述第二用户端的声学特征确定的。
[0030]一种可能的实施方式中,所述基于各第二用户端分别对应的声学特征,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端,包括:
[0031]将各第二用户端分别对应的声学特征和所述目标文本内容经过特征提取后得到的文本特征,输入至预先训练好的目标网络模型中,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端。
[0032]一种可能的实施方式中,所述基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容对应的目标音频文件,包括:
[0033]在与所述第一用户端关联的第二用户端的数量为多个的情况下,基于各第二用户端分别对应的声学特征,确定所述目标文本内容中与各第二用户端分别对应的目标内容片段;
[0034]根据各第二用户端分别对应的声学特征和目标内容片段,生成与所述目标文本内容匹配的目标音频文件。
[0035]第三方面,本公开实施例还提供一种音频播放装置,应用于第一用户端,包括:
[0036]第一发送模块,用于响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;
[0037]第一接收模块,用于接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;
[0038]播放模块,用于基于所述目标音频文件进行音频播放。
[0039]一种可能的实施方式中,所述第一接收模块还用于根据以下步骤确定与所述第一用户端关联的第二用户端:
[0040]获取所述第一用户端与其他用户端的交互数据;
[0041]基于所述交互数据确定与所述第一用户端关联的第二用户端。
[0042]一种可能的实施方式中,所述第一接收模块还用于根据以下方法获取所述第二用户端对应的声学特征:
[0043]响应针对至少一个第二用户端的标识的触发操作,通过服务器向所述至少一个第二用户端发送语音包录制请求,以指示所述至少一个第二用户端基于所述语音包录制请求进行语音包录制,所述第二用户端对应的声学特征为所述服务器在接收到所述至少一个第二用户端基于所述语音包录制请求上传的第一音频文件后,从所述第一音频文件中提取的。
[0044]一种可能的实施方式中,所述第二用户端对应的声学特征为,所述第二用户端发起针对所述第一用户端的语音包分享请求后,所述服务器基于所述第二用户端上传本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频播放方法,其特征在于,应用于第一用户端,包括:响应于针对目标文本内容的音频获取操作,向服务器发送针对所述目标文本内容的音频获取请求;接收服务器发送的目标音频文件,所述目标音频文件是所述服务器基于与所述第一用户端建立关联关系的第二用户端对应的声学特征生成的、与所述目标文本内容匹配的音频文件;基于所述目标音频文件进行音频播放。2.根据权利要求1所述的方法,其特征在于,所述方法还包括根据以下步骤确定与所述第一用户端关联的第二用户端:获取所述第一用户端与其他用户端的交互数据;基于所述交互数据确定与所述第一用户端关联的第二用户端。3.根据权利要求1所述的方法,其特征在于,所述方法还包括根据以下方法获取所述第二用户端对应的声学特征:响应针对至少一个第二用户端的标识的触发操作,通过服务器向所述至少一个第二用户端发送语音包录制请求,以指示所述至少一个第二用户端基于所述语音包录制请求进行语音包录制,所述第二用户端对应的声学特征为所述服务器在接收到所述至少一个第二用户端基于所述语音包录制请求上传的第一音频文件后,从所述第一音频文件中提取的。4.根据权利要求1所述的方法,其特征在于,所述第二用户端对应的声学特征为,所述第二用户端发起针对所述第一用户端的语音包分享请求后,所述服务器基于所述第二用户端上传的第二音频文件进行特征提取后得到的。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在播放所述目标音频文件的同时,对展示的所述目标文本内容中已阅读的文本内容进行标记。6.根据权利要求1所述的方法,其特征在位于,在响应针对当前展示的目标文本内容的播放触发操作之前,所述方法还包括:响应检测到当前展示的所述目标文本内容满足语音播放条件,展示语音播放提示信息,所述语音播放提示信息用于指示执行所述播放触发操作;其中,所述语音播放条件包括以下至少一种:所述目标文本内容的字数超过预设字数、所述目标文本内容的展示时长超过预设时长、展示所述目标文本内容的时间在目标时间段内。7.一种音频转换方法,其特征在于,应用于服务器,包括:接收第一用户端发送的针对当前展示的目标文本内容的音频获取请求;基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容对应的目标音频文件;将所述目标音频文件发送至所述第一用户端,以使所述第一用户端基于所述目标音频文件进行音频播放。8.根据权利要求7所述的方法,其特征在于,所述基于与所述第一用户端建立关联关系的第二用户端的声学特征,生成与所述目标文本内容匹配的目标音频文件,包括:在与所述第一用户端关联的第二用户端的数量为多个的情况下,基于各第二用户端分
别对应的声学特征,从多个所述第二用户端中确定与所述目标文本内容匹配的目标用户端;基于所述目标用户端对应的声学特征,生成与所述目标文本内容匹配的目标音频文件。9.根据权利要求8所...

【专利技术属性】
技术研发人员:田昕弋
申请(专利权)人:抖音视界有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1