数据传输方法和装置制造方法及图纸

技术编号：23346360 阅读：46 留言：0更新日期：2020-02-15 04:53

本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括：基于音频数据中的边界信息，对音频数据进行切分，得到多个包数据；对多个包数据中的每一个包数据进行编码，得到编码后的包数据，以及按照对应的播放次序，将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式，避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时，基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性，避免了音频数据的播放中的抖动问题。

Data transmission method and device

全部详细技术资料下载

【技术实现步骤摘要】
数据传输方法和装置
本申请涉及计算机领域，具体涉及数据传输领域，尤其涉及数据传输方法和装置。
技术介绍
在向用户提供的与音频数据相关的服务中，是由服务器将诸如合成的语音、音乐的音频数据下发到用户的终端，在用户的终端上进行播放。
技术实现思路
本申请实施例提供了数据传输方法和装置。第一方面，本申请实施例提供了数据传输方法，该方法包括：基于音频数据中的边界信息，对所述音频数据进行切分，得到多个包数据；对多个包数据中的每一个包数据进行编码，得到每一个包数据对应的编码后的包数据，以及按照对应的播放次序，将每一个包数据对应的编码后的包数据发送至终端。第二方面，本申请实施例提供了数据传输装置，该装置包括：切分单元，被配置为基于音频数据中的边界信息，对所述音频数据进行切分，得到多个包数据；传输单元，被配置为对多个包数据中的每一个包数据进行编码，得到每一个包数据对应的编码后的包数据，以及按照对应的播放次序，将每一个包数据对应的编码后的包数据发送至终端。本申请实施例提供的数据传输方法和装置，通过基于...

【技术保护点】
1.一种数据传输方法，包括：/n基于音频数据中的边界信息，对所述音频数据进行切分，得到多个包数据；/n对多个包数据中的每一个包数据进行编码，得到每一个包数据对应的编码后的包数据，以及按照对应的播放次序，将每一个包数据对应的编码后的包数据发送至终端。/n

【技术特征摘要】
1.一种数据传输方法，包括：
基于音频数据中的边界信息，对所述音频数据进行切分，得到多个包数据；
对多个包数据中的每一个包数据进行编码，得到每一个包数据对应的编码后的包数据，以及按照对应的播放次序，将每一个包数据对应的编码后的包数据发送至终端。

2.根据权利要求1所述的方法，包数据包括至少一个对应于文字的语音。

3.根据权利要求2所述的方法，音频数据为文本的合成语音，对应于文字的语音为对应于所述文本中的文字的语音，所述文本的合成语音通过采用预设语音合成方式基于所述文本而生成，预设语音合成方式包括以下之一：拼接合成方式、参数合成方式。

4.根据权利要求3所述的方法，边界信息为从音库中选取出的文字的语音单元的边界信息。

5.根据权利要求3所述的方法，边界信息为通过时长预测模型预测出的文字的边界信息。

6.根据权利要求3-5之一所述的方法，基于音频数据中的边界信息，对所述音频数据进行切分，得到多个包数据包括：
基于文本的合成语音中的对应于所述文本中的文字的语音的边界信息和预设语音数量，对文本的合成语音进行切分，得到多个包数据，其中，当包数据中包括的文字的语音的数量为预设语音数量时，包数据对应的响应时长小于时长阈值，包数据对应的响应时长为发送包数据的时刻和终端接收到包数据的时刻之间的时长。

7.根据权利要求6所述的方法，所述方法还包括：
当通过一次测试操作判断出首个包数据对应的响应时长小于或等于时长阈值时，将在所述测试操作中基于的语音数量参数的参数值作为预设语音数量，测试操作包括：基于语音数量参数的参数值，对用于测试的语音进行切分；判断切分后得到的所有包数据中的首个包数据对应响应时长是否大于时长阈值，其中，切分后得到的包数据中的文字的语音的数量为所述语音数量参数的参数值；
当通过一次测试操作判断出首个包数据对应响应时长大于时长阈值时，将语音数量参数的参数值减小预设值，以及再次执行测试操作。

8.根据权利要求7所述的方法，对多个包数据中的每一个包数据进行编码，得到每一个包数据对应的编码后的包数据，以及按照对应的播放次序，将每一个包数据对应的编码后的包数据发送至终端包括：
生成每一个包数据对应的扩展包数据，包数据对应的扩展包数据包括：所述包数据、在对应的播放次序上与所述包数据相邻的其他的包数据中的部分数据；
对每一个包数据对应的扩展包数据进行编码，得到每一个包数据对应的编码后的包数据；
按照对应的播放次序，将每一个包数据对应的编码后的包数据发送至终端，其中，包数据对应的编码后的包数据在终端上被解码，得到包数据对应的扩展包数据并且包数据对应的扩展包数据在终端上被去除属于其他的包数据的数据，得到包数据。

9.一种数据传输装置，包括：
切分单元，被配置为基于音频数据中的边界信息，对所述音频数据进行切分，得到多个包数据；
传输单元，被配置为对多个包...

【专利技术属性】
技术研发人员：刘龙飞，盖于涛，祝晓林，杜春明，郭启行，杨松，陈山，郝庆畅，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人