一种基于用户特征的音频数据传输分析方法及系统技术方案

技术编号：40283259 阅读：4 留言：0更新日期：2024-02-07 20:36

本发明专利技术涉及一种基于用户特征的音频数据传输分析方法及系统，属于音频传输分析技术领域，引入隐马尔可夫模型以及Viterbi算法计算用户的初始音频特征与实际音频特征之间的序列差异，得到状态序列差异分数，基于所述状态序列差异分数分析未执行拥塞避免控制机制情况下是否存在序列误差，得到第一传输异常分析结果，分析已执行拥塞避免控制机制时是否出现冗余丢包，得到第二传输异常分析结果，基于所述第一传输异常分析结果和所述第二传输异常分析结果对用户的初始音频特征误差进行计算修正，生成用户音频特征的修正方案。本发明专利技术能够分析在传输拥塞情况下用户音频特征数据的传输误差，并修正传输误差，确保音频特征完整性和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频传输分析，尤其涉及一种基于用户特征的音频数据传输分析方法及系统。

技术介绍

1、在目前发达的科技生活当中，很多的音频设备都能够根据用户的音频特征对输出的音频数据进行处理，例如音色、音调、音量、语速等特征，从而使得用户的音频特征更加象征化，更能够代表用户独有的声音特色，这些声音特征能够运用于声纹匹配、语音助手、语音识别以及人工交互等领域，对改善和提高用户生活质量具有重大帮助；但传统音频数据的传输方法仍存在很大的误差，音频从采集、发送到接收过程中音频数据会被分为无数的数据包，接着进行压缩编码传输，最后重组解码；而在重组和传输的过程中，由于网络传输拥塞，导致最终输出的音频特征数据包序列出现不连续、缺失或重复的现象，导致用户实际输出的音频特征产生误差和偏移，从而使得用户的实际音频特征无法被使用，需要重新采集和传输，费时费力，音频质量差，大幅度降低了音频数据的传输效率；因此提出一种基于用户特征的音频数据传输分析方法及系统来提高音频特征的传输质量，减少丢包和重组误差的发生。

技术实现思路

1、本专利技术克服了现有技术的不足，提供了一种基于用户特征的音频数据传输分析方法及系统。

2、为达上述目的，本专利技术采用的技术方案为：

3、本专利技术第一方面提供了一种基于用户特征的音频数据传输分析方法，包括以下步骤：

4、获取用户的初始音频数据，将所述初始音频数据划分出多个音频分帧时间片段，并计算多个所述音频分帧时间片段的倒谱系数，生成用户的初始音频特征；

5、引入隐马尔可夫模型以及viterbi算法计算所述用户的初始音频特征与实际音频特征之间的序列差异，得到状态序列差异分数；

6、若所述状态序列差异分数小于预设状态差异分数时，分析音频接收设备未执行拥塞避免控制机制情况下拥塞重组的初始音频数据包时间戳是否存在序列误差，得到第一传输异常分析结果；

7、在所述状态序列差异分数小于预设状态差异分数情况下，若音频接收设备已执行拥塞避免控制机制时，计算初始音频数据包拥塞传输的随机丢包量，并引入循环冗余校验法对所述随机丢包量是否出现冗余丢包误差进行检验，得到第二传输异常分析结果；

8、基于所述第一传输异常分析结果和所述第二传输异常分析结果对用户的初始音频特征误差进行计算修正，生成用户音频特征的修正方案。

9、进一步的，本专利技术的一个较佳的实施例中，所述获取用户的初始音频数据，将所述初始音频数据划分出多个音频分帧时间片段，并计算多个所述音频分帧时间片段的倒谱系数，生成用户的初始音频特征，具体包括以下步骤：

10、通过音频录制设备对用户的输出音频进行采集，获取用户的初始音频数据，并将所述用户的音频数据存储至音频录制设备的储存库中；

11、引入短时傅里叶变换算法对所述用户的初始音频数据进行分帧处理，在时域中将初始音频数据划分为若干个时间窗口，并通过汉宁窗对每个所述时间窗口进行加窗处理，使得汉宁窗函数乘以每个所述时间窗口中的音频数据，得到多个加窗后的时间窗口；

12、对多个所述加窗后的时间窗口内的初始音频数据进行傅里叶变换，得到多个瞬时频谱数据，重叠多个所述瞬时频谱数据并平滑贴合处理，得到多个音频分帧时间片段；

13、构建一组梅尔滤波器，同时获取每组所述梅尔滤波器的梅尔频率，根据多个所述梅尔频率绘制梅尔刻度表，将每个所述音频分帧时间片段映射至所述梅尔刻度表上进行滤波处理，得到多个音频滤波信号值；

14、基于梅尔频率倒谱系数对多个所述音频滤波信号值取对数压缩，得到多个滤波信号对数刻度，将多个所述滤波信号对数刻度进行离散余弦变换，生成多个音频倒谱系数；

15、剔除低于预设倒谱系数的所述音频倒谱系数，最终将剩余的所述音频倒谱系数合并输出，得到用户的初始音频特征。

16、进一步的，本专利技术的一个较佳的实施例中，所述引入隐马尔可夫模型以及viterbi算法计算所述用户的初始音频特征与实际音频特征之间的序列差异，得到状态序列差异分数，具体包括以下步骤：

17、通过音频接收设备将所述用户的初始音频特征进行传输输出，生成用户的实际音频特征；其中，所述用户的音频特征包括音色、音调、音量以及语速；

18、基于隐马尔科夫模型判断所述初始音频特征与所述实际音频特征之间的差异，获取所述隐马尔科夫模型中定义完成的状态转移概率和观测概率；

19、根据状态转移概率对所述初始音频特征以及所述实际音频特征的序列动态变化概率进行分析，得到第一动态序列变化和第二动态序列变化，通过观测概率分析不同状态下所述初始音频特征以及所述实际音频特征的分布点位，得到第一特定分布概率和第二特定分布概率；

20、合并所述第一动态序列变化与所述第一特定分布概率并表达，生成初始音频特征序列；将所述第二动态序列变化与所述第二特定分布概率进行合并表达，生成实际音频动态序列；

21、引入viterbi算法遍历并确定所述初始音频特征序列与所述实际音频动态序列中符合预设状态序列的最有可能状态序列，以获取初始隐含状态序列和实际隐含状态序列，最终在viterbi算法中计算所述初始隐含状态序列和所述实际隐含状态序列之间的差异，得到状态序列差异分数。

22、进一步的，本专利技术的一个较佳的实施例中，所述若所述状态序列差异分数大于预设状态差异分数时，分析音频接收设备未执行拥塞避免控制机制情况下拥塞重组的初始音频数据包时间戳是否存在序列误差，得到第一传输异常分析结果，具体包括以下步骤：

23、当所述状态序列差异分数大于预设状态差异分数，则分析音频接收设备传输所述用户的初始音频特征时产生的误差；

24、获取音频接收设备的tcp传输协议和信号传输技术，结合所述tcp传输协议以及所述信号传输技术协同分析是否执行拥塞避免控制机制，若未执行拥塞避免控制机制，则获取若干个初始音频数据包拥塞重组后对应的时间戳；

25、基于时序分析法对所述若干个初始音频数据包拥塞重组后对应的时间戳进行分析，以确定每个时间戳序列的波动系数，同时引入pearson相关系数统计计算每个所述时间戳序列的波动系数的自相关性，得到若干个自相关函数；

26、根据所述每个时间戳序列的波动系数和所述若干个自相关函数构建关系表，得到自相关函数-时间波动表，分析每个自相关函数在所述自相关函数-时间波动表中的分布幅度，提取出所述分布幅度高于峰值幅度阈值的多个自相关函数，并定义为周期性峰值，计算每个所述周期性峰值之间的欧氏距离，得到多个峰值间隔距离；

27、获取初始音频数据中的时间戳帧数，基于所述时间戳帧数来预设峰值间隔范围，判断所述多个所述峰值间隔距离是否处于所述峰值间隔范围内，若不处于，则初始音频数据包重组顺序不正确或冗余，得到第一传输异常分析结果。

28、进一步的，本专利技术的一个较佳的实施例中，所述在所述状态序列差异分数大于预设状态差异分数情况下，若音频接收设备已执行拥塞避免本文档来自技高网...

【技术保护点】

1.一种基于用户特征的音频数据传输分析方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述获取用户的初始音频数据，将所述初始音频数据划分出多个音频分帧时间片段，并计算多个所述音频分帧时间片段的倒谱系数，生成用户的初始音频特征，具体包括以下步骤：

3.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述引入隐马尔可夫模型以及Viterbi算法计算所述用户的初始音频特征与实际音频特征之间的序列差异，得到状态序列差异分数，具体包括以下步骤：

4.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述若所述状态序列差异分数大于预设状态差异分数时，分析音频接收设备未执行拥塞避免控制机制情况下拥塞重组的初始音频数据包时间戳是否存在序列误差，得到第一传输异常分析结果，具体包括以下步骤：

5.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述在所述状态序列差异分数大于预设状态差异分数情况下，若音频接收设备已执行拥塞避

6.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述基于所述第一传输异常分析结果和所述第二传输异常分析结果对用户的初始音频特征误差进行计算修正，生成用户音频特征的修正方案，具体包括以下步骤：

7.一种基于用户特征的音频数据传输分析系统，其特征在于，所述一种基于用户特征的音频数据传输分析系统包括存储器与处理器，所述存储器中储存一种基于用户特征的音频数据传输分析方法程序，所述一种基于用户特征的音频数据传输分析方法程序被所述处理器执行时，实现以下步骤：

8.根据权利要求7所述的一种基于用户特征的音频数据传输分析系统，其特征在于，所述基于所述第一传输异常分析结果和所述第二传输异常分析结果对用户的初始音频特征误差进行计算修正，生成用户音频特征的修正方案，具体包括以下步骤：

...

【技术特征摘要】

1.一种基于用户特征的音频数据传输分析方法，其特征在于，包括以下步骤：

3.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述引入隐马尔可夫模型以及viterbi算法计算所述用户的初始音频特征与实际音频特征之间的序列差异，得到状态序列差异分数，具体包括以下步骤：

5.根据权利要求1所述的一种基于用户特征的音频数据传输分析方法，其特征在于，所述在所述状态序列差异分数大于预设...

【专利技术属性】
技术研发人员：黄洪平，邓胜丰，白启昊，
申请(专利权)人：深圳市齐奥通信技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人