智能语音识别交互方法及系统技术方案

技术编号：44494792 阅读：24 留言：0更新日期：2025-03-04 18:01

本发明专利技术公开了一种智能语音识别交互方法及系统，通过建立云平台与用户客户端的网络连接，实时传输用户音频数据与网络状态信息。根据网络状态划分传输时间段并设定等级，对音频数据进行相应划分。利用语音识别模型识别音频特征，并通过自编码网络重构特征向量，计算音频特征相似度。基于状态等级与相似度设定数据可信度并作为权值，从实时音频中提取出第二音频传输数据。构建GAN生成模型并导入第二音频数据进行特征学习，生成用户音频训练数据，用于训练语音识别模型，有效提高音频识别效果，提高语音识别平台的交互效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音分析领域，更具体的，涉及智能语音识别交互方法及系统。

技术介绍

1、随着语音识别技术的不断发展，语音识别技术已经被广泛地应用于会议系统中，从而实现对会议内容的自动记录以及后续处理。然而，现有的会议语音识别系统在进行语音识别时，仍然存在着一些不足。在会议实时传输与音频分析中，会议系统(或云平)需要对大量的音频数据进行实时分析与用户标识，该过程需要对音频数据进行快速、高效地识别，传统音频交互分析技术往往基于简单的音频识别模型，识别准确率低，导致对用户音频数据的分类效果较差，且缺少对实时产生的音频数据进行有效数据挖掘与音频识别模型训练优化的过程，还缺少相应的训练数据，从而导致相应的音频数据识别与系统数据的录入存在错误情况，降低了音频分析平台的分析效率。因此，目前亟需一种智能化的音频数据分析与相应提升交互体验的方法。

技术实现思路

1、本专利技术克服了现有技术的缺陷，提出了智能语音识别交互方法及系统。

2、本专利技术第一方面提供了一种智能语音识别交互方法，包括：>

3、对云平台本文档来自技高网...

【技术保护点】

1.一种智能语音识别交互方法，其特征在于，包括：

2.根据权利要求1所述的一种智能语音识别交互方法，其特征在于，所述对云平台与用户客户端建立网络连接，并应用于用户网络会议过程，通过实时网络传输，在一个分析周期内，获取用户客户端的音频传输数据，具体为：

3.根据权利要求2所述的一种智能语音识别交互方法，其特征在于，所述通过实时网络传输，获取所述一个分析周期内的网络传输状态信息，基于网络状态划分出多个传输时间段，并对多个传输时间段设定状态等级，基于多个传输时间段对音频传输数据进行相应数据划分，形成多个音频数据段，具体为：

4.根据权利要求3所述的一种智能语...

【技术特征摘要】

1.一种智能语音识别交互方法，其特征在于，包括：

4.根据权利要求3所述的一种智能语音识别交互方法，其特征在于，所述通过语音识别模型对音频数据段进行识别并从系统数据库中提取出用户音频特征，具体为：

5.根据权利要求4所述的一种智能语音识别交互方法，其特征在于，所述对音频数据段进行音频特征提取与特征向量转换，形成音频特征向量数据，通过自编码网络对音频特征向量数据进行数据重构，生成重构特征向量数据，将用户音频特征与重构特征向量数据进行数据相似度计算，得到音频特征相似度，具体为：

6.根据权利要求...

【专利技术属性】
技术研发人员：李勇，
申请(专利权)人：深圳市华讯互通科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人