语音语义解析方法、设备及存储介质技术

技术编号：45837239 阅读：7 留言：0更新日期：2025-07-15 22:43

本申请公开语音语义解析方法、设备及存储介质，该方法包括：确定对应逐帧输入语音的实时语音识别结果；将实时语音识别结果和上下文信息输入至语义完整性判别模型，以判断实时语音识别结果是否构成完整语义单元；在检测到实时语音识别结果构成完整语义单元的情况下，基于流式语义解析引擎和上下文信息确定实时语音识别结果所对应的实时语义解析结果。由此，通过引入逐帧实时语音识别机制与语义完整性判别模型，打破了传统语音处理系统中分阶段依赖和等待的处理链路，实现了语音识别与语义解析之间更紧密的动态协同。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种语音语义解析方法、设备、存储介质及程序产品。

技术介绍

1、当前大多数语音识别与语义解析系统采用串行处理架构，将整个任务分为多个独立的处理阶段。首先，系统对输入的语音信号进行预处理和声学特征提取，随后由声学模型转换为初步的文字或音素序列。接下来，系统利用语言模型进行词序列校正，并通过后续的语义解析模块来提取和理解文本中的深层含义。

2、这种串行的处理流程意味着各模块之间是依次独立执行的，每个阶段必须等待前一阶段的全部处理完成后才能开始下一步工作，从而在数据传递和模块切换时引入了不可避免的缓冲延迟。

3、另一方面，为了提高系统整体的鲁棒性和识别准确率，一些语音识别系统在处理过程中依赖批处理技术，即在用户输入一定量的数据后，再将整段语音进行统一处理。批处理技术通常需要预先设定固定的时间窗口来收集语音数据，这在一定程度上保证了数据的完整性，但也使得系统无法做到真正的实时处理。用户的语音信息必须等到一个完整窗口结束后才能进入下一步处理，导致响应延时显著。

4、因此，在串行与批处...

【技术保护点】

1.一种语音语义解析方法，包括：

2.根据权利要求1所述的方法，其中，所述确定对应逐帧输入语音的实时语音识别结果，包括：

3.根据权利要求1所述的方法，其中，所述基于流式语义解析引擎和所述上下文信息确定所述实时语音识别结果所对应的实时语义解析结果，包括：

4.根据权利要求3所述的方法，其中，在获取所述上下文信息所对应的至少一个领域语义槽之后，所述方法还包括：

5.根据权利要求1所述的方法，其中，在基于流式语义解析引擎和所述上下文信息确定所述实时语音识别结果所对应的实时语义解析结果之后，所述方法还包括：

6.根据权利要求1所述的方...

【技术特征摘要】

1.一种语音语义解析方法，包括：

2.根据权利要求1所述的方法，其中，所述确定对应逐帧输入语音的实时语音识别结果，包括：

3.根据权利要求1所述的方法，其中，所述基于流式语义解析引擎和所述上下文信息确定所述实时语音识别结果所对应的实时语义解析结果，包括：

4.根据权利要求3所述的方法，其中，在获取所述上下文信息所对应的至少一个领域语义槽之后，所述方法还包括：

6.根据权利要求1所述的方法，其中，所述语义完整性判别模型采用基于transformer架构的预训练语言模型，所述预...

【专利技术属性】
技术研发人员：石韡斯，樊帅，赵昱，朱成亚，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人