语音场景识别装置、方法、存储介质及电子设备制造方法及图纸

技术编号：43866002 阅读：13 留言：0更新日期：2024-12-31 18:52

本申请公开一种语音场景识别装置、方法、存储介质及电子设备，属于音频技术领域。装置至少用于：响应于用户语音指令的输入，使用预处理模块对用户语音信息进行处理；以及，使用大模型对处理后的用户语音信息进行二次处理，生成半结构化数据和/或结构化数据；以及，使用场景数据库模块基于半结构化数据和/或结构化数据检索场景数据库，生成场景数据；以及，至少在半结构化数据和/或结构化数据满足预设条件后，使用大模型基于场景数据、以及半结构化数据和/或结构化数据生成结构化场景数据。本申请至少能够在采集长尾场景数据时，在场景数据库和用户语音信息的基础上生成长尾场景数据，利于提升长尾场景数据收集的全面性、实时性和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及音频，尤其涉及一种语音场景识别装置、方法、存储介质及电子设备。

技术介绍

1、当前，自动驾驶需要采集数量庞大的数据(例如车辆状态、道路情况、驾驶习惯等)，并且自动驾驶需在各种复杂场景(比如城市道路、高速公路、乡村小路等)中运行，不同场景下自动驾驶所需数据的采集规则存在差异，这增加了数据采集的难度。同时，自动驾驶还需获取大量的长尾场景数据以提升自动驾驶算法的泛化能力，但大量的长尾场景对于单车自动驾驶来说是可遇而不可及的。怎样能够在车辆遇到长尾场景时，快速捕获该长尾场景并记录相关场景数据，是当前数据采集的挑战。

2、目前，现有通用的场景数据采集触发方式有两种：一种是车辆感知自动触发，另一种是手动触发(例如触摸屏、键盘输入等)。然而，上述车辆感知自动触发的方式缺乏全面覆盖的场景描述内容，收集内容不够全面；上述手动触发方式则存在触发不及时、触发效率偏低等问题。

技术实现思路

1、本专利技术实施例提供一种语音场景识别装置、方法、存储介质及电子设备，以至少解决现有自动驾...

【技术保护点】

1.一种语音场景识别装置，其特征在于，所述语音场景识别装置至少用于：

2.根据权利要求1所述的语音场景识别装置，其特征在于，所述语音场景识别装置还用于，在所述语音场景识别装置开启后，响应于每次所述用户语音指令的获取，更改所述语音场景识别装置对所述用户语音信息的收集状态。

3.根据权利要求1所述的语音场景识别装置，其特征在于，所述语音场景识别装置还用于，将所述结构化场景数据输入所述场景数据库。

4.根据权利要求1所述的语音场景识别装置，其特征在于，所述预处理模块至少包括文本转换模块；

5.根据权利要求4所述的语音场景识别装置，其特征在于，所述...

【技术特征摘要】

1.一种语音场景识别装置，其特征在于，所述语音场景识别装置至少用于：

3.根据权利要求1所述的语音场景识别装置，其特征在于，所述语音场景识别装置还用于，将所述结构化场景数据输入所述场景数据库。

4.根据权利要求1所述的语音场景识别装置，其特征在于，所述预处理模块至少包括文本转换模块；

5.根据权利要求4所述的语音场景识别装置，其特征在于，所述大模型至少包括数据处理模块、注意力模块和融合模块；

6.根据权利要求5所述的...

【专利技术属性】
技术研发人员：周鹏，
申请(专利权)人：中国第一汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人