语音识别方法、装置、设备及介质制造方法及图纸

技术编号:41970131 阅读:26 留言:0更新日期:2024-07-10 16:50
本申请实施例提供一种语音识别方法、装置、设备及介质,语音识别方法,包括:获取语音信息和手势图像,识别语音信息,得到语音信息的准文本信息,并识别手势图像中的手势,得到手势图像对应的手势信息;在语音信息的发声对象和手势的操作对象为同一对象时,对手势信息和准文本信息进行融合处理,得到语音信息对应的目标文本信息。本申请实施例的目标文本信息根据语音信息和手势图像两种信息类型获得,能够有效提高语音识别的准确性。

【技术实现步骤摘要】

本申请涉及信息识别,尤其涉及一种语音识别方法、装置、设备及介质


技术介绍

1、在一些互联网交互场景,例如车载、电视、移动终端等应用场景中,通常仅通过语音输入来生成用户文本以识别用户的指令或问题,选用单一的信息识别易导致识别结果的准确率较低。


技术实现思路

1、本申请实施例提供一种语音识别方法、装置、设备及介质,旨在提高语音识别的准确性。

2、本申请实施例提供了一种语音识别方法,包括:

3、获取语音信息和手势图像,

4、识别语音信息,得到语音信息的准文本信息,并识别手势图像中的手势,得到手势图像对应的手势信息;

5、在语音信息的发声对象和手势的操作对象为同一对象时,对手势信息和准文本信息进行融合处理,得到语音信息对应的目标文本信息。

6、根据本申请第一方面的实施方式,在对手势信息和准文本信息进行融合处理,得到语音信息对应的目标文本信息之前,方法还包括:

7、获取发声对象的第一位置信息以及操作对象的第二位置信息;

8、计算第一位本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述对所述手势信息和所述准文本信息进行融合处理,得到所述语音信息对应的目标文本信息之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,根据所述手势信息,对所述准文本信息进行处理,得到所述语音信息对应的目标文本信息之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述识别所述手势图像中的手势,得到所述手势图像对应的手势信息,包括:

6.根据权利要求5所述的方...

【技术特征摘要】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述对所述手势信息和所述准文本信息进行融合处理,得到所述语音信息对应的目标文本信息之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,根据所述手势信息,对所述准文本信息进行处理,得到所述语音信息对应的目标文本信息之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述识别所述手势图像中的手势,得到所述手势图像对应的手势信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述手势信息和所述准文本信息进行融合处理,得到所述语音信息对应的目标文本信息之前,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,接收用户对所述提示信息的第一操作之后,所述方法还包括:

8.根据权利要求5所述的方法,其特征在于,所述识别所述手势图像中的...

【专利技术属性】
技术研发人员:王孝元江会星陈伟
申请(专利权)人:北京罗克维尔斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1