一种语音交互方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37390985 阅读:26 留言:0更新日期:2023-04-27 07:29
本发明专利技术公开了一种语音交互方法、装置、电子设备和存储介质。其中,该方法包括:根据交互操作界面的界面图片确定至少一个待交互元素,基于预设配置文件播放所述待交互元素的辅助操作语音,根据对应所述辅助操作语音的用户交互语音生成元素触发信息,根据所述元素触发信息控制所述待交互元素执行业务功能。本发明专利技术实施例通过将交互操作界面的待交互元素转换成能够以语音形式播放给用户的辅助操作语音,协助用户执行相应的业务功能,提高了语音语义识别精度以及用户的行车安全性和体验效果;同时,语音交互过程中不需要修改软件和平台即可适配大量的应用软件和各种操作系统,具有较好的通用性和可实施性,有效避免了代码入侵的风险。险。险。

【技术实现步骤摘要】
一种语音交互方法、装置、电子设备和存储介质


[0001]本专利技术涉及计算机应用
,尤其涉及一种语音交互方法、装置、电子设备和存储介质。

技术介绍

[0002]随着语音技术和汽车智能化的飞速发展,基于用户界面(User Interface,UI)的语音交互技术逐渐受到人们的青睐。在车载领域中,用户可以通过语音交互技术,无接触地实现对车辆上的车载系统或者车载系统安装的第三方应用程序的控制,并且不需要占用用户的视线,因此,研究语音交互技术对于提高驾驶安全具有重要意义。
[0003]然而,目前的语音交互方法还存在以下不足之处:
[0004]1、现有的语音交互方法中用户可能需要先看到用户界面内容,才会做出语音交互的请求,这需要短暂占用用户的视觉注意力,同时对于用户输入的语音请求可能会发生识别错误的情况,因此存在一定的安全风险以及识别精度较低的问题,进而导致用户的体验效果不佳。
[0005]2、现有的语音交互方法在接收到用户的语音请求后,需要调用相应应用程序的语音交互接口才能执行相应的操作,这种语音交互方法需要修改大量的应用程序代码甚至是操作系统,才能适配更多的应用程序,因此存在通用性和可行性较差的问题,并且可能出现代码入侵的风险。

技术实现思路

[0006]本专利技术提供了一种语音交互方法、装置、电子设备和存储介质,以实现直接从交互操作界面的界面图片去确定相应的辅助操作语音,协助用户执行相应的业务功能,提高了语音语义的识别准确性和用户的体验效果,可提升用户的行车驾驶安全;同时,在语音交互过程中不用修改软件和平台即可适配大量的应用软件和各种操作系统,具有较好的通用性和可实施性。
[0007]根据本专利技术的一方面,提供了一种语音交互方法,其中,该方法包括:
[0008]根据交互操作界面的界面图片确定至少一个待交互元素;
[0009]基于预设配置文件播放待交互元素的辅助操作语音;
[0010]根据对应辅助操作语音的用户交互语音生成元素触发信息;
[0011]根据元素触发信息控制待交互元素执行业务功能。
[0012]根据本专利技术的另一方面,提供了一种语音交互装置,包括:
[0013]元素识别模块,用于根据交互操作界面的界面图片确定至少一个待交互元素;
[0014]辅助操作模块,用于基于预设配置文件播放待交互元素的辅助操作语音;
[0015]元素触发模块,用于根据对应辅助操作语音的用户交互语音生成元素触发信息;
[0016]业务执行模块,用于根据元素触发信息控制待交互元素执行业务功能。
[0017]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的语音交互方法。
[0021]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的语音交互方法。
[0022]本专利技术实施例的技术方案,通过根据交互操作界面的界面图片确定至少一个待交互元素,基于预设配置文件播放待交互元素的辅助操作语音,根据对应辅助操作语音的用户交互语音生成元素触发信息,根据元素触发信息控制待交互元素执行业务功能。本专利技术实施例通过将交互操作界面的待交互元素转换成能够以语音形式播放给用户的辅助操作语音,用户可以根据辅助操作语音做出针对性的语音交互操作,该过程不需要占用用户的视线,进而提高了行车驾驶的安全性,同时提升了语音语义识别的准确性,使得用户具有较好的体验效果;此外,由于是直接从交互操作界面的界面图片去确定相应的辅助操作语音,因此不需要修改软件和平台即可适配大量的应用软件和各种操作系统,具有较好的通用性和可实施性,避免了代码入侵的风险。
[0023]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0024]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是根据本专利技术实施例一提供的一种语音交互方法的流程图;
[0026]图2是根据本专利技术实施例二提供的一种语音交互方法的流程图;
[0027]图3是根据本专利技术实施例三提供的一种语音交互方法的流程图;
[0028]图4是根据本专利技术实施例三提供的一种音乐播放界面的示例图;
[0029]图5是根据本专利技术实施例四提供的一种语音交互装置的结构示意图;
[0030]图6是实现本专利技术实施例的语音交互方法的电子设备的结构示意图。
具体实施方式
[0031]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0032]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]实施例一
[0034]图1为本专利技术实施例一提供了一种语音交互方法的流程图,本实施例可适用于用户使用语音控制用户界面的情况,该方法可以由语音交互装置来执行,该语音交互装置可以采用硬件和/或软件的形式实现,该语音交互装置可配置于电子设备中,例如,电子设备可以包括车载设备、移动设备等。如图1所示,本实施例一提供的一种语音交互方法,具体包括如下步骤:
[0035]S110、根据交互操作界面的界面图片确定至少一个待交互元素。
[0036]在本专利技术实施例中,交互操作界面可以理解为待交互的当前屏幕上显示的用户界面,交互操作界面可以采用硬件和/或软件的形式实现,可以包括车辆运行状况的显示界面以及第三方应用程序(Application,APP)的显示界面等,交本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:根据交互操作界面的界面图片确定至少一个待交互元素;基于预设配置文件播放所述待交互元素的辅助操作语音;根据对应所述辅助操作语音的用户交互语音生成元素触发信息;根据所述元素触发信息控制所述待交互元素执行业务功能。2.根据权利要求1所述方法,其特征在于,所述根据交互操作界面的界面图片确定至少一个待交互元素,包括:调用预设屏幕截取程序接口截取所述交互操作界面的所述界面图片;按照预训练神经网络模型识别所述界面图片内的所述待交互元素。3.根据权利要求1或2所述方法,其特征在于,所述待交互元素包括以下至少之一:元素类型、文字描述信息、元素位置、元素显示尺寸。4.根据权利要求1所述方法,其特征在于,所述基于预设配置文件播放所述待交互元素的辅助操作语音,包括:按照所述待交互元素的元素类型在所述预设配置文件查找操作提示;生成所述操作提示以及所述待交互元素对应的所述辅助操作语音;控制预设语音播放设备播放所述辅助操作语音。5.根据权利要求4所述方法,其特征在于,所述根据对应所述辅助操作语音的用户交互语音生成元素触发信息,包括:控制预设语音采集设备接收所述用户交互语音;在所述用户交互语音内语音识别交互关键字;将与所述操作提示匹配的所述交互关键字作为所述元素触发信息。6.根据权利要求1所述方法,其特征在于,所述根据...

【专利技术属性】
技术研发人员:古幼鹏
申请(专利权)人:惠州市德赛西威汽车电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1