System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种语音交互方法、装置、电子设备和存储介质。
技术介绍
1、为提升人机交互界面(human machine interface,hmi)的美观度,图标在智能手机、平板电脑以及车载中控大屏等智能设备的界面上得到了广泛的应用。
2、在基于人机交互界面进行语音交互时,用户对于图标的特征描述往往具备极高的主观性和多样性,这使得针对同一个图标可能存在很多差异性的描述方式,这种差异导致语音交互系统难以正确理解和执行用户语音,影响了基于图标的语音交互的成功率。
技术实现思路
1、本专利技术提供一种语音交互方法、装置、电子设备和存储介质,用以解决相关技术中基于图标的语音交互的成功率不高的缺陷。
2、本专利技术提供一种语音交互方法,包括:
3、接收用户语音,并确定在接收所述用户语音时界面显示的各图标控件;
4、基于所述用户语音的转写文本分别与所述各图标控件的图标图片之间的语义匹配度,从所述各图标控件中确定出与所述转写文本相匹配的图标控件;
5、基于所述转写文本,以及与所述转写文本相匹配的图标控件,进行语音交互。
6、根据本专利技术提供的一种语音交互方法,所述基于所述用户语音的转写文本分别与所述各图标控件的图标图片之间的语义匹配度,从所述各图标控件中确定出与所述转写文本相匹配的图标控件,包括:
7、将所述用户语音的转写文本和所述各图标控件的图标图片输入至图文匹配模型,得到所述图文匹配模型
8、所述图文匹配模型基于样本文本和样本图片训练得到。
9、根据本专利技术提供的一种语音交互方法,所述语义匹配度的获取包括:
10、提取所述用户语音的转写文本的语义特征,得到文本语义特征;
11、提取所述图标控件的图标图片的语义特征,得到图片语义特征,所述文本语义特征和所述图片语义特征处于同一特征空间;
12、基于所述文本语义特征与所述图片语义特征之间的相似度,确定所述语义匹配度。
13、根据本专利技术提供的一种语音交互方法,所述图标图片的获取包括:
14、获取与所述图标控件对应的图标图片的存储链接;
15、基于所述存储链接,获取所述图标图片。
16、根据本专利技术提供的一种语音交互方法,所述获取与所述图标控件对应的图标图片的存储链接,包括:
17、从所述图标控件的控件属性中,读取所述图标图片的存储链接。
18、根据本专利技术提供的一种语音交互方法,所述基于所述存储链接,获取所述图标图片,包括:
19、基于所述存储链接,从云端下载所述图标图片,所述云端用于存储各图标控件的图标图片。
20、根据本专利技术提供的一种语音交互方法,所述确定在接收所述用户语音时界面显示的各图标控件,包括:
21、在检测到所述界面发生变化的情况下,扫描所述界面显示的各图标控件,并将在接收所述用户语音时最近一次所述界面发生变化后扫描所得的各图标控件,作为在接收所述用户语音时界面显示的各图标控件。
22、根据本专利技术提供的一种语音交互方法,所述确定在接收所述用户语音时界面显示的各图标控件,之前还包括:
23、在语音交互过程中,检测所述界面是否发生变化。
24、根据本专利技术提供的一种语音交互方法,所述基于所述转写文本,以及与所述转写文本相匹配的图标控件,进行语音交互,包括:
25、基于所述转写文本,以及与所述转写文本相匹配的图标控件的控件标识,生成与所述用户语音对应的控制指令;
26、基于所述控制指令,进行语音交互。
27、根据本专利技术提供的一种语音交互方法,所述基于所述控制指令,进行语音交互,包括:
28、中的控件标识,从所述界面中确定待控制的目标控件;
29、执行所述控制指令所对应的目标控件的控制操作,以实现所述语音交互。
30、本专利技术还提供一种语音交互装置,包括:
31、获取单元,用于接收用户语音,并确定在接收所述用户语音时界面显示的各图标控件;
32、匹配单元,用于基于所述用户语音的转写文本分别与所述各图标控件的图标图片之间的语义匹配度,从所述各图标控件中确定出与所述转写文本相匹配的图标控件;
33、交互单元,用于基于所述转写文本,以及与所述转写文本相匹配的图标控件,进行语音交互。
34、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音交互方法。
35、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音交互方法。
36、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音交互方法。
37、本专利技术提供的语音交互方法、装置、电子设备和存储介质,基于用户语音的转写文本分别与各图标控件的图标图片之间的语义匹配度,从各图标控件中确定出与转写文本相匹配的图标控件,能够支持高自由度的、灵活多样的图标控件的指代描述方式。在此基础上,结合转写文本以及与转写文本相匹配的图标控件,进行语音交互,能够有效保障语音交互的成功率。
本文档来自技高网...【技术保护点】
1.一种语音交互方法,其特征在于,包括:
2.根据权利要求1所述的语音交互方法,其特征在于,所述基于所述用户语音的转写文本分别与所述各图标控件的图标图片之间的语义匹配度,从所述各图标控件中确定出与所述转写文本相匹配的图标控件,包括:
3.根据权利要求1所述的语音交互方法,其特征在于,所述语义匹配度的获取包括:
4.根据权利要求1所述的语音交互方法,其特征在于,所述图标图片的获取包括:
5.根据权利要求4所述的语音交互方法,其特征在于,所述获取与所述图标控件对应的图标图片的存储链接,包括:
6.根据权利要求4所述的语音交互方法,其特征在于,所述基于所述存储链接,获取所述图标图片,包括:
7.根据权利要求1所述的语音交互方法,其特征在于,所述确定在接收所述用户语音时界面显示的各图标控件,包括:
8.根据权利要求8所述的语音交互方法,其特征在于,所述确定在接收所述用户语音时界面显示的各图标控件,之前还包括:
9.根据权利要求1至8中任一项所述的语音交互方法,其特征在于,所述基于所述转写文本,
10.根据权利要求9所述的语音交互方法,其特征在于,所述基于所述控制指令,进行语音交互,包括:
11.一种语音交互装置,其特征在于,包括:
12.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至10任一项所述语音交互方法。
13.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10任一项所述语音交互方法。
14.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10任一项所述语音交互方法。
...【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:
2.根据权利要求1所述的语音交互方法,其特征在于,所述基于所述用户语音的转写文本分别与所述各图标控件的图标图片之间的语义匹配度,从所述各图标控件中确定出与所述转写文本相匹配的图标控件,包括:
3.根据权利要求1所述的语音交互方法,其特征在于,所述语义匹配度的获取包括:
4.根据权利要求1所述的语音交互方法,其特征在于,所述图标图片的获取包括:
5.根据权利要求4所述的语音交互方法,其特征在于,所述获取与所述图标控件对应的图标图片的存储链接,包括:
6.根据权利要求4所述的语音交互方法,其特征在于,所述基于所述存储链接,获取所述图标图片,包括:
7.根据权利要求1所述的语音交互方法,其特征在于,所述确定在接收所述用户语音时界面显示的各图标控件,包括:
8.根据权利要求8所述的语音交互方法,其特征在于,所述确定在接收所述...
【专利技术属性】
技术研发人员:肖建辉,刘俊峰,雷琴辉,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。