重复文本的可见即可说车载语音交互方法及可读存储介质技术

技术编号:38017164 阅读:13 留言:0更新日期:2023-06-30 10:43
本发明专利技术属于车载语音交互技术领域,具体涉及重复文本的可见即可说车载语音交互方法及可读存储介质,所述方法通过实时监听以及扫描用户界面的文本信息,并对所述用户界面进行分区形成对应文本信息的区块,在用户与车载系统进行交互的语音请求中包含有重复文本时,实现了对重复文本依据分区进行页面和语音提示,结合多轮语音会话交互,从而让车载系统准确的理解用户想要使用可见即可说功能点击重复文本中的指定一个,提升用户的使用体验。提升用户的使用体验。提升用户的使用体验。

【技术实现步骤摘要】
重复文本的可见即可说车载语音交互方法及可读存储介质


[0001]本专利技术属于车载语音交互
,具体涉及重复文本的可见即可说车载语音交互方法及可读存储介质。

技术介绍

[0002]当前较多车载系统都实现了通过语音控制的可见即可说功能,可见即可说功能简介如下:用户可以看到的车载系统中的文本信息,可以通过语音把文本内容说出来,车载系统中的语音助理会模拟点击到对应的文本内容,帮助用户点击这个按钮,进而实现了用户不用手来点击车载系统中的可点击的按钮的功能;但是,现有的方案仅能实现对页面中没有重复的文本的按钮的控制,对于页面中有重复文本的按钮不能很好的控制,无法准确的匹配用户的实际意图。

技术实现思路

[0003]为了克服现有技术的不足,本专利技术提供重复文本的可见即可说车载语音交互方法及可读存储介质,以解决现有技术的仅能实现对页面中没有重复的文本的按钮的控制,对于页面中有重复文本的按钮不能很好的控制,无法准确的匹配用户的实际意图的问题。
[0004]本专利技术其中一方案提供了一种重复文本的可见即可说车载语音交互方法,所述方法包括:
[0005]获取车载系统的用户界面的文本信息;
[0006]对所述用户界面进行分区形成对应文本信息的区块;
[0007]结合所述文本信息、所述区块的位置信息生成文本集合;
[0008]接收用户与车载系统进行交互的语音请求并转换成第一识别文本;
[0009]通过语义引擎将所述第一识别文本与所述文本集合进行匹配,输出重复文本为第一语义文本;
[0010]语音助理根据所述第一语义文本进行二轮交互,接收用户与车载系统进行交互的语音请求并转换成第二识别文本;
[0011]通过语义引擎将所述第二识别文本与所述文本集合进行匹配,输出与所述第二识别文本匹配的所述重复文本以及位置信息为第二语义文本;
[0012]所述语音助理通过所述第二语义文本获取所述重复文本对应的页面控件并执行模拟点击。
[0013]在本专利技术其中一个优选方案中,所述获取车载系统的用户界面的文本信息,包括:
[0014]语音助理监听用户界面的跳转和用户界面内容的变化;
[0015]扫描变化后的页面中的文本信息,汇集非重复文本信息、重复文本信息。
[0016]在本专利技术其中一个优选方案中,所述方法还包括根据所述用户界面建立参考坐标系,包括:
[0017]以所述用户界面的左上角为原点,以所述用户界面的水平方向为X轴,以所述用户
界面的竖直方向为Y轴,建立参考坐标系;
[0018]基于所述参考坐标系确定所述用户界面中页面控件的坐标位置。
[0019]在本专利技术其中一个优选方案中,所述对所述用户界面进行分区形成对应文本信息的区块,包括:
[0020]以平行于所述X轴的两条水平直线、平行于所述Y轴的两条竖直直线将所述用户界面划分为9个所述区块;
[0021]其中,所述区块包括:左上、中上、右上、左中、正中、右中、左下、中下、右下。
[0022]在本专利技术其中一个优选方案中,所述方法还包括判定重复文本,包括:
[0023]在扫描页面控件时将页面控件携带的文本添加到一个列表中;
[0024]扫描到下一页面控件时,判断列表中是否已有所述页面控件携带的文本;
[0025]若列表中已有相同文本,则标识所述文本为当前用户界面的重复文本。
[0026]在本专利技术其中一个优选方案中,所述方法还包括判定重复文本所在区域,包括:
[0027]获取所述重复文本对应的页面控件的坐标位置;
[0028]根据所述坐标位置计算所述页面控件的中心点坐标;
[0029]判定所述中心点坐标所在的区块,输出所述区块为所述重复文本的区块。
[0030]在本专利技术其中一个优选方案中,所述通过语义引擎将所述第一识别文本与所述文本集合进行匹配,当所述第一识别文本不包含重复文本时,所述方法还包括:
[0031]获取所述第一识别文本中的非重复文本;
[0032]输出非重复文本以及对应所述非重复文本的区块的位置信息为第三语义文本;
[0033]基于所述第三语义文本,获取对应所述非重复文本的页面控件;
[0034]对所述页面控件执行模拟点击,实现可见即可说。
[0035]在本专利技术其中一个优选方案中,所述语音助理根据所述第一语义文本进行二轮交互包括:
[0036]所述语音助理通过语音提示说明所述重复文本的区块的位置信息;
[0037]所述语音助理接收含有明确位置信息的语音请求并转换为第二识别文本。
[0038]在本专利技术其中一个优选方案中,所述语音助理根据所述第一语义文本进行二轮交互还包括:
[0039]在用户界面的所述重复文本上方增加对应所述重复文本的区块的标识。
[0040]在本专利技术其中一个优选方案中还指出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现以上方案中任意一项所述的重复文本的可见即可说车载语音交互方法。
[0041]本专利技术以上方案所提供的一种重复文本的可见即可说车载语音交互方法及可读存储介质具有以下有益效果:
[0042]1、本专利技术提出的一种重复文本的可见即可说车载语音交互方法,通过实时监听以及扫描用户界面的文本信息,并对所述用户界面进行分区形成对应文本信息的区块,实现了对重复文本依据分区进行页面和语音提示,结合多轮语音会话交互,以让车载系统准确的理解用户想要使用可见即可说功能点击重复文本中的指定一个,提升用户的使用体验。
附图说明
[0043]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0044]图1表示本专利技术其中一实施例的重复文本的可见即可说车载语音交互方法的流程示意图;
[0045]图2表示本专利技术其中一实施例的获取车载系统的用户界面的文本信息的流程示意图;
[0046]图3表示本专利技术其中一实施例的交互方法在用户界面的应用示意图;
[0047]图4表示本专利技术其中一实施例的交互方法在用户界面的应用示意图;
[0048]图5表示本专利技术其中一实施例的交互方法的逻辑图。
具体实施方式
[0049]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0050]需要说明,若本专利技术实施例中有涉及方向性指示(诸如上、下、左、右、前、后
……
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种重复文本的可见即可说车载语音交互方法,其特征在于,所述方法包括:获取车载系统的用户界面的文本信息;对所述用户界面进行分区形成对应文本信息的区块;结合所述文本信息、所述区块的位置信息生成文本集合;接收用户与车载系统进行交互的语音请求并转换成第一识别文本;通过语义引擎将所述第一识别文本与所述文本集合进行匹配,输出重复文本为第一语义文本;语音助理根据所述第一语义文本进行二轮交互,接收用户与车载系统进行交互的语音请求并转换成第二识别文本;通过语义引擎将所述第二识别文本与所述文本集合进行匹配,输出与所述第二识别文本匹配的所述重复文本以及位置信息为第二语义文本;所述语音助理通过所述第二语义文本获取所述重复文本对应的页面控件并执行模拟点击。2.如权利要求1所述的重复文本的可见即可说车载语音交互方法,其特征在于,所述获取车载系统的用户界面的文本信息,包括:语音助理监听用户界面的跳转和用户界面内容的变化;扫描变化后的页面中的文本信息,汇集非重复文本信息、重复文本信息。3.如权利要求2所述的重复文本的可见即可说车载语音交互方法,其特征在于,所述方法还包括根据所述用户界面建立参考坐标系,包括:以所述用户界面的左上角为原点,以所述用户界面的水平方向为X轴,以所述用户界面的竖直方向为Y轴,建立参考坐标系;基于所述参考坐标系确定所述用户界面中页面控件的坐标位置。4.如权利要求3所述的重复文本的可见即可说车载语音交互方法,其特征在于,所述对所述用户界面进行分区形成对应文本信息的区块,包括:以平行于所述X轴的两条水平直线、平行于所述Y轴的两条竖直直线将所述用户界面划分为9个区块;其中,所述区块包括:左上、中上、右上、左中、正中、右中、左下、中下、右下。5.如权利要求4所述的重复文本的可见即可说车载语音交互方法,其特征在于,所述方法还包...

【专利技术属性】
技术研发人员:张金可冉光伟刘棨邓晨王岳东
申请(专利权)人:星河智联汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1