重复文本的可见即可说车载语音交互方法及可读存储介质技术

技术编号：38017164 阅读：13 留言：0更新日期：2023-06-30 10:43

本发明专利技术属于车载语音交互技术领域，具体涉及重复文本的可见即可说车载语音交互方法及可读存储介质，所述方法通过实时监听以及扫描用户界面的文本信息，并对所述用户界面进行分区形成对应文本信息的区块，在用户与车载系统进行交互的语音请求中包含有重复文本时，实现了对重复文本依据分区进行页面和语音提示，结合多轮语音会话交互，从而让车载系统准确的理解用户想要使用可见即可说功能点击重复文本中的指定一个，提升用户的使用体验。提升用户的使用体验。提升用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
重复文本的可见即可说车载语音交互方法及可读存储介质

[0001]本专利技术属于车载语音交互
，具体涉及重复文本的可见即可说车载语音交互方法及可读存储介质。

技术介绍

[0002]当前较多车载系统都实现了通过语音控制的可见即可说功能，可见即可说功能简介如下：用户可以看到的车载系统中的文本信息，可以通过语音把文本内容说出来，车载系统中的语音助理会模拟点击到对应的文本内容，帮助用户点击这个按钮，进而实现了用户不用手来点击车载系统中的可点击的按钮的功能；但是，现有的方案仅能实现对页面中没有重复的文本的按钮的控制，对于页面中有重复文本的按钮不能很好的控制，无法准确的匹配用户的实际意图。

技术实现思路

[0003]为了克服现有技术的不足，本专利技术提供重复文本的可见即可说车载语音交互方法及可读存储介质，以解决现有技术的仅能实现对页面中没有重复的文本的按钮的控制，对于页面中有重复文本的按钮不能很好的控制，无法准确的匹配用户的实际意图的问题。
[0004]本专利技术其中一方案提供了一种重复文本的可见即可说车载语音交互方法，所述方法包括：
[0005]获取车载系统的用户界面的文本信息；
[0006]对所述用户界面进行分区形成对应文本信息的区块；
[0007]结合所述文本信息、所述区块的位置信息生成文本集合；
[0008]接收用户与车载系统进行交互的语音请求并转换成第一识别文本；
[0009]通过语义引擎将所述第一识别文本与所述文本集合进行匹配，输出重复文本为第一语义...

【技术保护点】

【技术特征摘要】
1.一种重复文本的可见即可说车载语音交互方法，其特征在于，所述方法包括：获取车载系统的用户界面的文本信息；对所述用户界面进行分区形成对应文本信息的区块；结合所述文本信息、所述区块的位置信息生成文本集合；接收用户与车载系统进行交互的语音请求并转换成第一识别文本；通过语义引擎将所述第一识别文本与所述文本集合进行匹配，输出重复文本为第一语义文本；语音助理根据所述第一语义文本进行二轮交互，接收用户与车载系统进行交互的语音请求并转换成第二识别文本；通过语义引擎将所述第二识别文本与所述文本集合进行匹配，输出与所述第二识别文本匹配的所述重复文本以及位置信息为第二语义文本；所述语音助理通过所述第二语义文本获取所述重复文本对应的页面控件并执行模拟点击。2.如权利要求1所述的重复文本的可见即可说车载语音交互方法，其特征在于，所述获取车载系统的用户界面的文本信息，包括：语音助理监听用户界面的跳转和用户界面内容的变化；扫描变化后的页面中的文本信息，汇集非重复文本信息、重复文本信息。3.如权利要求2所述的重复文本的可见即可说车载语音交互方法，其特征在于，所述方法还包括根据所述用户界面建立参考坐标系，包括：以所述用户界面的左上角为原点，以所述用户界面的水平方向为X轴，以所述用户界面的竖直方向为Y轴，建立参考坐标系；基于所述参考坐标系确定所述用户界面中页面控件的坐标位置。4.如权利要求3所述的重复文本的可见即可说车载语音交互方法，其特征在于，所述对所述用户界面进行分区形成对应文本信息的区块，包括：以平行于所述X轴的两条水平直线、平行于所述Y轴的两条竖直直线将所述用户界面划分为9个区块；其中，所述区块包括：左上、中上、右上、左中、正中、右中、左下、中下、右下。5.如权利要求4所述的重复文本的可见即可说车载语音交互方法，其特征在于，所述方法还包...

【专利技术属性】
技术研发人员：张金可，冉光伟，刘棨，邓晨，王岳东，
申请(专利权)人：星河智联汽车科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人