一种多轮语音交互导航方法及系统技术方案

技术编号：14548069 阅读：67 留言：0更新日期：2017-02-04 19:43

本发明专利技术公开了一种多轮语音交互导航方法及系统，方法包括：接收用户发送的语音信号；根据所述语音信号得到用户输入的POI地址；根据所述POI地址进行检索，得到检索结果；将所述检索结果进行反馈，等待用户下一次语音信号；根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完成导航。上述方法基于多轮语音交互，能够实现全语音交互过程，无需用户手动操作。本发明专利技术中的系统包括，语音识别模块，查询模块，显示输出模块和语音交互模块，本系统能够提供更多维的目的地选择方案，更佳的用户体验。同时采用聚类算法，减少用户选择的余地，使系统更加智能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音方法，特别涉及多轮语音交互导航方法及系统。
技术介绍
抬头显示器HUD(HeadUpDisplay)，是普遍运用在航空器上的飞行辅助仪器。抬头的意思是指飞行员不需要低头就能够看到他需要的重要资讯。因为HUD的方便性以及能够提高飞行安全，民航机也纷纷跟进安装。HUD是利用光学反射的原理，将重要的飞行相关资讯投射在一片玻璃上面。这片玻璃位於座舱前端，高度大致与飞行员的眼睛成水平，投射的文字和影像调整在焦距无限远的距离上面，飞行员透过HUD往前方看的时候，不会妨碍到眼睛的运作，维持清晰的显示。HUD的基本架构包含两个部分：资料处理单元与影像显示装置。资料处理单元是将飞机上各系统的资料整合处理之後，根据选择的模式转换成预先设定的符号，图形或者是以文字或者是数字的型态输出。有些产品将讯号处理与影像输出分成两个装置，不过大致上都是类似的工作方式。影像显示装置就是安装在座舱前方，位于飞行员与座舱罩之间的空间上。影像显示装置接收来自资料处理装置的资讯，投射在玻璃上面。显示装置并且附有控制面板，能够调解或者是改变输出的影像。新一代的HUD在影像显示方面的改良包括采用全像摄影(Holographic)显示方式，扩大显示影像的范围，尤其是增加水平上的视野角度，减少支架的厚度对於视野的限制与影响，增强不同光度与外在环境下的显示调整，强化影像的清晰度，与其他光学影像输出的配合，譬如说能够将红外线影像摄r>影机产生的飞机前方影像直接投射到HUD上，与其他的资料融合显示，配合夜视镜的使用以及采用彩色影像显示资料。在资料处理单元上的改良包括提高处理的速率和效率,HUD是将影像投射在座舱前方的固定装置上，当飞行员转动头部的时候，这些影像就会暂时离开他的视野范围。新一代的HUD更适合广泛地运用在汽车上。在人们的固有观念里，驾驶最应该注重的自然是安全，不过随着智能手机的普及，手机用户们无时无刻不依赖手机带来的便利和快捷。电话、短信、微信的实时沟通，多媒体的使用，地图导航工具等等这些，然而在“低头族”日益增多的今天，手机带给我们的便利却极大的影响了驾驶的安全性。多种形式的交通事故都是由于车主在驾驶过程中由于使用手机而造成的。汽车厂商们开始意识到中控屏幕的重要性，再加上车辆作为最大的终端设备，更让车上的这块“屏”成为了兵家必争之地。然而车载中控屏幕的存在确实让驾驶变得更为安全了，但在实际体验中，依然有车载中控屏幕上的各项弊端和不方便之处，依然会让驾驶员分心。目前，在主流的地图类APP中，进行语音交互式搜索的方式基本都是单轮的交互，即用户发出目的地查询的指令，如“导航去天安门”或“去附近的肯德基”等，设备接受指令后需要用户手动的去进行点击选择，甚至可能需要进行翻页操作。这种交互方式的缺点一是交互不连贯，需要用户进行语音、手动选择等多重动作；二是当在开车的环境下，司机很容易分心，造成安全隐患。
技术实现思路
本专利技术要解决的技术问题是，基于多轮语音交互的对话式导航选择方法，该方法基于用户的语音输入，记录用户的各种状态，不断的引导用户，直到选择出正确的目的地。解决上述技术问题，本专利技术提供了一种多轮语音交互导航方法，包括：接收用户发送的语音信号；根据所述语音信号得到用户输入的POI地址；根据所述POI地址进行检索，得到检索结果；将所述检索结果进行反馈，等待用户下一次语音信号；根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完成导航。所述用户输入的POI地址包括：目的地名称、所属类别、目的地经度纬度、目的地附近商业信息，所述POI地址根据用户的同样意思的不同表述方式的自然语音信息进行语义解析后得到。所述检索结果根据所述POI地址进行聚类，根据所述POI地址中的目的地名称选择出中心位置目的地，将距离所述中心位置目的地的最大或者最小位置作为有效地址；对所述有效地址进行反馈输出。根据所述POI地址中的目的地经度纬度选择出中心位置目的地。所述反馈输出按照列表形式或者对所述POI点的自定义进行下一次语音选择。根据所述用户输入的POI地址中的目的地附近的商业信息进行聚类，获取所述目的地附近商业信息，根据所述附近商业信息的热点或者HUD中的行车记录进行匹配抽样出核心点；所述核心点和其邻居点通过聚类形成簇，在所述簇中如果出现多个点都是核心点，则以这些核心点为中心的簇要合并；合并后对所述核心点和其邻居点进行聚类。所述检索结果根据所述POI地址进行k-means聚类、k-modes聚类、CURE聚类、k-medoids聚类、DBSCAN聚类、STING聚类。所述语音信号按照多轮进行交互，所述语音信号由至少一个用户发出，并储存至云端服务器。通过所述语音信号记录用户的操作习惯，并根据所述操作习惯进行建立操作学习模型后反馈检索结果；通过反馈的检索结果，分轮次引导用户选择出定位出目的地；通过调用地图服务进行POI地址的检索。本专利技术还提出了一种多轮语音交互导航系统，包括：语音识别模块，用以接收用户发送的语音信号；查询模块，用以根据所述语音信号得到用户输入的POI地址；显示输出模块，用以根据所述POI地址进行检索，得到检索结果；语音交互模块，用以将所述检索结果进行反馈，等待用户下一次语音信号；根据所述下一次语音信号，在所述反馈的结果中选择定位出目地，完成导航。本专利技术的有益效果：1)由于本专利技术中的多轮语音交互导航方法，接收用户发送的语音信号；根据所述语音信号得到用户输入的POI地址；根据所述POI地址进行检索，得到检索结果；将所述检索结果进行反馈，等待用户下一次语音信号；根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完成导航。通过上述步骤，能够实现全语音交互过程，无需用户手动操作。2)所述POI地址根据用户的同样意思的不同表述方式的自然语音信息进行语义解析后得到。并且采用上述基于中心位置的聚类算法，减少用户选择的余地，使操作方法更加智能。3)通过用户输入的POI地址，包括，目的地名称、所属类别、目的地经度纬度、目的地附近商业信息，能够更多维的目的地选择方案，更佳的用户体验。附图说明图1是本专利技术一实施例中一种基于HUD的多轮语音交互导航方法的操作流程示意图。图2是图1中的根据所述POI地址进行检索并得到检索结果的具体实现方法示意图。图本文档来自技高网...

【技术保护点】
一种多轮语音交互导航方法，其特征在于包括：接收用户发送的语音信号；根据所述语音信号得到用户输入的POI地址；根据所述POI地址进行检索，得到检索结果；将所述检索结果进行反馈，等待用户下一次语音信号；根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完成导航。

【技术特征摘要】
1.一种多轮语音交互导航方法，其特征在于包括：
接收用户发送的语音信号；
根据所述语音信号得到用户输入的POI地址；
根据所述POI地址进行检索，得到检索结果；
将所述检索结果进行反馈，等待用户下一次语音信号；
根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完
成导航。
2.根据权利要求1所述的多轮语音交互导航方法，其特征在于，所述用
户输入的POI地址包括：目的地名称、所属类别、目的地经度纬度、目的地
附近商业信息，所述POI地址根据用户的同样意思的不同表述方式的自然语
音信息进行语义解析后得到。
3.根据权利要求1所述的多轮语音交互导航方法，其特征在于，所述检
索结果根据所述POI地址进行聚类，
根据所述POI地址中的目的地名称选择出中心位置目的地，
将距离所述中心位置目的地的最大或者最小位置作为有效地址；
对所述有效地址进行反馈输出。
4.根据权利要求3所述的多轮语音交互导航方法，其特征在于，根据所
述POI地址中的目的地经度纬度选择出中心位置目的地。
5.根据权利要求3所述的多轮语音交互导航方法，其特征在于，所述反
馈输出按照列表形式或者对所述POI点的自定义进行下一次语音选择。
6.根据权利要求2所述的多轮语音交互导航方法，其特征在于，根据所
述用户输入的POI地址中的目的地附近的商业信息进行聚类，
获取所述目的地附近商业信息，根据所述附近商业信息的热点或者HUD
中的行车记录进行匹...

【专利技术属性】
技术研发人员：宋明凯，陈涛，沈峥嵘，王艳龙，
申请(专利权)人：北京乐驾科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人