智能终端及其饮食搜寻方法、及无人驾驶车辆技术

技术编号:21435510 阅读:19 留言:0更新日期:2019-06-22 12:57
本申请涉及智能终端技术领域,提供一种智能终端及其饮食搜寻方法、及无人驾驶车辆,在检测到用户表达饮食搜寻的指令时,智能终端获取用户输入的多轮语音信号,接着根据所述多轮语音信号识别所述用户的直观意图,进而根据所述直观意图获取与所述直观意图相关的导航记录、就餐记录、饮食喜好、饮食习惯、附近餐饮信息、热门推荐信息、优惠促销信息、出行便利信息以及当前时间段中的至少两个以上综合因素,最终能够根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息。本申请能够方便用户进行语音搜寻到适合用户的饮食POI,而且不再需要用户进行手动筛选,同时人机交互过程方便自然,操作简单,较大程度地改善了用户体验。

【技术实现步骤摘要】
智能终端及其饮食搜寻方法、及无人驾驶车辆
本申请涉及智能终端
,具体涉及一种基于多轮语音交互的饮食搜寻方法、一种智能终端,以及一种无人驾驶车辆。
技术介绍
全球定位系统(GlobalPositioningSystem,简称GPS)是美国从20世纪70年代开始研制,于1994年全面建成,具有在海、陆、空全方位实时三维导航与定位能力的新一代卫星导航与定位系统。GPS系统不仅可用于测量、导航,还可用于测速、测时。通过GPS接收到的卫星信号准确定位,可以得知车辆的行驶路线、位置、速度、海拔等信息。地理信息系统(GeographicalInformationSystem,简称GIS)从50年代末和60年代初开始出现,是人类在生产实践活动中,为描述和处理相关地理信息而逐渐产生的软件系统。它以计算机为手段,对具有地理特征的空间数据进行处理,以一个空间信息为主线,将其它各种与其有关的空间位置信息结合起来,具有如采集、管理、分析和表达数据等功能。其次,GIS处理的数据都和地理信息有着直接或间接的关系。地理信息是有关地理实体的性质、特征、运动状态的表征和一切有用的知识,而地理数据则是各种地理特征和现象间关系的符号化表示。近年来,GPS技术除了应用在传统的车载防盗反劫装置之外,结合GIS系统、车载导航仪的应用也日趋广泛。随着汽车工业的发展以及汽车电子市场的逐渐成熟,车载导航产品已初具规模。在欧美及日本,此类车载导航仪使用已比较普遍,目前国内GPS汽车导航产品也具有急剧增长的市场趋势。安卓(Android)是基于Linux平台的移动终端操作系统,近年来凭借其开源、高效等优势以及厂商的推动,赢得了广大的用户群体。以安卓为操作系统的移动终端本身绝大多数具有高速的运算处理能力以及GPS功能,在功能的拓展上有着光明的前途。同时,语音识别和人机语音交互也在全面发展,现有的各种语音助手类应用(Application;以下简称:APP),在操作方式上,录音的触发通过按键,录音完毕后,机器播报答案,播报答案时,不能录音。也就是说,现有的语音助手类APP只能进行半双工通信,即机器播报时,用户不能说话,用户说话时,机器不能播报。但是,现有技术中,用户无法利用现有的导航系统直接语音搜寻到目标饮食店,或者手动搜寻的过程中需要用户自己动手去筛选,而且,现有的人机语音交互模式使用起来非常不便,每次一问一答,都需要用户干预,操作繁琐,人机交互方式也很不自然,用户体验度较差。
技术实现思路
本申请的目的在于,提供一种智能终端及其饮食搜寻方法、及无人驾驶车辆,其可以解决上述技术问题,能够方便用户进行语音搜寻到适合用户的饮食POI,而且不再需要用户进行手动筛选,同时人机交互过程方便自然,操作简单,较大程度地改善了用户体验。为解决上述技术问题,本申请提供一种基于多轮语音交互的饮食搜寻方法,所述饮食搜寻方法包括:在检测到用户表达饮食搜寻的指令时,智能终端获取用户输入的多轮语音信号;根据所述多轮语音信号识别所述用户的直观意图;根据所述直观意图获取与所述直观意图相关的导航记录、就餐记录、饮食喜好、饮食习惯、附近餐饮信息、热门推荐信息、优惠促销信息、出行便利信息以及当前时间段中的至少两个以上综合因素;根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息。其中,所述根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息的步骤,具体包括:对多个所述综合因素进行优先级排序,以给出多个POI建议并提供相应的多条导航信息,其中,所述优先级排序包括按饮食喜好优先、按位置最近优先、按优惠促销优先和按出行便利优先。其中,所述在检测到用户表达饮食搜寻的指令时的步骤,具体包括:智能终端根据所述用户的饮食习惯,在所述用户平常饮食的时间段内实时检测是否有语音输入与饮食相关的词句;或,智能终端检测是否有触控输入与饮食相关的词句,其中,与饮食相关的词句包括饿、吃饭、餐厅、请客、聚餐和美食。其中,所述根据所述多轮语音信号识别所述用户的直观意图,具体包括:接收输入的多轮语音信号;分帧提取多轮语音信号的语音特征信息,根据语音特征信息和声学模型生成多轮语音信号的识别结果;根据识别结果和预设静音检测算法初步检测出多轮语音信号的语音端点;计算多轮语音信号的置信度信息;解析多轮语音信号的语义信息;根据置信度信息和语义信息获取多轮语音信号对应的语音解析结果;根据语音解析结果识别出所述用户的直观意图。其中,所述根据语音特征信息和声学模型生成多轮语音信号的识别结果,具体包括:在生成语音特征信息后,采用基于声学模型计算每帧多轮语音信号在每个建模单元上的似然值,通过动态规划算法得到最优状态转移序列及其对应的词序列,并将所得到的最优状态转移序列及其对应的词序列作为识别结果。其中,所述声学模型为基于神经网络的声学模型,采用所述基于神经网络的声学模型对所述语音特征信息进行识别。其中,所述计算多轮语音信号的置信度信息的步骤,具体包括:根据识别结果、多轮语音信号的语音端点和多轮语音信号的信噪比计算多轮语音信号的置信度信息。其中,所述根据识别结果、多轮语音信号的语音端点和多轮语音信号的信噪比计算多轮语音信号的置信度信息,具体包括:基于识别结果,计算语音端点之间的每个词的声学后验概率,其中,计算语音端点之间的第k个词的声学后验概率的公式包括:其中P(X)为多轮语音信号中第k个词的声学后验概率,p(m|x)为第t帧时该词对应建模单元的似然值,为第t帧时所有建模单元的似然值和,T(X)为该词的持续时长;根据语音端点之间的每个词的声学后验概率和信噪比计算每个词对应的置信度信息。其中,所述根据语音端点之间的每个词的声学后验概率和信噪比计算每个词对应的置信度信息,具体包括:基于当前词的声学后验概率和信噪比,计算出当前词的置信度CM(X),公式包括:CM(X)=w*P(X)+(1-w)*SNR(X)其中0≤w≤1,w为权重系数;计算多轮语音信号对应的置信度的公式包括:其中,t(x)表示第n个词的持续时间长,CM(x)表示第n个词的置信度;对每个词对应的置信度进行求和计算,获取得到多轮语音信号的置信度信息。为解决上述技术问题,本申请还提供一种智能终端,所述智能终端包括处理器,所述处理器用于执行程序数据,以实现上述的基于多轮语音交互的饮食搜寻方法的步骤。为解决上述技术问题,本申请还提供一种无人驾驶车辆,设置有处理器,所述处理器执行程序数据时,用于实现上述的基于多轮语音交互的饮食搜寻方法的步骤。本申请智能终端及其饮食搜寻方法、及无人驾驶车辆,在检测到用户表达饮食搜寻的指令时,智能终端获取用户输入的多轮语音信号,接着根据所述多轮语音信号识别所述用户的直观意图,进而根据所述直观意图获取与所述直观意图相关的导航记录、就餐记录、饮食喜好、饮食习惯、附近餐饮信息、热门推荐信息、优惠促销信息、出行便利信息以及当前时间段中的至少两个以上综合因素,最终能够根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息。通过这种方式,本申请能够方便用户进行语音搜寻到适合用户的饮食POI,而且不再需要用户进行手动筛选,同时人机交互过程方便自然,操作简单,较大程度地改善了用户体验。本申请能够实本文档来自技高网
...

【技术保护点】
1.一种基于多轮语音交互的饮食搜寻方法,其特征在于,所述饮食搜寻方法包括:在检测到用户表达饮食搜寻的指令时,智能终端获取用户输入的多轮语音信号;根据所述多轮语音信号识别所述用户的直观意图;根据所述直观意图获取与所述直观意图相关的导航记录、就餐记录、饮食喜好、饮食习惯、附近餐饮信息、热门推荐信息、优惠促销信息、出行便利信息以及当前时间段中的至少两个以上综合因素;根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息。

【技术特征摘要】
1.一种基于多轮语音交互的饮食搜寻方法,其特征在于,所述饮食搜寻方法包括:在检测到用户表达饮食搜寻的指令时,智能终端获取用户输入的多轮语音信号;根据所述多轮语音信号识别所述用户的直观意图;根据所述直观意图获取与所述直观意图相关的导航记录、就餐记录、饮食喜好、饮食习惯、附近餐饮信息、热门推荐信息、优惠促销信息、出行便利信息以及当前时间段中的至少两个以上综合因素;根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息。2.根据权利要求1所述的饮食搜寻方法,其特征在于,所述根据所述综合因素,给出与所述直观意图相匹配的饮食兴趣点POI建议并提供导航信息的步骤,具体包括:对多个所述综合因素进行优先级排序,以给出多个POI建议并提供相应的多条导航信息,其中,所述优先级排序包括按饮食喜好优先、按位置最近优先、按优惠促销优先和按出行便利优先。3.根据权利要求2所述的饮食搜寻方法,其特征在于,所述在检测到用户表达饮食搜寻的指令时的步骤,具体包括:智能终端根据所述用户的饮食习惯,在所述用户平常饮食的时间段内实时检测是否有语音输入与饮食相关的词句;或,智能终端检测是否有触控输入与饮食相关的词句,其中,与饮食相关的词句包括饿、吃饭、餐厅、请客、聚餐和美食。4.根据权利要求1-3任一项所述的饮食搜寻方法,其特征在于,所述根据所述多轮语音信号识别所述用户的直观意图,具体包括:接收输入的多轮语音信号;分帧提取多轮语音信号的语音特征信息,根据语音特征信息和声学模型生成多轮语音信号的识别结果;根据识别结果和预设静音检测算法初步检测出多轮语音信号的语音端点;计算多轮语音信号的置信度信息;解析多轮语音信号的语义信息;根据置信度信息和语义信息获取多轮语音信号对应的语音解析结果;根据语音解析结果识别出所述用户的直观意图。5.根据权利要求4所述的饮食搜寻方法,其特征在于,所述根据语音特征信息和声学模型生成多轮语音信号的识别结果,具体包括:在生成语音特征信息后,采用基于声学模型计算每帧多轮语音信号在每个建模单元上的似然值...

【专利技术属性】
技术研发人员:肖海峰徐平
申请(专利权)人:上海博泰悦臻网络技术服务有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1