一种对语音的语义感知理解的方法和系统技术方案

技术编号：12699606 阅读：90 留言：0更新日期：2016-01-13 18:56

本发明专利技术是一种对语音的语义感知理解的方法和系统，语音是最自然的交互方式被广泛的应用在导航、智能手机地图等领域，其交互的语音中含有GIS地理信息、导航信息和运动指令等与空间定位坐标相关联的语义信息，其不仅在时序上具有连续性，而且在空间上具有相对逻辑分布的结构特点，针对这一特点应用三维音频定位技术处理语音，把语音的语义在时序上连续的组成要素中与空间定位相关联的部分，在三维虚拟声场中静态和动态展开，并表达其内在的逻辑空间分布结构关系，使人的听觉器官感知到其在空间的相对逻辑分布，进而增强对语音所表达的静态和动态的语义信息的理解。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于G10L(语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码)、G01S19/38(利用卫星无线电信标定位系统传输的信号来确定导航方案)和H04R5/033(用于立体声通信设备中的头戴耳机)的交叉领域。
技术介绍
本专利技术属于一种人机语音的语义感知理解的方法和系统，语音是最自然的交互方式被广泛的应用在导航、智能手机地图等领域，其交互的语音中含有GIS地理信息、导航信息和运动指令等与空间定位坐标关联的语义信息，其不仅在时序上具有连续性，而且在空间上具有相对逻辑分布的结构特点，而现有的交互方法的语音仅能表达语义的时序性，不能表达相对的空间分布性，因而不具备使人听力器官感受到语义要素在空间分布的结构场景，导致对此类语义的理解判断，需要人的生活经验和知识参与思维过程，增加了人的思维强度，不能深度挖掘人的听力器官的潜力进而辅助思维理解判断。现有的语音交互方法具有以下缺点:1.语音有且只包含语义信息，例如“前方左转”、“前方直行“等。2.语音不包含语义所表达的静态的方位信息，例如”左转“的语音中表达的“左”在现实环境中在那个方位。3.语音不包含语义所表达的动态的感官体验轨迹信息，例如“向左转”的语音中表达的“向左转”这个动作的动态的轨迹感官体验信息。另一方面，音频定位技术作为一门新兴的边缘交叉学科，涉及听觉心理学、听觉生理学、人工智能和高性能计算机系统等多个研究领域，且具有广泛的应用前景，它可以帮助传递和识别可视信息，增强三维仿真环境的逼真度、想像力和沉浸感，在军事和民用方面有广泛的应用。音频定位技术是通过对一包含单个或者多个模拟...

【技术保护点】
一种对语音的语义感知理解的方法，用语音作为人机交互信息，通过发声装置传递到听觉器官，其特征是根据语音的语义信息，在空间声场的对应方位产生虚拟声源。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：孙瑞峰，
申请(专利权)人：孙瑞峰，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人