一种基于自然语言的机器人深度交互与推理方法与装置制造方法及图纸

技术编号：13942585 阅读：235 留言：0更新日期：2016-10-29 19:54

本发明专利技术公开了一种基于自然语言的机器人深度交互与推理方法与装置，该方法包括以下步骤：1）语音识别：接收用户语音输入，对输入信号进行处理，得到文本信息；2）获取案例属性：将步骤1）中获取的文本进行分词处理，然后将分词后的文本与案例库中的案例进行相似度匹配提取案例的属性；3）深度对话与三维情景交互：如果根据步骤2）提取案例的属性获得的用户意图不完整，则结合Kinect传感器获取的实时地图文件对用户进行多次引导，直至获取完整意图，然后针对用户完整意图的作业任务生成解决方案；语音合成：将得到的解决方案以文本的形式表示出来，合成语音通过音响设备反馈给用户。本发明专利技术交互过程中机器人与用户均使用自然语言。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能技术，尤其涉及一种基于自然语言的机器人深度交互与推理方法与装置。
技术介绍
近年来，随着智能机器人的快速发展，人们期望通过对话的方式让机器人在复杂环境中完成各种作业任务。用自然语言与机器进行通信，这是人们长期以来所追求的：人们可以用自己最习惯的语言来使操作机器人，而无需再花大量的时间和精力去学习各种复杂的计算机语言。在这个过程中，就需要智能机器人系统理解自然语言，了解用户期望，并且具有一种推理机制对实时问题进行推理、求解和学习。目前的研究成果中，具有代表性的推理机制有基于规则推理(Rule-Based Reasoning,RBR)、过程推理(Procedural Reasoning System,PRS)以及基于实例推理(case-based reasoning，CBR)。其中，基于规则推理为核心的推理机制在某些领域内难以获取推理规则而没有被广泛使用；基于过程推理机制缩短了推理时间，但也存在一些不足，如规划库的限定，无法对新生成的规划进行学习和存储等；基于实例推理的机制通过访问事例库中的源事例从而获得当前事例的解决方案，具有一定的学习能力，也具有较高的实用性。但是基于实例推理的推理机制不具有分析能力，无法分析用户不明确的用途并反馈引导，不具有自主性。在此背景下，本方法引入BDI(belief-desire-intention)模型，BDI是一种行为认知架构，其本质是为了解决如何确定智能体的目标和智能体如何实现目标，将基于实例的推理机制与BDI模型结合，既可以增加推理系统的自主性，也解决了BDI模型不具有学习能力的缺点。同时，还引入深...

【技术保护点】
一种基于自然语言的机器人深度交互与推理方法，其特征在于，包括以下步骤：1)语音识别：接收用户语音输入，对输入信号进行处理，得到文本信息；2)获取案例属性：将步骤1)中获取的文本进行分词处理，然后将分词后的文本与案例库中的案例进行基于向量空间模型的文本相似度匹配提取案例的属性；所述案例库用于存储根据实际场景预先设计的案例，每一个案例有三个基本属性值，包括：案例的最初属性集合，案例的解决方案，经过和环境交互与推理后产生的最终属性集合；3)深度对话与三维情景交互：如果根据步骤2)提取案例的属性获得的用户意图不完整，则结合Kinect传感器获取的实时地图文件对用户进行多次引导，直至获取完整意图，然后针对用户完整意图的作业任务生成解决方案；语音合成：推理机将得到的解决方案以文本的形式表示出来，以语音的方式发送给用户。

【技术特征摘要】
1.一种基于自然语言的机器人深度交互与推理方法，其特征在于，包括以下步骤：1)语音识别：接收用户语音输入，对输入信号进行处理，得到文本信息；2)获取案例属性：将步骤1)中获取的文本进行分词处理，然后将分词后的文本与案例库中的案例进行基于向量空间模型的文本相似度匹配提取案例的属性；所述案例库用于存储根据实际场景预先设计的案例，每一个案例有三个基本属性值，包括：案例的最初属性集合，案例的解决方案，经过和环境交互与推理后产生的最终属性集合；3)深度对话与三维情景交互：如果根据步骤2)提取案例的属性获得的用户意图不完整，则结合Kinect传感器获取的实时地图文件对用户进行多次引导，直至获取完整意图，然后针对用户完整意图的作业任务生成解决方案；语音合成：推理机将得到的解决方案以文本的形式表示出来，以语音的方式发送给用户。2.根据权利要求1所述的基于自然语言的机器人深度交互与推理方法，其特征在于，所述步骤1)语音识别过程具体包括如下步骤：1.1)预处理：通过麦克风阵列采集用户语音信息，对输入的原始语音信号进行处理，滤除掉其中的不重要的信息以及背景噪声，并进行语音信号的端点检测、语音分帧以及预加重处理；1.2)特征提取：提取出反映语音信号特征的关键特征参数形成特征矢量序列；1.3)采用隐马尔科夫模型进行声学模型建模，在识别的过程中将待识别的语音与声学模型进行匹配，从而获取识别结果；1.4)对训练文本数据库进行语法、语义分析，经过基于统计模型训练得到N-Gram语言模型，从而提高识别率，减少搜索范围。1.5)针对输入的语音信号，根据己经训练好的HMM声学模型、语言模型及字典建立一个识别网络，根据搜索算法在该网络中寻找最佳的一条路径，这个路径就是能够以最大概率输出该语音信号的词串，从而确定这个语音样本所包含的文字。3.根据权利要求1所述的基于自然语言的机器人深度交互与推理方法，其特征在于，所述步骤2)中案例库的建立采用如下步骤：根据需求设计对话主题，根据对话主题来设计主题树，主题树分为主题节点，必要属性节点和叶节点，每一个结点都有一个二值的有效状态符；根据主题树的节点来写对话生成函数，这些对话生成函数的集合构成引导库；在不同的系统状态下，调用该函数会得到不同的应答输出，每个对话生成函数都只负责它所对应结点的应答，在设计和修改时互不影响。4.根据权利要求1所述的基于自然语言的机器人深度交互与推理方法，其特征在于，所述步骤2)中获取案例属性过程具体包括如下步骤：2.1)对步骤1)中获得的文本进行分词处理，即将文本分割成单个词组；2.2)...

【专利技术属性】
技术研发人员：闵华松，李潇，齐诗萌，林云汉，周昊天，
申请(专利权)人：武汉科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人