一种人机交互方法、装置及人机交互终端制造方法及图纸

技术编号：19748241 阅读：19 留言：0更新日期：2018-12-12 05:15

本发明专利技术实施例提供一种人机交互方法、装置及人机交互终端，该方法包括：获取用户传达的控制信息，所述控制信息包括语音信息；提取所述语音信息的文本特征；确定所述文本特征相应的文本特征向量；根据预训练的语音分类模型，确定所述文本特征向量匹配的语音样本；所述语音分类模型表示有文本特征向量与对应的语音样本的归属概率；将所确定的语音样对应的语音控制指令，作为所述语音信息的语音控制指令；根据所述语音控制指令，生成目标控制指令。本发明专利技术实施例能够提升人机交互的自然性和智能性，降低人机交互的用户门槛，以为人机交互的普及提供有力的支持。

全部详细技术资料下载

【技术实现步骤摘要】
一种人机交互方法、装置及人机交互终端
本专利技术涉及人机交互
，具体涉及一种人机交互方法、装置及人机交互终端。
技术介绍
人机交互是指用户与机器之间相互沟通，使得机器理解用户意图的一种技术；具体的，通过人机交互，用户可通过向机器传达控制信息，使得机器完成用户所意图的工作。人机交互在多个领域具有广泛的应用，涉及手机控制、汽车自动驾驶等方面，尤其是随着机器人(如服务器人)技术的发展，人机交互技术如何更好的在机器人控制方面进行应用，成为了机器人技术提升的一个关键点。本专利技术的专利技术人发现，目前的人机交互技术急需解决的问题是如何提升人机交互的自然性和智能性，从而使得人机交互的用户门槛降低，人机交互技术能够被广泛普及。
技术实现思路
有鉴于此，本专利技术实施例提供一种人机交互方法、装置及人机交互终端，以提升人机交互的自然性和智能性，降低人机交互的用户门槛，以为人机交互的普及提供有力的支持。为实现上述目的，本专利技术实施例提供如下技术方案：一种人机交互方法，包括：获取用户传达的控制信息，所述控制信息包括语音信息；提取所述语音信息的文本特征；确定所述文本特征相应的文本特征向量；根据预训练的语音分类模型，确定所述文本特征向量匹配的语音样本；所述语音分类模型表示有文本特征向量与对应的语音样本的归属概率；将所确定的语音样对应的语音控制指令，作为所述语音信息的语音控制指令；根据所述语音控制指令，生成目标控制指令。本专利技术实施例还提供一种人机交互装置，包括：控制信息获取模块，用于获取用户传达的控制信息，所述控制信息包括语音信息；文本特征提取模块，用于提取所述语音信息的文本...

【技术保护点】
1.一种人机交互方法，其特征在于，包括：获取用户传达的控制信息，所述控制信息包括语音信息；提取所述语音信息的文本特征；确定所述文本特征相应的文本特征向量；根据预训练的语音分类模型，确定所述文本特征向量匹配的语音样本；所述语音分类模型表示有文本特征向量与对应的语音样本的归属概率；将所确定的语音样对应的语音控制指令，作为所述语音信息的语音控制指令；根据所述语音控制指令，生成目标控制指令。

【技术特征摘要】
1.一种人机交互方法，其特征在于，包括：获取用户传达的控制信息，所述控制信息包括语音信息；提取所述语音信息的文本特征；确定所述文本特征相应的文本特征向量；根据预训练的语音分类模型，确定所述文本特征向量匹配的语音样本；所述语音分类模型表示有文本特征向量与对应的语音样本的归属概率；将所确定的语音样对应的语音控制指令，作为所述语音信息的语音控制指令；根据所述语音控制指令，生成目标控制指令。2.根据权利要求1所述的人机交互方法，其特征在于，所述根据预训练的语音分类模型，确定所述文本特征向量匹配的语音样本包括：根据所述语音分类模型确定所述文本特征向量可能归属的语音样本，及与可能归属的各语音样本的归属概率；选取归属概率最高的语音样本，作为所述文本特征向量匹配的语音样本。3.根据权利要求1或2所述的人机交互方法，其特征在于，还包括：获取训练语料库，所述训练语料库记录有各语音控制指令的语音样本，一语音控制指令对应至少一条语音样本；提取各语音样本的文本特征，得到多个文本特征；对各文本特征分别进行特征向量加权，得到各文本特征的文本特征向量；根据机器学习算法，对各文本特征向量与对应的语音样本的归属概率进行建模，得到语音分类模型。4.根据权利要求3所述的人机交互方法，其特征在于，所述对各文本特征分别进行特征向量加权，得到各文本特征的文本特征向量包括：对于一文本特征，确定该文本特征的字词在对应的语音样本中的出现次数，以及在训练语料库中的出现次数；根据该文本特征的字词在对应的语音样本和训练语料库中的出现次数，确定该文本特征在对应的语音样本中的重要程度；其中，该重要程度与文本特征的字词在语音样本的出现次数成正比关系，与文本特征的字词在语料库中的出现次数成反比关系；根据该重要程度确定该文本特征对应的文本特征向量。5.根据权利要求3所述的人机交互方法，其特征在于，所述根据机器学习算法，对各文本特征向量与对应的语音样本的归属概率进行建模，得到语音分类模型包括：利用最大熵算法，对各文本特征向量与对应的语音控制指令的归属概率进行建模，得到概率分布均匀的最大熵分类模型。6.根据权利要求1所述的人机交互方法，其特征在于，所述控制信息还包括手势信息；所述手势信息包括：从用户手势图像提取的手势位置特征和手势姿态特征；所述方法还包括：根据自适应区间卡尔曼滤波处理所述手势位置特征，得到目标手势位置特征；及根据改进粒子滤波处理所述手势姿态特征，得到目标手势姿态特征；融合所述目标手势位置特征和所述目标手势姿态特征，确定用户的手势特征；确定所述手势特征对应的手势控制指令；所述根据所述语音控制指令，生成目标控制指令包括：根据所述语音控制指令和所述手势控制指令，生成目标控制指令。7.根据权利要求6所述的人机交互方法，其特征在于，所述根据自适应区间卡尔曼滤波处理所述手势位置特征，得到目标手势位置特征包括：根据手势位置特征对应的加速度，确定手势加速度变化规律；根据自适应区间卡尔曼滤波的模型，过滤偏离手势加速度变化规律的噪声；利用自适应区间卡尔曼滤波的模型，根据过滤噪声后的手势位置特征中前一时刻的手势坐标、手势速度和加速度，估计当前时刻的手势坐标、手势速度和加速度，确定出当前时刻的目标手势位置特征。8.根据权利要求6所述的人机交互方法，其特征在于，所述根据改进粒子滤波处理所述手势姿态特征，得到目标手势姿态特征包括：获取手势姿态特征所表示的人手在三维坐标系各轴的旋转角；根据所述人手在三维坐标系各轴的旋转角，确定四元数分量；根据改进粒子滤波，确定人手粒子的后验概率；根据所述后验概率迭代处理所述四元数分量，得到目标四元数分量，以获取到目标手...

【专利技术属性】
技术研发人员：杜广龙，
申请(专利权)人：腾讯科技深圳有限公司，华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人