一种基于情感意图驱动的人机交互方法技术

技术编号：32532978 阅读：13 留言：0更新日期：2022-03-05 11:27

本发明专利技术公开了一种基于情感意图驱动的人机交互方法。针对现有的人机交互过程中，服务机器人缺少智能性、主动性，处于被动地位，提出了一种新的交互策略，具体包括(1)数据采集与增强；(2)使用迁移学习训练ResNet

全部详细技术资料下载

【技术实现步骤摘要】
一种基于情感意图驱动的人机交互方法

[0001]本专利技术属于人机交互
，具体涉及一种基于情感意图驱动的人机交互方法。

技术介绍

[0002]人机交互是人与机器人进行沟通、情感理解的通道。现有交互方式通常是人占主导位置，并通过触控、语音、手势、键盘等方式实现主动信息交流和沟通，但只有实现机器与人双向平等的交互，才能算是实现自然人机交互和机器人智能化。在人与人相处的环境中，情感观测和情感抚慰是必不可少的交互，通过观测情感做出相应的抚慰行为能有效促进人与人之间的关系。然而，大部分服务机器人难以观测并理解服务对象的情感，即使现有技术能实现机器人接收到正确的情感信息，但是后续做出的行为往往也难以达到契合人类情绪的效果，使机器人与人的关系难以更进一步。因此，情感意图驱动机器人动作是实现机器人智能化的关键，也是人机交互领域必不可少的一部分。

技术实现思路

[0003]针对现有技术的不足，本专利技术提出了一种基于情感意图驱动的人机交互方法，建立情感接收、动作交互、强化学习的反馈回路，解决人机交互中机器人主动性较少、难以对用户情感意图做出正确行为的问题。
[0004]一种基于情感意图驱动的人机交互方法，具体包括以下步骤：
[0005]步骤一、数据收集与网络训练
[0006]收集多张不同表情的人脸图片。对人脸图片进行随机数据增强，然后调整至统一大小，再输入到ResNet
‑
18网络中，对ResNet
‑
18网络的权重参数w
r
进行训练。...

【技术保护点】

【技术特征摘要】
1.一种基于情感意图驱动的人机交互方法，其特征在于：具体包括以下步骤：步骤一、数据收集与网络训练收集多张不同表情的人脸图片；对人脸图片进行随机数据增强，然后调整至统一大小，再输入到ResNet
‑
18网络中，对ResNet
‑
18网络的权重参数w
r
进行训练；步骤二、构建深度强化学习网络构建深度强化学习网络DQN，使用ResNet
‑
18网络作为DQN的评估网络Q
e
(S,a,w)与目标网络Q
t
(S,a,w
′
)；随机初始化网络参数后，将步骤一训练后的权重参数w
r
迁移到评估网络Q
e
(S,a,w)与目标网络Q
t
(S,a,w
′
)的权重w、w
′
中；步骤三、深度强化学习训练s3.1、设置包括多种动作的集合A，将机器人使用摄像头实时捕捉的视频裁剪为图片，作为评估网络Q
e
(S,a,w)的输入状态S
t
，输出目标动作的估计值；s3.2、将输入状态S
t
输入到目标网络Q
t
(S,a,w
′
)，得到各个目标动作的估计值，利用ε
‑
greedy策略控制机器人做出集合A中的动作a：ε为贪婪值；判断人脸对于动作a的响应状态S
t+1
，并根据强化学习训练的回报函数reward计算奖励r：将第n次学习的转移信息存入经验回放记忆池D中，如果学习次数n大于经验回放记忆池D的容量M，则使用先进先出的规则删除最早保存的转移信息，并把最新的转移信息加入经验回放记忆池D；s3.3、循环s3.1、3.2多次，当经验回放记忆池D中样本的个数多于设置的采样个数时，对经验回放记忆池D中的转移信息进行随机采样batch_size个样本，并计算采样样本中目标的估计值y
j
：其中，0≤j≤batch_size，γ为折扣因子；max()表示求取值函数的最大值，argmax()表示求取值函数在状态S下最大估计值对应的目标；最终状态为设置的停止服务的状态；s3.4、固定评估网络Q
e
(S,a,w)中1～15层卷积的参数，执行梯度下降优化策略对16～20层卷积的权重w进行微调；s3.5、将动作响应状态S

【专利技术属性】
技术研发人员：谢佳龙，张波涛，吕强，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人