用于人机交互的方法、电子设备和计算机可读存储介质技术

技术编号：24497931 阅读：48 留言：0更新日期：2020-06-13 03:47

本公开的实施例提供了用于人机交互的方法、电子设备和计算机可读存储介质。该方法包括：响应于检测到交互对象的输入请求，获取关于交互对象的多种类型的数据，多种类型的数据包括图像数据、语音数据、文本数据、行为数据和数值类数据中的至少两种类型的数据；提取多种类型的数据的特征；基于多种类型中的同一类型的数据的特征之间的相关性以及多种类型中的不同类型的数据的特征之间的相关性，确定注意力权重；基于注意力权重，融合多种类型的数据的特征，以确定交互对象的情感数据；以及基于输入请求和情感数据，生成针对输入请求的会话输出。本公开能够综合交互对象的多模态输入，针对交互对象在不同时段的情感特点匹配合适的会话回复。

Methods, electronic devices and computer-readable storage media for human-computer interaction

全部详细技术资料下载

【技术实现步骤摘要】
用于人机交互的方法、电子设备和计算机可读存储介质
本公开涉及人机交互，更具体地，涉及用于人机交互的方法、电子设备和计算机可读存储介质。
技术介绍
传统的人机交互的方案例如是：交互设备响应于交互对象(例如用户)经由鼠标等输入手段所输入的请求，确定匹配会话回复，以便与交互对象进行交互。传统的人机交互的方案一般仅针对交互对象的有限维度的输入请求进行响应，例如仅仅基于交互对象的触摸输入、语音输入或者文字输入来进行响应，无法综合交互对象的多模态输入而动态地进行实时匹配响应，也无法针对交互对象在不同时段的情感特点进行匹配的响应，因此难以提高交互内容的准确性和用户体验。
技术实现思路
本公开提供一种用于人机交互的方法和装置，能够综合交互对象的多模态输入，针对交互对象在不同时段的情感特点匹配合适的会话回复。根据本公开的第一方面，提供了一种人机交互的方法。该方法包括：响应于检测到交互对象的输入请求，获取关于交互对象的多种类型的数据，多种类型的数据包括图像数据、语音数据、文本数据、行为数据和数值类数据中的至少两种类型的数据；提取多种类型的数据的特征；基于多种类型中的同一类型的数据的特征之间的相关性以及多种类型中的不同类型的数据的特征之间的相关性，确定注意力权重；基于注意力权重，融合多种类型的数据的特征，以确定交互对象的情感数据；以及基于输入请求和情感数据，生成针对输入请求的会话输出。根据本专利技术的第二方面，还提供一种用于人机交互的电子设备。该设备包括：存储器，被配置为存储一个或多个程序；处理...

【技术保护点】
1.一种用于人机交互的方法，包括：/n响应于检测到交互对象的输入请求，获取关于所述交互对象的多种类型的数据，所述多种类型的数据包括图像数据、语音数据、文本数据、行为数据和数值类数据中的至少两种类型的数据；/n提取所述多种类型的数据的特征；/n基于所述多种类型中的同一类型的数据的特征之间的相关性以及所述多种类型中的不同类型的数据的特征之间的相关性，确定注意力权重；/n基于所述注意力权重，融合所述多种类型的数据的特征，以确定所述交互对象的情感数据；以及/n基于所述输入请求和所述情感数据，生成针对所述输入请求的会话输出。/n

【技术特征摘要】
1.一种用于人机交互的方法，包括：
响应于检测到交互对象的输入请求，获取关于所述交互对象的多种类型的数据，所述多种类型的数据包括图像数据、语音数据、文本数据、行为数据和数值类数据中的至少两种类型的数据；
提取所述多种类型的数据的特征；
基于所述多种类型中的同一类型的数据的特征之间的相关性以及所述多种类型中的不同类型的数据的特征之间的相关性，确定注意力权重；
基于所述注意力权重，融合所述多种类型的数据的特征，以确定所述交互对象的情感数据；以及
基于所述输入请求和所述情感数据，生成针对所述输入请求的会话输出。

2.根据权利要求1所述的方法，其中确定注意力权重包括：
基于所述多种类型中的同一类型的数据的特征之间的相关性，生成第一注意力权重；以及
基于所述多种类型中的不同类型的数据的所提取特征之间的相关性，生成第二注意力权重。

3.根据权利要求1所述的方法，其中生成针对所述输入请求的会话输出包括：
基于所述输入请求的数据类型，确定匹配的会话引擎；以及
基于所确定的匹配的会话引擎，生成所述会话输出。

4.根据权利要求1所述的方法，其中基于所述输入请求的数据类型确定匹配的会话引擎包括：
响应与确定所述输入请求的数据类型为文本数据，将基于表格数据的会话引擎、基于知识图谱的会话引擎、基于非结构化数据的会话引擎中的至少一个会话引擎确定为匹配的会话引擎；以及
响应与确定所述输入请求的数据类型为语音数据，将基于QA对的会话引擎和基于规则的会话引擎中的至少一个会话引擎确定为匹配的会话引擎。

5.根据权利要求1所述的方法，其中生成针对所述输入请求的会话输出包括：
获取所述交互对...

【专利技术属性】
技术研发人员：杨洋，李锋，万化，张琛，胡瑛皓，王震，
申请(专利权)人：上海浦东发展银行股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人