一种多人场景的人机交互系统及方法技术方案

技术编号:22818620 阅读:18 留言:0更新日期:2019-12-14 13:42
本发明专利技术提供了一种多人场景的人机交互系统及方法,所述多人场景的人机交互系统包括:语音输入模块,用于输入用户的说话内容;身份识别模块,用于对用户身份进行识别,获得身份识别特征;云端服务器,用于存储用户的身份识别特征,并按照时间顺序记录用户的对话内容;语义标注和分析模块,用于对存储的身份识别特征进行标注,并对记录的对话内容进行语义分析;和对话反馈模块,用于在有若干个发言人和人机交互系统交互时,对发言人身份进行识别,并根据记录的对话内容分析历史语音数据,在上下文快速检索,以找到匹配的答案。根据本发明专利技术的多人场景的人机交互系统,基于云端大数据进行实时交互,提高了交互内容的准确性。

A human computer interaction system and method for multi person scene

【技术实现步骤摘要】
一种多人场景的人机交互系统及方法
本专利技术涉及人机交互
,特别涉及一种多人场景的人机交互系统及方法。
技术介绍
随着人工智能技术的不断进步,人机交互也取得了长足的发展,各种人机交互机器人大肆兴起,随之人们对自然、拟人的人机交互方式的追求也愈发强烈。现有的人机交互系统大多还只能处理较为简单的一对一交互,其大致工作流程为:接收用户的交互指令,对所述交互指令进行分析,得到用户的交互意图,根据用户的交互意图做出相应的响应。即使有一些支持多人参与交互的设备,也只注明了会对多人对话场景进行响应交互,没有明确说明交互方式,交互过程存在滞后性,不能实现实时交互,交互内容的准确性不高,而且在采集语音的过程中会出现大概率的误识别,扰乱交互过程,降低用户体验。
技术实现思路
本专利技术提供一种多人场景的人机交互系统及方法,用以基于云端大数据进行实时交互,提高了交互内容的准确性。本专利技术提供了一种多人场景的人机交互系统,包括:语音输入模块,用于输入若干个用户的说话内容;身份识别模块,用于在每个用户首次说话时,对所述用户进行身份识别,获得身份识别特征;云端服务器,用于存储所述用户的身份识别特征,并按照时间顺序记录若干个所述用户的对话内容;语义标注和分析模块,用于对所述云端服务器存储的所述身份识别特征进行标注,并对所述云端服务器记录的所述对话内容进行语义分析;和对话反馈模块,用于在多人对话的中途有若干个发言人和所述人机交互系统进行交互时,对所述发言人进行身份识别,并根据所述云端服务器记录的所述对话内容分析所述发言人的历史语音数据,在上下文快速检索,以找到匹配的答案。进一步地,所述多人场景的人机交互系统还包括语音合成模块,用于将所述匹配的答案转换成语音。进一步地,所述语音输入模块包括多麦克风阵列语音输入模块。进一步地,所述身份识别模块包括声纹识别模块,用于对所述用户进行声纹识别,获得声纹识别特征。进一步地,所述多人场景的人机交互系统还包括连接每个用户的用户终端,用于在多人场景的人机交互过程中,向所述云端服务器发送所述用户的身份识别特征和若干个所述用户的对话内容,在多人场景的人机交互结束后,所述云端服务器将记录的所述对话内容传送到所述用户终端。进一步地,所述多人场景的人机交互系统还包括通信模块,通过所述通信模块向所述云端服务器实时地发送所述用户的身份识别特征和若干个所述用户的对话内容。进一步地,所述多人场景的人机交互系统还包括播放模块,用于播放所述语音合成模块转换成的语音。本专利技术实施例提供的一种多人场景的人机交互系统,具有以下有益效果:基于云端大数据进行实时交互,提高了交互内容的准确性,利用身份识别模块对用户进行身份识别,降低了误识别率。本专利技术还提供一种多人场景的人机交互方法,所述方法执行以下步骤:步骤1:获取若干个用户的说话内容;步骤2:在每个用户首次说话时,对所述用户进行身份识别,获得身份识别特征,并将每个用户的所述身份识别特征上传到云端进行存储和标注;步骤3:将多人场景的所有用户的对话实时上传到云端,按照时间顺序进行记录并对所有用户的对话内容进行语义分析;步骤4:在多人对话的中途有若干个发言人和所述人机交互系统进行交互时,对所述发言人进行身份识别,并分析所述发言人的历史语音数据,在上下文快速检索,以找到匹配的答案。进一步地,采用多麦克风阵列语音输入技术获得若干个所述用户的说话内容。进一步地,在所述步骤2中,对每个用户的首次说话内容进行身份识别,获得身份识别特征的步骤包括:对每个用户的首次说话内容进行声纹识别,获得声纹特征。本专利技术实施例提供的一种多人场景的人机交互方法,具有以下有益效果:基于云端大数据进行实时交互,提高了交互内容的准确性,同时对用户进行身份识别,降低了误识别率。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例中一种多人场景的人机交互系统的框图;图2为本专利技术实施例中一种多人场景的人机交互方法的方法流程示意图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。本专利技术实施例提供了一种多人场景的人机交互系统,如图1所示,包括:语音输入模块101,用于输入若干个用户的说话内容;身份识别模块102,用于在每个用户首次说话时,对所述用户进行身份识别,获得身份识别特征;云端服务器103,用于存储所述用户的身份识别特征,并按照时间顺序记录若干个所述用户的对话内容;语义标注和分析模块104,用于对所述云端服务器103存储的所述身份识别特征进行标注,并对所述云端服务器103记录的所述对话内容进行语义分析;和对话反馈模块105,用于在多人对话的中途有若干个发言人和所述人机交互系统进行交互时,对所述发言人进行身份识别,并根据所述云端服务器记录的所述对话内容分析所述发言人的历史语音数据,在上下文快速检索,以找到匹配的答案。其中,所述语义标注和分析模块104包括语义标注模块1041和语义分析模块1042,所述语义标注模块1041用于对所述云端服务器103存储的所述身份识别特征进行标注,所述语义分析模块1042用于对所述云端服务器103记录的所述对话内容进行语义分析。上述技术方案的工作原理为:身份识别模块102对用户进行身份识别;云端服务器103存储用户的身份识别特征,并按照时间顺序记录用户的对话内容;语义标注和分析模块104对存储的身份识别特征进行标注,并对记录的对话内容语义分析;对话反馈模块105在有若干个发言人和人机交互系统进行交互时,对发言人进行身份识别,并根据记录的对话内容分析发言人的历史语音数据,在上下文快速检索,以找到匹配的答案。上述技术方案的有益效果为:基于云端大数据进行实时交互,提高了交互内容的准确性,利用身份识别模块对用户进行身份识别,降低了误识别率。在一个实施例中,所述多人场景的人机交互系统还包括语音合成模块106,用于将所述匹配的答案转换成语音。而且用户可以对转换成语音进行自定义选择,例如可以选择自己喜欢的音色。上述技术方案的工作原理为:语音合成模块106将对话反馈模块105找到的匹配答案转换成语音。上述技术方案的有益效果为:用户可以直观地得到交互信息,提高了交互的便捷性。在一个实施例中,所述语音输入模块101包括多麦克风阵列语音输入模块。本文档来自技高网...

【技术保护点】
1.一种多人场景的人机交互系统,其特征在于,包括:/n语音输入模块,用于输入若干个用户的说话内容;/n身份识别模块,用于在每个用户首次说话时,对所述用户进行身份识别,获得身份识别特征;/n云端服务器,用于存储所述用户的身份识别特征,并按照时间顺序记录若干个所述用户的对话内容;/n语义标注和分析模块,用于对所述云端服务器存储的所述身份识别特征进行标注,并对所述云端服务器记录的所述对话内容进行语义分析;和/n对话反馈模块,用于在多人对话的中途有若干个发言人和所述人机交互系统进行交互时,对所述发言人进行身份识别,并根据所述云端服务器记录的所述对话内容分析所述发言人的历史语音数据,在上下文快速检索,以找到匹配的答案。/n

【技术特征摘要】
1.一种多人场景的人机交互系统,其特征在于,包括:
语音输入模块,用于输入若干个用户的说话内容;
身份识别模块,用于在每个用户首次说话时,对所述用户进行身份识别,获得身份识别特征;
云端服务器,用于存储所述用户的身份识别特征,并按照时间顺序记录若干个所述用户的对话内容;
语义标注和分析模块,用于对所述云端服务器存储的所述身份识别特征进行标注,并对所述云端服务器记录的所述对话内容进行语义分析;和
对话反馈模块,用于在多人对话的中途有若干个发言人和所述人机交互系统进行交互时,对所述发言人进行身份识别,并根据所述云端服务器记录的所述对话内容分析所述发言人的历史语音数据,在上下文快速检索,以找到匹配的答案。


2.如权利要求1所述的多人场景的人机交互系统,其特征在于,所述多人场景的人机交互系统还包括语音合成模块,用于将所述匹配的答案转换成语音。


3.如权利要求1所述的多人场景的人机交互系统,其特征在于,所述语音输入模块包括多麦克风阵列语音输入模块。


4.如权利要求1所述的多人场景的人机交互系统,其特征在于,所述身份识别模块包括声纹识别模块,用于对所述用户进行声纹识别,获得声纹识别特征。


5.如权利要求1所述的多人场景的人机交互系统,其特征在于,所述多人场景的人机交互系统还包括连接每个用户的用户终端,用于在多人场景的人机交互过程中,向所述云端服务器发送所述用户的身份识别特征和若干个所述用户的对话内容,在多人场景的人机交互结束后,所...

【专利技术属性】
技术研发人员:贺伟
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1