当前位置: 首页 > 专利查询>李俊专利>正文

一种基于人工智能的人机智能聊天的方法和装置制造方法及图纸

技术编号:26508261 阅读:37 留言:0更新日期:2020-11-27 15:36
本发明专利技术属于人工智能技术领域,公开了一种基于人工智能的人机智能聊天的方法和装置,该方法包括:通过指令语音进行唤醒操作,同时对唤醒用户进行标记操作;接收用户的多模态输入信号,且多模态输入信号包括语音信号、图像信号和传感器信号;对多模态输入信号进行处理,从而确定用户意图;根据上述用于意图获取对应回复答案,并将回复答案转化为多模态输出信号;输出上述多模态输出信号,聊天结束;本发明专利技术利用多模态信号的形式实现聊天过程中的精准回复;并配合用户标记操作实现对唤醒用户的准确锁定,从而有效实现聊天过程中的单人对话,降低周围环境中其他语音信息对聊天过程的干扰,进一步提高人机对话的准确性。

【技术实现步骤摘要】
一种基于人工智能的人机智能聊天的方法和装置
本专利技术属于人工智能
,具体涉及一种基于人工智能的人机智能聊天的方法和装置。
技术介绍
随着人类社会信息化的不断演进以及人工服务成本的不断上升,人们越来越希望通过自然语言与计算机进行交流;而人机智能聊天系统则能有效满足上述需求,用户通过自然语言与机器进行对话,并通过对话来指挥或者咨询计算机,完成特定的操作;在现有市场中人机智能聊天不仅应用于单一用户的自我需要,还有效应用于一些公众场所,例如公共社区服务中心、银行或医院等公共大厅;但在实际使用中,无论应用于何种场所均需要保证对用户的准确锁定,否则则容易受到外部环境的影响而出现回复偏差的问题,特别是在嘈杂的环境中,上述问题则凸显的更加明显;另外,针对于上述不同的应用,其实际的聊天需求也有所不同,例如应用于单一用户时,在聊天的过程中需针对该用户进行定向性的分析和回复,才能实现更加个性化且自然的聊天;而对于公共场所下的应用,则需保证聊天分析的公平性,否则在分析过程中则会出现偏向性,影响其他用户的体验效果。
技术实现思路
本专利技术的目的在于提供一种基于人工智能的人机智能聊天的方法和装置,以解决现有的人机智能聊天时仍存在在嘈杂无法准确锁定用户而影响聊天恢复准确性的问题,以及针对不同方向的应用存在不同分析需求的问题。为实现上述目的,本专利技术提供如下技术方案:1、一种基于人工智能的人机智能聊天的方法,该方法可应用于多种交互平台上,并利用语音方式实现人机之间的自然交流,具体包括以下步骤:S1,通过指令语音进行唤醒操作,同时对唤醒用户进行标记操作;S2,接收用户的多模态输入信号,且多模态输入信号包括语音信号、图像信号和传感器信号;S3,对多模态输入信号进行处理,从而确定用户意图;S4,根据上述用于意图获取对应回复答案,并将回复答案转化为多模态输出信号;S5,输出上述多模态输出信号,聊天结束。优选的,步骤S3中的处理操作包括对语句的结构分析、语句主体信息的筛选、语句缺失信息的补充、以及语句歧义的消除。优选的,所述回复答案是基于聊天语境的限制、用户意图的约束、以及用户意图的关联延伸等因素的综合分析所得到的2、基于上述方法,还包括对步骤S3中的语句分析和用户意图进行储存。优选的,所述用户意图储存的方式包括永久储存和短期储存。3、基于上述方法,还包括对多模态输入信号的分析,具体分析步骤包括:a,接收信号;b,筛选信号;c,屏蔽信号;d,放大信号。优选的,所述输入信号分析是基于用户标记完成的。优选的,所述用户标记采用声纹识别技术为标记基础。4、基于上述方法的一种基于人工智能的人机智能聊天装置,包括接收模块、标记模块、处理模块、存储模块和输出模块;且该装置为智能终端或智能终端中的一部分。优选的,所述接收模块用于接收用户发出的唤醒指令和多模态输入信息;优选的,所述标记模块用于对发出唤醒指令语音的用户进行标记;优选的,所述处理模块用于实现多模态输入信息的处理,具体包括用户输入的信息、以及相应环境中的其他信息;优选的,所述存储模块用于分类储存历史用户意图;优选的,所述输出模块是基于多模信号转化的基础上实现回复答案的输出,具体包括语句、图像等输出信号。本专利技术与现有技术相比,具有以下有益效果:利用多模态信号的输入与输出实现聊天语境、用户意图的进一步限制,从而使该装置能形成更精确的回复,更充分的满足用户的聊天需求;并且,配合用户标记操作实现对唤醒用户的准确锁定,从而有效实现聊天过程中的单人对话,降低周围环境中其他语音信息对聊天过程的干扰,进一步提高人机对话的准确性;另外,延时性的存储操作使得本专利技术既能有效适用于公共环境中,又能有效适用于专人使用的环境中;其中公共环境中,用户数量较多,且某一用户重复唤醒的次数较少,使得装置内部形成短期储存,从而避免在聊天过程中出现偏向性,有效保证不同用户在使用时的公平性,并避免出现信息过度储存的问题;而专人使用环境中,用户数量单一,且重复唤醒次数角度,使得装置内部形成永久储存,便于在后续使用中依据历史数据进行专用性分析,从而更具有针对性的满足用户需求。附图说明图1为本专利技术的流程图;图2为本专利技术的结构框图;图3为本专利技术中接收模块的接收流程图;图中:1-接收模块、2-标记模块、3-处理模块、4-存储模块、5-输出模块。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。1、本专利技术提供一种基于人工智能的人机智能聊天的方法,该方法可应用于多种交互平台上,并利用语音方式实现人机之间的自然交流。如图1所示,为本专利技术中人机智能聊天的流程图,具体包括以下步骤:S1,通过指令语音进行唤醒操作;具体的,在唤醒过程中进行语音标记,从而有效实现聊天过程中的单人对话,降低周围环境中其他语音信息对聊天过程的干扰,提高用户对话的精准性。S2,接收用户的多模态输入信号;具体的,多模态输入信号包括语音信号、图像信号和传感器信号;S3,对多模态输入信号进行处理,从而确定用户意图;具体的,上述处理操作包括对语句的结构分析、语句主体信息的筛选、语句缺失信息的补充、以及语句歧义的消除;S4,根据上述用于意图获取对应回复答案,并将回复答案转化为多模态输出信号;具体的,回复答案的获取是基于聊天语境的限制、用户意图的约束、以及用户意图的关联延伸所实现的;S5,输出上述多模态输出信号,聊天结束。如图3所示,为本专利技术中用户多模态输入信号的接收流程图,具体包括如下步骤:a,接收信号,包括用户信号和其他环境信号;b,筛选信号,对用户信号和其他环境信号进行分离筛选;c,屏蔽信号,屏蔽其他环境信号;d,放大信号,放大用户信号;2、本专利技术提供了一种应用上述智能聊天方法的装置,该装置可直接作为终端使用,也可作为终端中的一部分进行使用;如图2所示,为上述装置的结构框图,具体包括接收模块1、标记模块2、处理模块3、存储模块4和输出模块5。优选的,接收模块1用于接收用户发出的唤醒指令和多模态输入信息。优选的,标记模块2用于对发出唤醒指令语音的用户进行标记,具体标记方式为利用声纹识别技术进行对应用户的语音记录,以此保证在后续信息接收的过程中能实现对用户的精准识别。优选的,处理模块3用于实现多模态输入信息的处理,具体包括用户输入的信息、以及相应环境中的其他信息。优选的,存储模块4用于分类储存历史用户意图,具体包括永久储存和短期储存:(本文档来自技高网...

【技术保护点】
1.一种基于人工智能的人机智能聊天的方法,其特征在于,包括以下步骤:/nS1,通过指令语音进行唤醒操作,同时对唤醒用户进行标记操作;/nS2,接收用户的多模态输入信号,且多模态输入信号包括语音信号、图像信号和传感器信号;/nS3,对多模态输入信号进行处理,从而确定用户意图;/nS4,根据上述用于意图获取对应回复答案,并将回复答案转化为多模态输出信号;/nS5,输出上述多模态输出信号,聊天结束。/n

【技术特征摘要】
1.一种基于人工智能的人机智能聊天的方法,其特征在于,包括以下步骤:
S1,通过指令语音进行唤醒操作,同时对唤醒用户进行标记操作;
S2,接收用户的多模态输入信号,且多模态输入信号包括语音信号、图像信号和传感器信号;
S3,对多模态输入信号进行处理,从而确定用户意图;
S4,根据上述用于意图获取对应回复答案,并将回复答案转化为多模态输出信号;
S5,输出上述多模态输出信号,聊天结束。


2.根据权利要求1所述的一种基于人工智能的人机智能聊天的方法,其特征在于:还包括对多模态输入信号的分析,具体分析步骤包括a,接收信号;b,筛选信号;c,屏蔽信号;d,放大信号,且输入信号分析是基于用户标记完成的。


3.根据权利要求1或2所述的一种基于人工智能的人机智能聊天的方法,其特征在于:所述用户标记采用声纹识别技术为标记基础。


4.根据权利要求1所述的一种基于人工智能的人机智能聊天的方法,其特征在于:步骤S3中的处理操作包括对语句的结构分析、语句主体信息的筛选、语句缺失信息的补充、以及语句歧义的消除。


5.根据权利要求1或4所述的一种基于人工智能的人机智能聊天的方法,其...

【专利技术属性】
技术研发人员:李俊
申请(专利权)人:李俊
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1