主动交互实现装置、方法及智能语音交互设备制造方法及图纸

技术编号:15391623 阅读:96 留言:0更新日期:2017-05-19 04:51
本发明专利技术公开了一种主动交互实现装置、方法及智能语音交互设备,所述装置包括:数据采集模块,用于采集用于用户身份和情绪识别的数据、环境数据和智能语音交互设备的工作数据;身份和情绪识别模块,用于对用户身份和情绪进行识别,得到用户身份和情绪识别结果;大数据引擎模块,用于根据采集和识别得到的数据,得到用户、智能语音交互设备及环境的状态信息,并将其输入到预先建立的与识别出的用户身份匹配的用户行为习惯模型中,以对用户的状态和/或行为进行预判,并根据预判结果,主动向用户提供与预判结果相匹配的服务。本发明专利技术可以按需且主动地为用户提供内容服务和/或设备控制服务,使得设备与人的交互过程更为智能与人性化。

Active interactive implementation device, method and intelligent voice interactive device

The invention discloses a method and device to realize active interaction, intelligent voice interactive device, the device comprises a data acquisition module for data acquisition, for user identity and emotion recognition data, environmental data and intelligent voice interactive devices; identity and emotion recognition module, used to identify the user identity and emotion and get the user identity and emotion recognition results; the big data engine module, according to the data collection and identification, state information users, intelligent voice interactive equipment and environment, and the user behavior model of the input to the pre established and identified the identity of the user, to the user, and the state of conduct / or anticipation, and according to the predict results, take the initiative to provide results matched with the pre judgment service to users. The invention can provide the content service and / or device control service according to the requirement and the initiative, so that the interaction process between the device and the human is more intelligent and humanized.

【技术实现步骤摘要】
主动交互实现装置、方法及智能语音交互设备
本专利技术涉及智能交互
,尤其涉及一种主动交互实现装置、方法及智能语音交互设备。
技术介绍
现阶段由于语音技术的发展,智能语音交互设备越来越多,语音交互成为一种非常重要的人机交互途径,尤其是近些年语音助手的普及,从手机到智能家居再到汽车,都可以进行语音的交互以及服务的获取。但是这些语音的交互以及服务的获取是需要人为发布指令或是用户主动触发的。也就是说,现阶段的智能语音交互设备只能被动的为用户提供服务,无法对用户的行为进行预判,从而实现服务的主动推荐。
技术实现思路
本专利技术提供一种主动交互实现装置、方法及智能语音交互设备,用以解决现有技术中的智能语音交互设备无法实现主动推荐服务,影响使用效率的问题。依据本专利技术的一个方面,提供一种主动交互实现装置,应用于智能语音交互设备,所述装置包括:数据采集模块、身份和情绪识别模块、以及大数据引擎模块;所述数据采集模块,用于采集用于用户身份和情绪识别的数据、环境数据和智能语音交互设备的工作数据;所述身份和情绪识别模块,用于根据所述数据采集模块采集的用于用户身份和情绪识别的数据,对用户身份和情绪进行识别,得到用户身份和情绪识别结果;所述大数据引擎模块,用于根据所述数据采集模块实时采集的数据以及所述身份和情绪识别模块实时识别的所述用户身份和情绪识别结果,得到用户、智能语音交互设备及环境的状态信息,并将其输入到预先建立的与识别出的用户身份匹配的用户行为习惯模型中,以对用户的状态和/或行为进行预判,并根据预判结果,主动向用户提供与预判结果相匹配的服务。可选地,所述大数据引擎模块,具体用于确定与所述预判结果相匹配的服务,向用户发出是否需要所述服务的询问,并在确定出用户需要时,向用户提供所述服务。可选地,向用户提供的与预判结果相匹配的服务,包括:内容服务和/或设备状态控制服务;所述设备状态控制服务包括:控制所述智能语音交互设备和/或与所述智能语音交互设备连接的设备到目标状态。可选地,所述大数据引擎模块,具体用于调用内容服务接口传输控制指令,以实现对所述内容服务的控制与调用;和/或,调用设备控制接口传输控制指令,以实现将所述智能语音交互设备和/或与所述智能语音交互设备连接的设备控制到目标状态。可选地,所述装置还包括:用户模型模块,用于根据所述数据采集模块的历史采集数据、所述用户身份和情绪识别结果以及所述智能语音交互设备的历史语音交互数据,按用户构建用户行为习惯模型。可选地,所述用户模型模块,包括:数据解析单元和学习训练单元:所述数据解析单元,用于在所述历史采集数据、所述用户身份和情绪识别结果以及历史语音交互数据中,解析出用户的偏好数据;所述学习训练单元,用于将所述用户偏好数据添加到为该用户预先建立的用户本体模型中,进行用户行为习惯的学习和训练,形成用户行为习惯模型。可选地,所述用于用户身份和情绪识别的数据,包括:用户的图像数据和/或语音数据;所述身份和情绪识别模块,具体包括:身份识别子模块和情绪识别子模块;所述身份识别子模块,用于当接收到图像数据或者语音数据时,根据接收到的所述图像数据或者语音数据,对用户的身份进行识别;当接收到图像数据和语音数据时,分别根据所述图像数据和语音数据,对用户的身份进行识别,得到两种数据类型下的两个初始的身份识别结果,并基于得到的两个初始的身份识别结果,按照设定的身份判定策略,进行身份判定,得到最终的用户身份识别结果;所述情绪识别子模块,用于当接收到图像数据或者语音数据时,根据接收到的所述图像数据或者语音数据,对用户的情绪进行识别;当接收到图像数据和语音数据时,分别根据所述图像数据和语音数据,对用户的情绪进行识别,得到两种数据类型下的两个初始的情绪识别结果,并基于得到的两个初始的情绪识别结果,按照设定的情绪判定策略,进行情绪判定,得到最终的用户情绪识别结果。可选地,所述身份识别子模块,用于在得到两种数据类型下的两个初始的身份识别结果时,提取出每个身份识别结果中识别出的用户及识别出该用户的置信度信息,当两个身份识别结果中识别出的用户相同且置信度分别大于等于设定的对应数据类型的第一身份置信度阈值时,以共同识别出的用户作为最终的用户身份识别结果;当两个身份识别结果中有一个身份识别结果中识别出的用户的置信度大于等于设定的对应数据类型的第二身份置信度阈值时,以用户的置信度大于等于第二置信度身份阈值对应的用户,作为最终的用户身份识别结果,其中,同一数据类型下的第一身份置信度阈值小于第二身份置信度阈值。可选地,所述情绪识别子模块,用于在得到两种数据类型下的两个初始的情绪识别结果时,提取出每个情绪识别结果中识别出的情绪类型及识别出该情绪类型的置信度信息,当两个情绪识别结果中识别出的情绪类型相同且置信度分别大于等于设定的对应数据类型的第一情绪置信度阈值时,以共同识别出的情绪类型作为最终的情绪识别结果;当两个情绪识别结果中有一个情绪识别结果中识别出的情绪类型的置信度大于设定的对应数据类型的第二情绪阈值时,以情绪类型的置信度大于第二情绪阈值的情绪类型,作为最终的情绪识别结果;其中,同一数据类型下的第一情绪置信度阈值小于第二情绪置信度阈值。可选地,所述情绪识别子模块,还用于确定用户情绪识别结果中情绪类型的置信度,根据预设的情绪类型的置信度与情绪类型级别的对应关系,得到识别出的用户的情绪级别,并将其输出到所述大数据引擎模块;所述大数据引擎模块,具体用于根据所述数据采集模块实时采集的数据、所述身份和情绪识别模块实时识别的所述用户身份和情绪识别结果、以及识别出的情绪级别,得到用户、智能语音交互设备及环境的状态信息。依据本专利技术的另一个方面,还提供一种智能语音交互设备,包括本专利技术所述的主动交互实现装置。依据本专利技术的第三个方面,还提供一种主动交互实现方法,应用于智能语音交互设备,所述方法包括:采集用于用户身份和情绪识别的数据、环境数据和智能语音交互设备的工作数据;根据采集的用于用户身份和情绪识别的数据,对用户身份和情绪进行识别,得到用户身份和情绪识别结果;根据实时采集的各数据以及实时识别的所述用户身份和情绪识别结果,得到用户、智能语音交互设备及环境的状态信息,并将其输入到预先建立的与识别出的用户身份匹配的用户行为习惯模型中,以对用户的状态和/或行为进行预判,并根据预判结果,主动向用户提供与预判结果相匹配的服务。可选地,所述根据预判结果,主动向用户提供与预判结果相匹配的服务,具体包括:确定与所述预判结果相匹配的服务,向用户发出是否需要所述服务的询问,并在确定出用户需要时,向用户提供所述服务。可选地,向用户提供的与预判结果相匹配的服务,包括:内容服务和/或设备状态控制服务;所述设备状态控制服务包括:控制所述智能语音交互设备和/或与所述智能语音交互设备连接的设备到目标状态。可选地,所述主动向用户提供与预判结果相匹配的服务,包括:调用内容服务接口传输控制指令,以实现对所述内容服务的控制与调用;和/或,调用设备控制接口传输控制指令,以实现将所述智能语音交互设备和/或与所述智能语音交互设备连接的设备控制到目标状态。可选地,所述方法还包括:根据历史采集数据、用户身份和情绪识别结果以及所述智能语音交互设备的历史语音交互数据,按用户构建用户行为习惯模型。其本文档来自技高网...
主动交互实现装置、方法及智能语音交互设备

【技术保护点】
一种主动交互实现装置,应用于智能语音交互设备,其特征在于,包括:数据采集模块、身份和情绪识别模块、以及大数据引擎模块;所述数据采集模块,用于采集用于用户身份和情绪识别的数据、环境数据和智能语音交互设备的工作数据;所述身份和情绪识别模块,用于根据所述数据采集模块采集的用于用户身份和情绪识别的数据,对用户身份和情绪进行识别,得到用户身份和情绪识别结果;所述大数据引擎模块,用于根据所述数据采集模块实时采集的数据以及所述身份和情绪识别模块实时识别的所述用户身份和情绪识别结果,得到用户、智能语音交互设备及环境的状态信息,并将其输入到预先建立的与识别出的用户身份匹配的用户行为习惯模型中,以对用户的状态和/或行为进行预判,并根据预判结果,主动向用户提供与预判结果相匹配的服务。

【技术特征摘要】
1.一种主动交互实现装置,应用于智能语音交互设备,其特征在于,包括:数据采集模块、身份和情绪识别模块、以及大数据引擎模块;所述数据采集模块,用于采集用于用户身份和情绪识别的数据、环境数据和智能语音交互设备的工作数据;所述身份和情绪识别模块,用于根据所述数据采集模块采集的用于用户身份和情绪识别的数据,对用户身份和情绪进行识别,得到用户身份和情绪识别结果;所述大数据引擎模块,用于根据所述数据采集模块实时采集的数据以及所述身份和情绪识别模块实时识别的所述用户身份和情绪识别结果,得到用户、智能语音交互设备及环境的状态信息,并将其输入到预先建立的与识别出的用户身份匹配的用户行为习惯模型中,以对用户的状态和/或行为进行预判,并根据预判结果,主动向用户提供与预判结果相匹配的服务。2.如权利要求1所述的装置,其特征在于,所述大数据引擎模块,具体用于确定与所述预判结果相匹配的服务,向用户发出是否需要所述服务的询问,并在确定出用户需要时,向用户提供所述服务。3.如权利要求1或2所述的装置,其特征在于,向用户提供的与预判结果相匹配的服务,包括:内容服务和/或设备状态控制服务;所述设备状态控制服务包括:控制所述智能语音交互设备和/或与所述智能语音交互设备连接的设备到目标状态。4.如权利要求3所述的装置,其特征在于,所述大数据引擎模块,具体用于调用内容服务接口传输控制指令,以实现对所述内容服务的控制与调用;和/或,调用设备控制接口传输控制指令,以实现将所述智能语音交互设备和/或与所述智能语音交互设备连接的设备控制到目标状态。5.如权利要求1所述的装置,其特征在于,还包括:用户模型模块,用于根据所述数据采集模块的历史采集数据、所述用户身份和情绪识别结果以及所述智能语音交互设备的历史语音交互数据,按用户构建用户行为习惯模型。6.如权利要求5所述的装置,其特征在于,所述用户模型模块,包括:数据解析单元和学习训练单元:所述数据解析单元,用于在所述历史采集数据、所述用户身份和情绪识别结果以及历史语音交互数据中,解析出用户的偏好数据;所述学习训练单元,用于将所述用户偏好数据添加到为该用户预先建立的用户本体模型中,进行用户行为习惯的学习和训练,形成用户行为习惯模型。7.如权利要求1所述的装置,其特征在于,所述用于用户身份和情绪识别的数据,包括:用户的图像数据和/或语音数据;所述身份和情绪识别模块,具体包括:身份识别子模块和情绪识别子模块;所述身份识别子模块,用于当接收到图像数据或者语音数据时,根据接收到的所述图像数据或者语音数据,对用户的身份进行识别;当接收到图像数据和语音数据时,分别根据所述图像数据和语音数据,对用户的身份进行识别,得到两种数据类型下的两个初始的身份识别结果,并基于得到的两个初始的身份识别结果,按照设定的身份判定策略,进行身份判定,得到最终的用户身份识别结果;所述情绪识别子模块,用于当接收到图像数据或者语音数据时,根据接收到的所述图像数据或者语音数据,对用户的情绪进行识别;当接收到图像数据和语音数据时,分别根据所述图像数据和语音数据,对用户的情绪进行识别,得到两种数据类型下的两个初始的情绪识别结果,并基于得到的两个初始的情绪识别结果,按照设定的情绪判定策略,进行情绪判定,得到最终的用户情绪识别结果。8.如权利要求7所述的装置,其特征在于,所述身份识别子模块,用于在得到两种数据类型下的两个初始的身份识别结果时,提取出每个身份识别结果中识别出的用户及识别出该用户的置信度信息,当两个身份识别结果中识别出的用户相同且置信度分别大于等于设定的对应数据类型的第一身份置信度阈值时,以共同识别出的用户作为最终的用户身份识别结果;当两个身份识别结果中有一个身份识别结果中识别出的用户的置信度大于等于设定的对应数据类型的第二身份置信度阈值时,以用户的置信度大于等于第二置信度身份阈值对应的用户,作为最终的用户身份识别结果,其中,同一数据类型下的第一身份置信度阈值小于第二身份置信度阈值。9.如权利要求7所述的装置,其特征在于,所述情绪识别子模块,用于在得到两种数据类型下的两个初始的情绪识别结果时,提取出每个情绪识别结果中识别出的情绪类型及识别出该情绪类型的置信度信息,当两个情绪识别结果中识别出的情绪类型相同且置信度分别大于等于设定的对应数据类型的第一情绪置信度阈值时,以共同识别出的情绪类型作为最终的情绪识别结果;当两个情绪识别结果中有一个情绪识别结果中识别出的情绪类型的置信度大于设定的对应数据类型的第二情绪阈值时,以情绪类型的置信度大于第二情绪阈值的情绪类型,作为最终的情绪识别结果;其中,同一数据类型下的第一情绪置信度阈值小于第二情绪置信度阈值。10.如权利要求9所述的装置,其特征在于,所述情绪识别子模块,还用于确定用户情绪识别结果中情绪类型的置信度,根据预设的情绪类型的置信度与情绪类型级别的对应关系,得到识别出的用户的情绪级别,并将其输出到所述大数据引擎模块。11.一种智能语音交互设备,其特征在于,...

【专利技术属性】
技术研发人员:何嘉朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1