一种基于深度学习的智能语音交互设备制造技术

技术编号：25189105 阅读：30 留言：0更新日期：2020-08-07 21:15

本发明专利技术公开了一种基于深度学习的智能语音交互设备，其具有唤醒模式和非唤醒模式两种状态；其包括：语音获取模块用于实时获取声音信息；语音预处理模块与语音获取模块连接，对声音信息进行噪声滤除，得到目标语音；语音识别模块用于在唤醒模式下识别目标语音，获得目标内容；检索模块分别与语音识别模块、预存储有应答语句的存储模块连接，检索模块用于在唤醒模式下根据目标内容获取应答内容；输出模块与检索模块连接，输出模块用于在唤醒模式下获取应答内容，并将应答内容输出；智能语音交互设备在设定时间内无内容输出且无目标语音时，进入非唤醒模式。本发明专利技术能够实时进行拾音，能够使得在语音输出的过程中，也能够准确获得外部的有效语音。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的智能语音交互设备
本专利技术涉及语音交互
，特别是一种基于深度学习的智能语音交互设备。
技术介绍
随着人工智能的不断发展，语音识别技术取得显著进步，开始从实验室走向市场。语音识别技术已经开始进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。现有技术中，智能音箱也不断走入人们的视野，如，siri系统、小米智能音箱、Nano智能音箱以及各种儿童语音交互玩具等。这些系统虽然能够完成基本的交互过程但往往存在以下缺陷，每次输入语音前，需要手动或通过特定的词语将系统调至特定获取语音的状态，才能够顺利识别语音。这就给交互过程带来了不便。
技术实现思路
本专利技术的一个目的是提供一种基于深度学习的智能语音交互设备，以解决现有技术中的不足，它能够实时进行拾音，能够使得在语音输出的过程中，也能够准确获得外部的有效语音。使语音交互过程更加智能化。本专利技术提供了一种基于深度学习的智能语音交互设备，其中，所述智能语音交互设备具有唤醒模式和非唤醒模式两种状态；该智能语音交互设备包括：语音获取模块，所述语音获取模块用于实时获取声音信息；语音预处理模块，所述语音预处理模块与所述语音获取模块连接，所述语音预处理模块用于获取所述声音信息，并对所述声音信息进行噪声滤除，得到目标语音；并在非唤醒模式下判断所述目标语音是否为设定的唤醒词，如果是，进入唤醒模式，如果否，保持非唤醒模式；语音识别模块，所述语音识别模块用于在唤醒模式下识别所述...

【技术保护点】
1.一种基于深度学习的智能语音交互设备，其特征在于，/n所述智能语音交互设备具有唤醒模式和非唤醒模式两种状态；所述智能语音交互设备包括：/n语音获取模块，所述语音获取模块用于实时获取声音信息；/n语音预处理模块，所述语音预处理模块与所述语音获取模块连接，所述语音预处理模块用于获取所述声音信息，并对所述声音信息进行噪声滤除，得到目标语音；并在非唤醒模式下判断所述目标语音是否为设定的唤醒词，如果是，进入唤醒模式，如果否，保持非唤醒模式；/n语音识别模块，所述语音识别模块用于在唤醒模式下识别所述目标语音，获得目标内容；/n检索模块，所述检索模块分别与所述语音识别模块、预存储有应答语句的存储模块连接，所述检索模块用于在唤醒模式下根据所述目标内容从所述存储模块中、或根据所述目标内容从网络上获取应答内容；/n输出模块，所述输出模块与所述检索模块连接，所述输出模块用于在唤醒模式下获取所述应答内容，并将所述应答内容输出；/n所述智能语音交互设备在设定时间内无内容输出且无声音信息被获取时，进入非唤醒模式。/n

【技术特征摘要】
1.一种基于深度学习的智能语音交互设备，其特征在于，
所述智能语音交互设备具有唤醒模式和非唤醒模式两种状态；所述智能语音交互设备包括：
语音获取模块，所述语音获取模块用于实时获取声音信息；
语音预处理模块，所述语音预处理模块与所述语音获取模块连接，所述语音预处理模块用于获取所述声音信息，并对所述声音信息进行噪声滤除，得到目标语音；并在非唤醒模式下判断所述目标语音是否为设定的唤醒词，如果是，进入唤醒模式，如果否，保持非唤醒模式；
语音识别模块，所述语音识别模块用于在唤醒模式下识别所述目标语音，获得目标内容；
检索模块，所述检索模块分别与所述语音识别模块、预存储有应答语句的存储模块连接，所述检索模块用于在唤醒模式下根据所述目标内容从所述存储模块中、或根据所述目标内容从网络上获取应答内容；
输出模块，所述输出模块与所述检索模块连接，所述输出模块用于在唤醒模式下获取所述应答内容，并将所述应答内容输出；
所述智能语音交互设备在设定时间内无内容输出且无声音信息被获取时，进入非唤醒模式。

2.根据权利要求1所述的基于深度学习的智能语音交互设备，其特征在于，还包括模式控制模块，所述模式控制模块分别与所述语音预处理模块、所述语音识别模块、所述检索模块和所述输出模块电连接；
所述模式控制模块用于获取模式信息，并将当前模式信息分别发送给所述语音预处理模块、所述语音识别模块、所述检索模块和所述输出模块；
在非唤醒模式下，所述模式控制模块根据所述语音预处理模块的对于所述目标语音是否为设定的唤醒词的判断结果，并在所述目标语音是为设定的唤醒词的情况下，生成唤醒状态标识，并将该唤醒状态标识分别输出给所述语音预处理模块、所述语音识别模块、所述检索模块和所述输出模块；
在唤醒模式下，所述模式控制模块获取所述应答内容输出完毕的时间节点，并实时监控所述语音预处理模块是否获取到目标内容；如在设定时间内，未获取到目标内容，则生成非唤醒状态标识，并将该非唤醒状态标识分别输出给所述语音预处理模块、所述语音识别模块、所述检索模块和所述输出模块。

3.根据权利要求1所述的基于深度学习的智能语音交互设备，其特征在于，还包括声纹处理模块和身份标记模块；
所述声纹处理模块分别与所述语音预处理模块和所述身份标记模块电连接；所述身份标记模块与所述检索模块连接；
所述声纹处理模块用于在获取到与预设的唤醒词内容相同的目标语音时，获取该目标语音的声纹信息，并查找所述身份标记模块中是否存在与该声纹信息相对应的身份文件，如果是，则将该身份文件与所述检索模块建立关联，以使输出的内容与该身份文件相适配，同时，将本次交互过程中所获取的涉及身份喜好的内容信息存储到对应该声纹的身份文件中，如果否，在所...

【专利技术属性】
技术研发人员：罗东华，鲁娜，董善志，
申请(专利权)人：山东传媒职业学院，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人