一种玩具的基于语音识别的自学习方法和自学习装置制造方法及图纸

技术编号:13286590 阅读:65 留言:0更新日期:2016-07-09 02:35
本发明专利技术公开了一种玩具的基于语音识别的自学习方法和自学习装置。该自学习方法,包括:输出语音采集提示,开启语音采集设备;所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据;所述语音采集设备采集与所述第一音频数据匹配的第二音频数据;将所述第一音频数据和第二音频数据关联保存。通过在输出提示后所述语音采集设备采集第一音频数据并提取音频数据的特征数据,在采集与第一音频数据匹配的第二音频数据后将第二音频数据和第一音频数据关联保存,实现了玩具自身对语音的学习,避免了预存语音对玩具的语种的限制,避免了玩具制作过程中针对不同语种区域预存不同音频数据。

【技术实现步骤摘要】

本专利技术涉及智能玩具领域,尤其涉及一种玩具的基于语音识别的自学习方法和自学习装置
技术介绍
随着电子技术和人工智能的不断发展,玩具作为一种面向特定用户群体的电子设备,因为其良好的互动性受到越来越多人的青睐,例如对玩具说“唱歌”,玩具在识别出“唱歌”指令后,会播放预存的歌曲。但是现有的玩具只能当做一种根据预设的剧本进行互动的玩具,其互动方式的多样性受制于玩具生产时输入的剧本个数,如果预置的剧本个数为3个,那么玩具只能对3种语音内容进行响应;如果预置的剧本个数为10个,那么玩具只能对10种语音内容进行响应。那么当儿童对玩具进行一段时间的体验后,因为互动内容没有更新,儿童玩具的互动性会逐步下降,丧失玩具功能。并且如果通过预置的方式设置互动内容,需要为每一个玩具预存互动内容;如果要面向不同的语种区域的客户群体,还需要准备多种不同语种的互动内容。
技术实现思路
本专利技术提供了一种玩具的基于语音识别的自学习方法和自学习装置,其通过在输出提示后所述语音采集设备采集第一音频数据并提取音频数据的特征数据,在采集与第一音频数据匹配的第二音频数据后将第二音频数据和第一音频数据关联保存,实现了玩具自身对语音的学习,避免了预存语音对玩具的语种的限制,避免了玩具制作过程中针对不同语种区域预存不同音频数据。为实现上述设计,本专利技术采用以下技术方案:一方面采用一种玩具的基于语音识别的自学习方法,包括:输出语音采集提示,开启语音采集设备;所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据;所述语音采集设备采集与所述第一音频数据匹配的第二音频数据;将所述第一音频数据和第二音频数据关联保存。其中,所述将所述第一音频数据和第二音频数据关联保存之后,还包括:当采集到外部音频数据且从所述外部音频数据中提取到的特征数据与所述第一音频数据的特征数据的相似度达到预设的阈值时,输出第二音频数据。其中,所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据,具体为:所述语音采集设备采集重复一至三次的第一语音产生的一至三份第一音频数据,根据所述一至三份第一音频数据提取特征数据。其中,所述输出语音采集提示,开启语音采集设备之前,还包括:接收学习行为执行指令。其中,所述语音采集设备为单个麦克风。另一方面采用一种玩具的基于语音识别的自学习装置,包括:状态初始化模块,用于输出语音采集提示,开启语音采集设备;第一采集模块,用于所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据;第二采集模块,用于所述语音采集设备采集与所述第一音频数据匹配的第二音频数据;数据保存模块,用于将所述第一音频数据和第二音频数据关联保存。其中,还包括:声音响应模块,用于当采集到外部音频数据且从所述外部音频数据中提取到的特征数据与所述第一音频数据的特征数据的相似度达到预设的阈值时,输出第二音频数据。其中,所述第一采集模块,具体用于:所述语音采集设备采集重复一至三次的第一语音产生的一至三份第一音频数据,根据所述一至三份第一音频数据提取特征数据。其中,还包括:状态激活模块,用于接收学习行为执行指令。其中,所述语音采集设备为单个麦克风。本专利技术的有益效果为:通过在输出提示后所述语音采集设备采集第一音频数据并提取音频数据的特征数据,在采集与第一音频数据匹配的第二音频数据后将第二音频数据和第一音频数据关联保存,实现了玩具自身对语音的学习,避免了预存语音对玩具的语种的限制,避免了玩具制作过程中针对不同语种区域预存不同音频数据。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术具体实施方式中提供的一种玩具的基于语音识别的自学习方法的第一实施例的方法流程图。图2是本专利技术具体实施方式中提供的一种玩具的基于语音识别的自学习方法的第二实施例的方法流程图。图3是本专利技术具体实施方式中提供的一种玩具的基于语音识别的自学习装置的第一实施例的结构方框图。图4是本专利技术具体实施方式中提供的一种玩具的基于语音识别的自学习装置的第二实施例的结构方框图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其是本专利技术具体实施方式中提供的一种玩具的基于语音识别的自学习方法的第一实施例的方法流程图。如图所示,该自学习方法,包括:步骤S101:输出语音采集提示,开启语音采集设备。当玩具进行自学习时,会首先输出语音采集提示,一般而言,语音采集提示为语音提示,直接通过语音提醒用户可以说话;或者,也可以采用视觉提示,例如玩具上的灯进行闪烁或进入常亮状态,提醒用户玩具已经准备好采集语音。玩具在输出语音提示时,玩具同时将语音采集设备开启,以备采集语音。语音采集设备例如拾音器和麦克风。拾音器集成了先进的噪声处理、回声处理以及长距传输驱动电路,以高保真的音质忠实地记录和还原现场。麦克风(简称为话筒),单纯是一种将声音转换成电子信号的换能器,通常是定向的低灵敏的,在很近的距离对准了发生才能起到想要的声音采集效果。步骤S102:所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据。玩具的互动过程可以视为玩具与用户的互动过程,一般而言,互动由用户发起,由玩具进行响应,第一音频数据是用户发起互动时玩具是否进行响应的判断参照,也就是说第一音频数据用于激活互动过程。针对第一音频数据在整个互动过程中的重要作用,采集第一音频数据时需要提取第一音频数据的特征数据,在后续进行互动时,玩具需要提取外部发起互动的语音产生的音频数据与特征数据的相似性,进而判断是否响应互动。步骤S103:所述语音采集设备采集与所述第一音频数据匹配的第二音频数据。第二音频数据用于玩具互动时输出,即玩具判断需要对互动进行响应时,输出对应的第二音频数据。所以在整个过程中只需要对第二本文档来自技高网...

【技术保护点】
一种玩具的基于语音识别的自学习方法,其特征在于,包括:输出语音采集提示,开启语音采集设备;所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据;所述语音采集设备采集与所述第一音频数据匹配的第二音频数据;将所述第一音频数据和第二音频数据关联保存。

【技术特征摘要】
1.一种玩具的基于语音识别的自学习方法,其特征在于,包括:
输出语音采集提示,开启语音采集设备;
所述语音采集设备采集第一音频数据,提取所述第一音频数据的特征数据;
所述语音采集设备采集与所述第一音频数据匹配的第二音频数据;
将所述第一音频数据和第二音频数据关联保存。
2.根据权利要求1所述的自学习方法,其特征在于,所述将所述第一音频
数据和第二音频数据关联保存之后,还包括:
当采集到外部音频数据且从所述外部音频数据中提取到的特征数据与所述
第一音频数据的特征数据的相似度达到预设的阈值时,输出第二音频数据。
3.根据权利要求1所述的自学习方法,其特征在于,所述语音采集设备采
集第一音频数据,提取所述第一音频数据的特征数据,具体为:
所述语音采集设备采集重复一至三次的第一语音产生的一至三份第一音频
数据,根据所述一至三份第一音频数据提取特征数据。
4.根据权利要求1所述的自学习方法,其特征在于,所述输出语音采集提
示,开启语音采集设备之前,还包括:
接收学习行为执行指令。
5.根据权利要求1所述的自学习方法,其特征在于,所述语音采集设备为
单个麦克风。

【专利技术属性】
技术研发人员:孙涛
申请(专利权)人:深圳市艾塔文化科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1