一种可以自由定制对话的语音点播装置制造方法及图纸

技术编号:9854880 阅读:119 留言:0更新日期:2014-04-02 18:05
本发明专利技术提供一种可以自由定制对话的语音点播装置,包括音频输入装置(1)、触发装置(2)、音频播放装置(3)、主控模块(4)和存储器(5),所述的主控模块(4),其信号输入端分别与音频输入装置(1)、触发装置(2)的信号输出端相连,其信号输出端与音频播放装置(3)的信号输入端相连,主控模块(4)与存储器(5)相连。本发明专利技术通过触发装置触发主控模块播放识别启动提示音,以提示使用者说出对话命令词;主控模块启动语音识别功能,通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。

【技术实现步骤摘要】
【专利摘要】本专利技术提供一种可以自由定制对话的语音点播装置,包括音频输入装置(1)、触发装置(2)、音频播放装置(3)、主控模块(4)和存储器(5),所述的主控模块(4),其信号输入端分别与音频输入装置(1)、触发装置(2)的信号输出端相连,其信号输出端与音频播放装置(3)的信号输入端相连,主控模块(4)与存储器(5)相连。本专利技术通过触发装置触发主控模块播放识别启动提示音,以提示使用者说出对话命令词;主控模块启动语音识别功能,通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。【专利说明】—种可以自由定制对话的语音点播装置
本专利技术涉及一种语音点播装置,尤其是一种可以自由定制对话的语音点播装置。
技术介绍
基于目前的技术,可以实现人与机器之间的对话,增强了人机对话的趣味性。但是,目前市面常用的人机对话装置,主要是以对话玩具和机器人为主,此类装置的对话命令词固定,必须是开发人员事先在装置中预置的命令词,无法让实际用户根据需要自由定制对话。这样大大降低了整个装置的可玩性和趣味性。
技术实现思路
本专利技术的目的在于提供一种利用语音识别技术,能够快速、精准地点播装置中所存储的对话文件并可以自由定制对话命令词和对话内容的语音点播装置。为实现上述目的,本专利技术采用了以下技术方案:一种可以自由定制对话的语音点播装置,包括音频输入装置、触发装置、音频播放装置、主控模块和存储器,所述的主控模块,其信号输入端分别与音频输入装置、触发装置的信号输出端相连,其信号输出端与音频播放装置的信号输入端相连,主控模块与存储器相连。所述的音频输入装置米用麦克风。所述的触发装置采用按键或感应触控装置。所述的音频播放装置采用音频放大器、扬声器和/或耳机。所述的主控模块、音频输入装置、音频播放装置和存储器均位于实体的壳体内,该壳体上开设有与麦克风大小相吻合的通孔,该壳体上设有与扬声器大小相吻合的镂空面板,所述的触发装置固设在壳体内或者壳体上。进一步的,存储器内可以存储音频文件,对话定制人员可以通过电脑等工具对存储器进行读入和擦写,对话定制人员需要将目标对话命令词作为音频名称,将装置的回答语作为音频内容。进一步的,使用者通过触发装置触发主控模块播放识别启动提示语,以提示使用者说出对话命令词;主控模块启动语音识别功能(此功能为当前成熟的技术),通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。进一步的,当前音频文件播放完毕,不会继续播放下一个音频文件,而是直接触发主控模块播放识别启动提示语,提示使用者可以继续进行对话。由上述技术方案可知,本专利技术通过触发装置触发主控模块播放识别启动提示音,以提示使用者说出对话命令词;主控模块启动语音识别功能,通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。此音频文件的名称就是对话命令词,音频文件的播放内容就是装置的回答语。音频文件播放完毕,不会继续播放下一个音频文件,而是直接播放主控模块识别提示语,提示使用者可以继续进行对话。本专利技术具体改进之处在于:1、改变对话功能的实现方式,降低对话功能定制的门槛。目前市场既有的对话装置,对话功能是开发人员预置的,是固定在装置中的。一旦装置开发、生产完毕,普通用户无法修改、定制对话命令词和对话回答语。本专利技术通过语音点播音频文件的方式来实现对话功能,这样就给普通用户提供一种对话定制方法:将音频文件的名称作为对话命令词,将音频文件的播放内容作为对话回答语。只要借用电脑或者其他音频处理工具,完成对音频文件的录制和重命名,然后把音频文件存放于本专利技术所述装置的存储器中即可。2、本专利技术的主控模块可以米用科大讯飞MicroSpeech2501芯片,可以同时对存储器中的3000个音频文件进行点播。通过此办法,极大的扩展了语音对话数量。目前市面常用的对话装置产品,只能进行30~50个命令词的识别。3、普通使用者可以自己定制对话命令词和对话回答语,并且可以支持3000个命令词的点播。基于以上两个基础,普通使用者可以将一个音频文件命名为不同的文件名称,从而可以达到自由识别以及模糊识别的效果。例如:关于“你叫什么名字”,说法可以有“你叫什么名字”、“你的名字是什么”、“告诉我你的名字吧”、“我想知道你的名字”、“你能告诉我你的名字吗”……,如果采用传统的对话装置,由于命令词限制,可能只能固定识别一个命令词。如果采用本专利技术所涉及到的装置,普通使用者可以把“你叫什么名字.mp3f命名为“你叫什么名字.mp3”、“你的名字是什么.mp3”、“告诉我你的名字吧.mp3”、“我想知道你的名字.mp3”、“你能告诉我你的名字吗.mp3”……,这些音频文件的播放内容都是相同的,例如都是“我叫聪明可爱的小小机器人”。按照此方法,使用者在对话时,只要说出上述说法中的一种,就可以得到“我叫聪明可爱的小小机器人”的回答。通过此种方法,装置可以在一定程度实现自由识别以及模糊识别。此专利技术的创新之处 在于:1、巧妙借用语音点播音频文件的方式来实现对话功能,将音频文件的名称作为对话命令词,将音频文件的播放内容作为对话回答语。对话定制人员只要在存储介质中放置相应的音频文件,将装置的回答语事先录制到音频文件中,将音频文件的名称设置为目标命令词,就可以实现自由定制对话,非常方便快捷。2、当前音频文件播放完毕,不会继续播放下一个音频文件,而是直接播放识别启动提示语,提示使用者可以继续对话,这样就可以持续不断的引导使用者进行对话。这是在用户体验上让使用者产生强烈的人机对话的体验效果,以区别于传统的语音点播音乐播放器。【专利附图】【附图说明】图1是本专利技术的结构示意图。【具体实施方式】下面结合附图以及具体实施例进一步说明本专利技术。一种可以自由定制对话的语音点播装置,包括主控模块4,其信号输入端分别与音频输入装置1、触发装置2的信号输出端相连,其信号输出端与音频播放装置3的信号输入端相连,主控模块4与存储器5相连,存储器5内存储有音频文件。如图1所示,所述的音频输入装置I采用麦克风,所述的触发装置2采用按键或感应触控装置,所述的音频播放装置3采用音频放大器、扬声器和/或耳机。如图1所示,所述的主控模块4、音频输入装置1、音频播放装置3和存储器5均位于壳体内,该壳体上开设有与麦克风大小相吻合的通孔,该壳体上设有与扬声器大小相吻合的镂空面板,所述的触发装置2固设在壳体内或者壳体上。存储器5内可以存储音频文件,对话定制人员可以通过电脑等工具对存储器5进行读入和擦写。对话定制人员需要将目标对话命令词作为音频名称,将装置的回答语作为音频内容。例如定制人员如果想让装置对“你从哪里来”命令词进行回答,则需要在存储器中新建一个名称为“你从哪里来.mp3”音频文件,然后将机器的回答语“我来自浩渺宇宙的另一端,我的星球叫做摩羯星座”录制到“你从哪里来.mp3”本文档来自技高网...

【技术保护点】
一种可以自由定制对话的语音点播装置,其特征在于:包括音频输入装置(1)、触发装置(2)、音频播放装置(3)、主控模块(4)和存储器(5),所述的主控模块(4),其信号输入端分别与音频输入装置(1)、触发装置(2)的信号输出端相连,其信号输出端与音频播放装置(3)的信号输入端相连,主控模块(4)与存储器(5)相连。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙秀明刘丛刚谭雪辉吴晓春谢信珍黄海兵
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1