一种录入语音的展示方法、装置、终端及存储介质制造方法及图纸

技术编号:19011737 阅读:19 留言:0更新日期:2018-09-22 11:07
本发明专利技术实施例公开了一种录入语音的展示方法、装置、终端及存储介质,所述方法包括:根据语音录入指令,显示三维静止录入背景;实时捕捉用户录入的语音信号;根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像;在所述三维静止录入背景中显示所述三维粒子群图像,其中,所述三维粒子群图像中各个显示粒子具有设定形状,实现以三维粒子群图像的方式显示实时捕捉的用户录入的语音信号,消除流动声波带给用户的压力感,从而提高用户体验、提高显示的科技感。

【技术实现步骤摘要】
一种录入语音的展示方法、装置、终端及存储介质
本专利技术实施例涉及语音处理
,尤其涉及一种录入语音的展示方法、装置、终端及存储介质。
技术介绍
随着智能手机、平板电脑以及PC(PersonalComputer,个人计算机)等各种终端的智能化发展,智能电视所能够实现的功能也空前丰富,各种功能的应用层出不穷。对于终端中的部分应用,常常需要输入一定的内容。传统的输入方式是通过终端中设置的输入法按键的方法输入文本内容。通过输入法按键的输入方式虽然较为成熟,但输入效率比较低。在终端的智能化发展阶段,随着终端上运行的应用越加丰富,需要输入数据的情况越来越多,传统的输入方式效率低下,已经不能满足多种应用的输入需求。近年来,通过语音输入的操作方式应用越来越普及,终端上的应用软件授予权限后,可以访问终端中的麦克风,并利用音频录制接口获取麦克风录入的声音。具有语音录入功能的应用软件在与用户交互时,可以通过语音动画的形式,如流动的声波,向用户实时反馈语音录入状态,从而让用户直观地了解目前正处于语音录入状态。但是,现有的技术中通常采用流动的声波展示出类似声音频谱的涟漪效果,而在视觉上一直流动的声波往往会给用户造成一种无形的压力感,进而造成较差的用户体验。
技术实现思路
本专利技术实施例提供一种录入语音的展示方法、装置、终端及存储介质,消除流动声波带给用户的压力感,从而提高用户体验、提高显示的科技感。第一方面,本专利技术实施例提供了一种录入语音的展示方法,包括:根据语音录入指令,显示三维静止录入背景;实时捕捉用户录入的语音信号;根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像;在所述三维静止录入背景中显示所述三维粒子群图像,其中,所述三维粒子群图像中各个显示粒子具有设定形状。第二方面,本专利技术实施例还提供了一种录入语音的展示装置,包括:背景显示模块,用于根据语音录入指令,显示三维静止录入背景;信号捕捉模块,用于实时捕捉用户录入的语音信号;图像构造模块,用于根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像;图像显示模块,用于在所述三维静止录入背景中显示所述三维粒子群图像,其中,所述三维粒子群图像中各个显示粒子具有设定形状。第三方面,本专利技术实施例还提供了一种终端,所述终端包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述所涉及的任一所述的录入语音的展示方法。第四方面,本专利技术实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所涉及的任一所述的录入语音的展示方法。本专利技术实施例通过在三维静止录入背景中,以三维粒子群图像的方式显示实时捕捉的用户录入的语音信号,消除流动声波带给用户的压力感,从而提高用户体验、提高显示的科技感。附图说明图1a是本专利技术实施例一提供的一种录入语音的展示方法的流程图;图1b是现有技术中的一种语音录入背景的效果示意图;图1c是本专利技术实施例一提供的一种三维静止录入背景的示意图;图1d是本专利技术实施例一提供的一种三维粒子图像的效果示意图;图1e是本专利技术实施例一提供的一种三维语音录入背景的示意图;图2a是本专利技术实施例二提供的一种录入语音的展示方法的流程图;图2b是本专利技术实施例二提供的一种二维波动图像的示意图;图3是本专利技术实施例三提供的一种录入语音的展示装置的示意图;图4为本专利技术实施例四提供的一种终端的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或S)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤(S)。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1a是本专利技术实施例一提供的一种录入语音的展示方法的流程图,图1b是现有技术中的一种语音录入背景的效果示意图,本实施例可适用于实时显示录入的语音的情况,该方法可以由录入语音的展示装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在终端中,通过与用户录入语音的功能配合使用,该方法包括如下操作:S110、根据语音录入指令,显示三维静止录入背景。其中,语音录入指令可以通过终端中应用程序的功能界面中提供的语音输入功能的虚拟按钮获取,例如,手机百度搜索界面中的麦克风标志虚拟按钮。另外,语音录入指令也可以通过终端设置的按键按照预设规则被触发时获取,例如,长按终端中的home键启动语音录入功能。三维静止录入背景是一种从三维角度显示的静止背景,与现有的语音录入背景不同,在没有检测到语音录入时,三维静止录入背景没有任何波形显示。如图1b所示,现有的语音录入背景在没有检测到语音录入功能时,同样以仿声音频谱的流动波形进行显示,这就会给用户造成一种无形的压力感,使得用户会给自己类似于“我必须应该说点什么”的心理暗示,从而造成较差的用户体验。图1c是本专利技术实施例一提供的一种三维静止录入背景的示意图,如图1c所示,本专利技术实施例中的三维静止录入背景虽然没有仿声音频谱的流动波形,但是在背景中显示有根据录入语音可以上下波动的粒子,能够让用户通过背景中粒子的波动情况直观了解语音录入的情况。需要说明的是,图1c只是示例性地示出了包含粒子群区域的封闭四边形的轮廓,虽然图1c中未示出,但实际在图1c中四边形的内部同样均匀分布着粒子。S120、实时捕捉用户录入的语音信号。本专利技术实施例中,在终端的语音录入功能被启动后,展示三维静止录入背景的语音功能界面,并启动终端中的音频采集装置,例如手机上的麦克风等,以实时获取用户录入的语音信号。S130、根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像。其中,语音特征信息包括语音的声强、响度、音高、音色、音频以及信噪比等多种特征信息,在此不一一列举。粒子群是由三维静止录入背景中的各个粒子组成的群体,粒子群图像是由三维静止录入背景中的各个粒子根据录入的语音信号匹配呈现的三维波形图像。在本专利技术实施例中,构造三维粒子群图像时,需要以当前用户录入的语音信号的语音特征信息为依据,使得三维粒子群图像能够与语音特征信息相匹配,以实现实时反映用户当前录入的语音情况。在本专利技术的一个可选实施例中,所述语音信号的语音特征信息包括下述至少一项:所述语音信号的信号频率、所述语音信号的音色波形,以及所述语音信号的响度。其中,语音信号的信号频率即语音特征信息中的音频,通常在20-20000Hz范围之内。音色又称音品,是听觉感到的声音的特色。音色主要决定于声音的频谱,即基音和各次谐音的组成,也和波形、声压及声音的时间特性有关系,因此,可以根据音色确定当前语音信号的波形形状。响度是一种主观心理量,是人类主观感觉到的声音强弱程度。一般来说,语音信号的信号频率一定时,声强越强,响度本文档来自技高网...
一种录入语音的展示方法、装置、终端及存储介质

【技术保护点】
1.一种录入语音的展示方法,其特征在于,包括:根据语音录入指令,显示三维静止录入背景;实时捕捉用户录入的语音信号;根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像;在所述三维静止录入背景中显示所述三维粒子群图像,其中,所述三维粒子群图像中各个显示粒子具有设定形状。

【技术特征摘要】
1.一种录入语音的展示方法,其特征在于,包括:根据语音录入指令,显示三维静止录入背景;实时捕捉用户录入的语音信号;根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像;在所述三维静止录入背景中显示所述三维粒子群图像,其中,所述三维粒子群图像中各个显示粒子具有设定形状。2.根据权利要求1所述的方法,其特征在于,所述语音信号的语音特征信息包括下述至少一项:所述语音信号的信号频率、所述语音信号的音色波形,以及所述语音信号的响度。3.根据权利要求2所述的方法,其特征在于,根据所述语音信号的语音特征信息,构造与所述语音信号匹配的三维粒子群图像,包括:获取所述语音信号在不同时间采集区间下区间语音信号;根据各所述区间语音信号的语音特征信息,得到与各区间语音信号所在的时间采集区间对应的二维粒子波动图像;按照时间顺序将各所述二维粒子波动图像进行组合,得到所述三维粒子群图像。4.根据权利要求3所述的方法,其特征在于,根据所述区间语音信号的语音特征信息,得到与区间语音信号所在的时间采集区间对应的二维粒子波动图像,包括:根据所述区间语音信号的信号频率,得到目标粒子的悬浮高度;根据所述区间语音信号的音色波形,得到与所述目标粒子关联的初始二维粒子图像;根据所述区间语音信号的响度,调整所述初始二维粒子图像的形状,得到与区间语音信号所在的时间采集区间对应的二维粒子波动图像。5.根据权利要求1-4任一项所述的方法,其特征在于,所述三维静止录入背景,具体包括:由X轴以及Y轴构成的第一平面,由Y轴以及Z轴构成的第二平面,以及由X轴和Z轴构成的第三平面,所述第一平面由多个原始粒子组合构成,所述原始粒子与所述显示粒子的形状相同;在所述三维静止录入背景中显示所述三维粒子群图像,包括:在所述三维静止录入背景的所述第一平面中,确定与所述三维粒子群图像中的各显示粒子分别对应的关联原始粒子;按照设定动画效果,将所述三维静止录入背景中各所述关联原始粒子移动至所述三维粒子群图像中各显示粒子所在的位置,得到所述三维粒子群图像。6.根据权利要求1-4任一项所述的方法,其特征在于,在所述三维静止录入背景中显示所述三维粒子群图像之后,还包括:按照设定消隐策略,在所述三维静止录入背景中,对所述三维粒子群图像进行消隐。7.一种录入语音的展...

【专利技术属性】
技术研发人员:吴准方晶赵嘉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1