语音输入方法、记录介质以及语音输入装置制造方法及图纸

技术编号:25894581 阅读:181 留言:0更新日期:2020-10-09 23:41
提供一种语音输入方法、记录介质以及语音输入装置,能够抑制因用户的脸部与语音输入装置接近而造成的语音识别性能的降低。语音输入方法包括:检测步骤(S11),对用户的脸部与具备至少一个传声器的语音输入装置是否接近进行检测;以及校正步骤(S12),在检测到所述用户的脸部与所述语音输入装置接近的情况下(S11的“是”),对由所述至少一个传声器拾取的语音信号进行校正处理。

【技术实现步骤摘要】
语音输入方法、记录介质以及语音输入装置
本申请涉及语音输入方法、记录介质以及语音输入装置。
技术介绍
以往公开的技术是,在对说话者的语音进行声音拾取的声音拾取装置中,在减少噪音的影响的同时进行声音拾取(例如,专利文献1)。(现有技术文献)(专利文献)专利文献1日本特开2010-50571号公报近些年,在街头巷尾等出现了如下的交流方式,即对通过声音拾取装置(在此称为语音输入装置)拾取的用户的语音进行翻译,将翻译结果显示到语音输入装置所具备的显示器,或者通过语音输入装置所具备的传声器输出,从而实现与对方的交流。然而,由于周围的噪音等而出现不能正确地进行语音识别的情况,因此,用户使语音输入装置接近脸部(具体而言为嘴)再次发出语音,再次进行语音识别。此时,由于用户的脸部与语音输入装置接近,从而会有语音识别性能降低的问题。
技术实现思路
于是,本申请提供一种能够抑制因用户的脸部与语音输入装置接近而造成的语音识别性能降低的语音输入方法等。本申请所涉及的语音输入方法包括:检测步骤,对用户的脸部与具备至少一个传声器的语音输入装置是否接近进行检测;以及校正步骤,在检测到所述用户的脸部与所述语音输入装置接近的情况下,对由所述至少一个传声器拾取的语音信号进行校正处理。另外,这些概括的或具体的形态可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质来实现,也可以通过对系统、方法、集成电路、计算机程序以及记录介质进行任意地组合来实现。通过本申请的一个形态所涉及的语音输入方法等,能够抑制因用户的脸部与语音输入装置接近而造成的语音识别性能的降低。附图说明图1是用于说明因用户的脸部与语音输入装置接近而造成的语音识别性能降低的图。图2是示出实施方式所涉及的语音输入装置的构成的一个例子的方框图。图3是示出实施方式所涉及的语音输入方法的一个例子的流程图。图4A是用于说明将实施方式所涉及的语音输入装置与用户的脸部接近时,给语音输入装置施加的力的图。图4B示出了将实施方式所涉及的语音输入装置与用户的脸部接近时的语音输入装置所具备的三轴加速度传感器的输出信号的一个例子。图5A是用于说明将实施方式所涉及的语音输入装置与用户的脸部接近时的语音输入装置所具备的相机的位置以及朝向的变化的图。图5B示出了在将实施方式所涉及的语音输入装置与用户的脸部接近时,由语音输入装置所具备的相机进行拍摄而获得的图像中映现的用户的脸部的大小的变化。符号说明10传声器20检测部30三轴加速度传感器31比较部32模式数据40相机41脸部检测部42脸部大小测定部50ADC60校正部61放大电路62指向性合成部63接近效果校正部100语音输入装置200用户具体实施方式(得到本申请的一个形态的经纬)首先,利用图1对得到本申请的一个形态的经纬进行说明。图1是用于说明由于用户200的脸部与语音输入装置100接近而造成的语音识别性能降低的图。例如,在用户200想要与和自己使用的语言不通的对方进行交流的情况下,则会使用语音输入装置100。通常,用户200会在自己的胸前拿着语音输入装置100来发出想要翻译的语音。据此,语音输入装置100拾取该语音,例如通过服务器装置来进行语音识别,并翻译成所希望的语言。但是,在街头巷尾等,由于周围的噪音等而不能正确地进行语音识别,会有如图1所示的情况,用户200将语音输入装置100接近自己的脸部再次发出语音,并再次进行语音识别。这样,在用户200的脸部与语音输入装置100接近的情况下,而出现后述的问题。另外,在用户200使自己的脸部与语音输入装置100接近时,也会出现用户200的脸部与语音输入装置100接近的情况。例如,语音输入装置100有具备至少两个传声器的情况,以该至少两个传声器拾取的语音信号会有成为具有单一指向性的语音信号的情况。即,语音输入装置100会有针对特定的方向的声音拾取灵敏度增高的情况,换而言之,会有特定的方向以外的声音拾取灵敏度变低的情况。例如,在语音输入装置100位于用户200的胸前的情况下,该单一指向性则是朝向用户200的脸部方向的声音拾取灵敏度增高的指向性。这样,在被声音拾取的语音信号为具有单一指向性的语音信号的情况下,由于用户200的脸部与语音输入装置100接近,用户200的嘴从声音拾取灵敏度高的方向偏离,则会有不能正常进行语音识别的情况。并且,例如在用户200的脸部与语音输入装置100接近的情况下,通过语音输入装置100所具备的传声器而拾取的语音的输入信号电平上升,根据情况而会成为饱和状态,从而不能正常地进行语音识别。并且,例如在用户200的脸部与语音输入装置100接近的情况下,由于接近效果,以语音输入装置100所具备的传声器拾取的语音的低音区被强调,从而会有不能正常地进行语音识别的情况。因此,本申请的一个形态所涉及的语音输入方法包括:检测步骤,对用户的脸部与具备至少一个传声器的语音输入装置是否接近进行检测;以及校正步骤,在检测到所述用户的脸部与所述语音输入装置接近的情况下,对由所述至少一个传声器拾取的语音信号进行校正处理。据此,由于进行用户的脸部与语音输入装置是否接近的检测,因此在检测到用户的脸部与语音输入装置接近的情况下,能够进行抑制因用户的脸部与语音输入装置的接近而造成的语音识别性能的降低的校正处理。因此,能够抑制因用户的脸部与语音输入装置的接近而造成的语音识别性能的降低。由于语音识别性能的降低得到抑制,例如能够正确地对拾取的语音进行翻译。并且,也可以是,所述至少一个传声器至少为两个,所述语音信号是由所述至少两个传声器拾取的具有单一指向性的语音信号,所述校正处理包括将单一指向性变换为全指向性的处理。在用户的脸部与语音输入装置接近的情况下,即使拾取的语音信号为全指向性,声音拾取灵敏度也容易达到相当高的级别。因此,在用户的脸部与语音输入装置接近的情况下,通过进行将单一指向性变换为全指向性的处理,从而不会受到相对于传声器的用户的脸部的方向的影响,能够抑制语音识别性能的降低。并且也可以是,所述校正处理包括降低增益的处理。据此,通过进行降低增益的处理,在用户的脸部与语音输入装置接近的情况下,能够抑制由语音输入装置100所具备的传声器拾取的语音的输入信号电平饱和,从而能够抑制语音识别性能的降低。并且也可以是,所述校正处理包括使规定的频率以下的成分的增益降低的处理。据此,通过进行降低规定的频率以下的成分(例如低音区的成分)的增益的处理,从而在用户的脸部与语音输入装置接近的情况下,能够抑制因接近效果而导致的低音区的强调,从而能够抑制语音识别性能的降低。并且也可以是,所述语音输入装置具备三轴加速度传感器,在所述检测步骤,按照所述三轴加速度传感本文档来自技高网...

【技术保护点】
1.一种语音输入方法,包括:/n检测步骤,对用户的脸部与具备至少一个传声器的语音输入装置是否接近进行检测;以及/n校正步骤,在检测到所述用户的脸部与所述语音输入装置接近的情况下,对由所述至少一个传声器拾取的语音信号进行校正处理。/n

【技术特征摘要】
20200120 JP 2020-006980;20190327 US 62/8246081.一种语音输入方法,包括:
检测步骤,对用户的脸部与具备至少一个传声器的语音输入装置是否接近进行检测;以及
校正步骤,在检测到所述用户的脸部与所述语音输入装置接近的情况下,对由所述至少一个传声器拾取的语音信号进行校正处理。


2.如权利要求1所述的语音输入方法,
所述至少一个传声器至少为两个,
所述语音信号是由所述至少两个传声器拾取的具有单一指向性的语音信号,
所述校正处理包括将单一指向性变换为全指向性的处理。


3.如权利要求1所述的语音输入方法,
所述校正处理包括降低增益的处理。


4.如权利要求1所述的语音输入方法,
所述校正处理包括使规定的频率以下的成分的增益降低的处理。


5.如权利要求1所述的语音输入方法,
所述语音输入装置具备三轴加速度传感器,
在所述检测步骤,按照所述三轴加速度传感器的输出随时间变化的模式与预先测量的模式的比较结果,来检测所述用户的脸部与所述语音输入装置是否接近。


6.如权利要求1所述的语音输入方法,
所述语音输入装置具备相机,
在所述检测步骤,按照由所述相机进行拍摄而获得的图像中包括的所述用户的脸部的大小的变化,来检测所述用户的脸部与所述语音输入装置是否...

【专利技术属性】
技术研发人员:野村和也古川博基金森丈郎杠慎一
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1