声音输出的调整方法及执行该调整方法的电子装置制造方法及图纸

技术编号:27436260 阅读:26 留言:0更新日期:2021-02-25 03:25
一种声音输出的调整方法包括下列步骤:接收声音信息,其中声音信息具有母音语音信息;判断声音信息是否为一悄悄声语音信息;若接收到的声音信息为悄悄声语音信息,则输出一正常声语音信息,其中正常声语音信息具有与声音信息相同的语音内容,并包括一母音正常声语音信息,其中母音正常声语音信息低频部分的声音能量为母音语音信息低频部分的声音能量的1.5倍至1000000倍。至1000000倍。至1000000倍。

【技术实现步骤摘要】
声音输出的调整方法及执行该调整方法的电子装置


[0001]本专利技术涉及一种声音输出的调整方法及执行该调整方法的电子装置,特别涉及一种有关调整悄悄声语音信息声音的方法及执行该调整方法的电子装置。

技术介绍

[0002]有时候基于一些原因,例如在会议中,为避免打扰会议的进行,我们必须小声地接听电话。但发话者以悄悄声说话时,将会导致受话对象听不清楚,造成对话上的困难和不便。此外,在有些时候,如以悄悄声和携带助听器的听障者当面说话时,亦会使该听障者无法听清楚说话的内容,造成听障者的困扰。
[0003]因此,实有必要专利技术一种声音输出的调整方法,以解决前揭提到的缺失。

技术实现思路

[0004]本专利技术的主要目的在于提供一种针对悄悄话声音输出的调整方法。
[0005]本专利技术的另一主要目的在于提供一种执行上述调整方法的电子装置。
[0006]为达成上述的目的,本专利技术的声音输出的调整方法适用于一电子装置。本专利技术的声音输出的调整方法包括下列步骤:接收声音信息,声音信息包括一母音语音信息;判断该声音信息是否为一悄悄声语音信息;若接收到的声音信息为悄悄声语音信息,则输出一正常声语音信息,其中该正常声语音信息具有与声音信息相同的语音内容,并包括一母音正常声语音信息,其中该母音正常声语音信息低频部分的声音能量为该母音语音信息低频部分的声音能量的1.5倍至1000000倍。
[0007]本专利技术的电子装置包括有信号接收端以及处理单元,其中处理单元系与信号接收端耦接。信号接收端用以接收声音信息,其中声音信息包括一母音语音信息。处理单元用以判断声音信息是否为一悄悄声语音信息,并在声音信息为悄悄声语音信息时,输出正常声语音信息,其中该正常声语音信息具有与声音信息相同的语音内容,并包括一母音正常声语音信息,其中母音正常声语音信息低频部分的声音能量为母音语音信息低频部分的声音能量的1.5倍至1000000倍。
[0008]以下结合附图和具体实施例对本专利技术进行详细描述,但不作为对本专利技术的限定。
附图说明
[0009]图1表示本专利技术的电子装置的第一实施例的使用环境示意图;
[0010]图2表示本专利技术的电子装置的第二实施例的使用环境示意图;
[0011]图3表示本专利技术的电子装置的第三实施例的使用环境示意图;
[0012]图4表示本专利技术的电子装置的第四实施例的使用环境示意图;
[0013]图5表示本专利技术的声音输出的调整方法的一实施例的步骤流程图。
[0014]其中,附图标记
[0015]电子装置 1
[0016]信号接收端 10
[0017]储存单元 20
[0018]第一人工智能模型 21
[0019]第二人工智能模型 22
[0020]处理单元 30
[0021]通讯模块 40
[0022]喇叭 50
[0023]麦克风 80
[0024]声音播放装置 90
[0025]通讯模块 91
[0026]扬声器 92
[0027]声音信息 100
[0028]正常声语音信息 200
具体实施方式
[0029]为能更了解本专利技术的
技术实现思路
,特举较佳具体实施例说明如下。
[0030]以下请先参考图1至图4。图1表示本专利技术的电子装置的第一实施例的使用环境示意图;图2表示本专利技术的电子装置的第二实施例的使用环境示意图;图3表示本专利技术的电子装置的第三实施例的使用环境示意图;图4表示本专利技术的电子装置的第四实施例的使用环境示意图。
[0031]如图1所示,在本专利技术的第一实施例中,本专利技术的电子装置1可和声音播放装置90连线通讯,电子装置1包括有信号接收端10、储存单元20、处理单元30及通讯模块40。在本专利技术第一实施例中,电子装置1可为智能型手机,但本专利技术不以此为限。
[0032]在本专利技术的第一实施例中,信号接收端10用以接收来自麦克风80传来的声音信息100,更具体而言,麦克风80在接收外界声音后,可产生声音信息100并将该声音信息100传送至信号接收端10。但应注意的是,在此所述的声音信息100的来源并不以麦克风80为限,例如声音信息100也可以是经由网络发送而来,并由通讯模块40接收后,发送至信号接收端10。声音信息100包括有母音语音信息及子音语音信息。通常语言结构有母音、子音之分,且实际正常说话时,母音发声音量会比子音发声来得大。本专利技术所称的母音语音信息是指当声音信息包含人类说话的语音信息时,该语音信息当中的母音部分,子音语音信息则是指该语音信息中的子音部分。
[0033]在本专利技术的第一实施例中,储存单元20用以储存一第二人工智能模型22。
[0034]在本专利技术的第一实施例中,处理单元30与信号接收端10及储存单元20耦接;在具体实施例中,处理单元30可与储存单元20整合成为一颗微处理器,但本专利技术不以此为限。处理单元30用以判断声音信息100是否为一悄悄声语音信息。在本专利技术的第一实施例中,处理单元30会检测声音信息中的母音语音信息的声音能量特征,如果声音信息100的母音语音信息低频部分(指频率低于400Hz以下)的声音能量为该母音语音信息整体的声音能量的X%,其中0.00000001≤X<4时,则处理单元30即会将声音信息100判断为悄悄声语音信息。由于人在讲悄悄话时所发出的声音,母音低频部分的声音能量相比母音整体(即全部频率)
的声音能量占比会非常小,因此,是否为悄悄声可根据母音低频部分的声音能量与母音整体的声音能量占比来判断。故在本实施例中,当处理单元30检测到声音信息100的母音语音信息低频部分的声音能量为该母音语音信息整体的声音能量的X%,其中0.00000001≤X<4时,即判断声音信息100为悄悄声语音信息。惟本专利技术悄悄声的判断方法并不以此为限,除包含下述将会提到的利用人工智能进行判断的方法外,亦可藉由检测声音信息100的母音语音信息的声波是否具有共振特性来判断。当处理单元30检测出声音信息100的母音语音信息的声波不具有共振特性时,处理单元30判断声音讯100为悄悄声语音信息。由于声波波形的检测为现有现有技术,故在此不再多做赘述。
[0035]此外,在本专利技术的第一实施例中,处理单元30可通过执行第二人工智能模型22进行声音辨识,以判断声音信息100是否为一预设使用者发出的声音。在具体实施上,第二人工智能模型22可藉由现有人工智能的训练机制来产生,也就是说,可通过现有人工智能训练机制来产生可根据声音音色判断声音信息是否由预设使用者发出的程式参数,处理单元30可执行该程式参数进行声音辨识,完成声音信息100是否为预设使用者所发出的判断。由于如何针对特定声音的辨识需求来训练可辨识声音的人工智能模型,并通过经训练后的人工智能模型实现声音辨识为现有现有技术,故在此不多做赘述。另此处需注意的是,声音信息100是否为预设使用者发出的声音的判断未必是藉由第二人工智能模型22的执行来实现,其判断也本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声音输出的调整方法,适用于一电子装置,其特征在于,该调整方法包括下列步骤:接收一声音信息,该声音信息包括一母音语音信息;判断该声音信息是否为一悄悄声语音信息;以及若是,输出一正常声语音信息,该正常声语音信息具有与该声音信息相同的语音内容,并包括一母音正常声语音信息,其中该母音正常声语音信息低频部分的声音能量为该母音语音信息低频部分的声音能量的1.5倍至1000000倍。2.根据权利要求1所述的调整方法,其特征在于,当该母音语音信息低频部分的声音能量为该母音语音信息整体的声音能量的X%时,该声音信息被判断为该悄悄声语音信息,其中0.00000001≤X<4。3.根据权利要求1所述的调整方法,其特征在于,当该母音语音信息的声波不具有共振特性时,该声音信息被判断为该悄悄声语音信息。4.根据权利要求1所述的调整方法,其特征在于,该母音正常声语音信息的声音能量为该正常声语音信息的声音能量的Y%,其中25≤Y≤400。5.根据权利要求1所述的调整方法,其特征在于,更包括下列步骤:判断该声音信息是否为一预设使用者发出的声音;以及若是,根据该预设使用者声音的音色输出的该正常声语音信息。6.根据权利要求5所述的调整方法,其特征在于,判断该声音信息是否为该预设使用者发出的声音通过执行一第二人工智能模块进行声音辨识而完成。7.根据权利要求1所述的调整方法,其特征在于,该悄悄声语音信息的判断是通过执行一第一人工智能模型进行声音辨识而完成。8.根据权利要求7所述的调整方法,其特征在于,更包括下列步骤:判断该声音信息是否为一预设使用者发出的声音;以及若是,根据该预设使用者声音的音色输出的该正常声语音信息。9.根据权利要求8所述的调整方法,其特征在于,判断该声音信息是否为该预设使用者发出的声音是通过执行一第二人工智能模块进行声音辨识而完成。10.根据权利要求7所述的调整方法,其特征在于,更包括下列步骤:通过执行该第一人工智能模型进行声音辨识,以判断该声音信息是否为一预设使用者发出的声音;以及若是,根据该预设使用者声音的音色输出的该正常声语音信息。11.一种电子装置,其特征在于,包括:一信号接收端,接收一声音信息,该声音信息包括一母音语音信息;以及一处理单元,...

【专利技术属性】
技术研发人员:赵冠力蓝伟任林鸿杨国屏
申请(专利权)人:原相科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1