语音翻译方法和装置制造方法及图纸

技术编号:17347933 阅读:23 留言:0更新日期:2018-02-25 14:28
本发明专利技术揭示了一种语音翻译方法和装置,所述方法包括以下步骤:识别原始的语音信息的语音性别;根据所述语音性别选择对应的语音合成声纹;根据选择的语音合成声纹对所述原始的语音信息进行翻译处理,以使翻译处理后的语音信息的语音性别与原始的语音信息的语音性别相一致,实现了对语音性别的自适应。当男性说话时翻译出来的语音是男声,当女性说话时翻译出来的语音是女声,使得原始语音与翻译语音协调一致,大大增强了交流的真实感,提升了用户体验。

Speech translation methods and devices

The invention discloses a speech translation method and device. The method comprises the following steps: identifying the original voice information voice according to the voice of sex; sex selection speech synthesis voiceprint corresponding translation; according to speech synthesis voiceprint on the choice of the original speech information, in order to make the translation of speech information processing the voice of gender and original speech information of speech gender consistent implementation of the adaptive speech on gender. When men speak, the voice translated is male. When the female speaking, the voice translated is the female voice, which harmonized the original voice and the translation speech, which greatly enhanced the sense of communication and improved the user experience.

【技术实现步骤摘要】
语音翻译方法和装置
本专利技术涉及电子
,特别是涉及到一种语音翻译方法和装置。
技术介绍
目前,两个说不同语言的用户交流时,可以通过翻译设备进行翻译,从而实现无障碍交流。具体实现方式为:用户说话时按压一次翻译设备的特定按键,翻译设备则采集语音信息并进行翻译处理,用户说完一段话后再按压一次按键,翻译设备则输出翻译处理后的语音信息。翻译设备翻译处理后的语音信息的语音性别是预先设定好的,用户可以设定为男声或者女声,一旦设定好后,无论说话的人是男性还是女性,翻译处理后的语音信息都是相同的语音性别。例如,当设定为男声后,如果说话的人是女性,翻译处理后的语音信息则为男声;当设定为女声后,如果说话的人是男性,翻译处理后的语音信息则为女声。由此可见,现有技术中,翻译处理后的语音信息的语音性别与原始的语音信息的语音性别有可能不一致,导致原始语音和翻译语音不协调,使得用户听起来感觉很怪异,大大降低了交流的真实感,用户体验不佳。
技术实现思路
本专利技术的主要目的为提供一种语音翻译方法和装置,旨在解决翻译处理后的语音信息的语音性别与原始的语音信息的语音性别不一致的技术问题,增强交流的真实感,提升用户体验。为达以上目的,本专利技术实施例提出一种语音翻译方法,所述方法包括以下步骤:识别原始的语音信息的语音性别;根据所述语音性别选择对应的语音合成声纹;根据选择的语音合成声纹对所述原始的语音信息进行翻译处理,以使翻译处理后的语音信息的语音性别与原始的语音信息的语音性别相一致。可选地,所述识别原始的语音信息的语音性别的步骤包括:获取所述原始的语音信息的基音的频率;比较所述基音的频率与门限值的大小;当所述基音的频率小于或等于门限值时,识别所述原始的语音信息的语音性别为男声;当所述基音的频率大于门限值时,识别所述原始的语音信息的语音性别为女声。可选地,所述获取所述原始的语音信息的基音的频率的步骤包括:以预设的采样频率对所述原始的语音信息连续采样M帧,M≥2;对采集的语音帧进行基音频率特征提取;根据提取的基音频率特征统计出所述原始的语音信息的基音的频率。可选地,25≥M≤35。可选地,所述语音帧的时长为20-30ms。可选地,所述采样频率为8kHz。可选地,所述门限值为180-220Hz。可选地,所述根据选择的语音合成声纹对所述原始的语音信息进行翻译处理的步骤包括:对所述原始的语音信息进行语音识别处理,得到原始语言的第一字符串;对所述第一字符串进行文字翻译处理,得到目标语言的第二字符串;利用选择的语音合成声纹对所述第二字符串进行语音合成处理,得到目标语言的语音信息。可选地,所述识别原始的语音信息的语音性别的步骤包括:每当检测到一段语音信息开始时,则识别所述语音信息的语音性别。可选地,所述语音合成声纹包括男声声纹和女声声纹,所述根据所述语音性别选择对应的语音合成声纹的步骤包括:当所述语音性别为男声时,选择所述男声声纹;当所述语音性别为女声时,选择所述女声声纹。本专利技术实施例同时提出一种语音翻译装置,所述装置包括:性别识别模块,用于识别原始的语音信息的语音性别;声纹选择模块,用于根据所述语音性别选择对应的语音合成声纹;翻译处理模块,用于根据选择的语音合成声纹对所述原始的语音信息进行翻译处理,以使翻译处理后的语音信息的语音性别与原始的语音信息的语音性别相一致。可选地,所述性别识别模块包括:获取单元,用于获取所述原始的语音信息的基音的频率;比较单元,用于比较所述基音的频率与门限值的大小;第一识别单元,用于当所述基音的频率小于或等于门限值时,确定所述原始的语音信息的语音性别为男声;第二识别单元,用于当所述基音的频率大于门限值时,确定所述原始的语音信息的语音性别为女声。可选地,所述获取单元包括:采样子单元,用于以预设的采样频率对所述原始的语音信息连续采样M帧,M≥2;提取子单元,用于对采集的语音帧进行基音频率特征提取;统计子单元,用于根据提取的基音频率特征统计出所述原始的语音信息的基音的频率。可选地,所述翻译处理模块包括:第一处理单元,用于对所述原始的语音信息进行语音识别处理,得到原始语言的第一字符串;第二处理单元,用于对所述第一字符串进行文字翻译处理,得到目标语言的第二字符串;第三处理单元,用于利用选择的语音合成声纹对所述第二字符串进行语音合成处理,得到目标语言的语音信息。可选地,所述性别识别模块用于:每当检测到一段语音信息开始时,则识别所述语音信息的语音性别。可选地,所述语音合成声纹包括男声声纹和女声声纹,所述声纹选择模块包括:第一选择单元,用于当所述语音性别为男声时,选择所述男声声纹;第二选择单元,用于当所述语音性别为女声时,选择所述女声声纹。本专利技术实施例还提出一种翻译设备,所述翻译设备包括存储器、处理器和至少一个被存储在所述存储器中并被配置为由所述处理器执行的应用程序,所述应用程序被配置为用于执行前述语音翻译方法。本专利技术实施例所提供的一种语音翻译方法,通过识别出原始的语音信息的语音性别,再根据语音性别选择对应的语音合成声纹,最后根据选择的语音合成声纹对原始的语音信息进行翻译处理,从而使得翻译处理后的语音信息的语音性别与原始的语音信息的语音性别相一致,实现了对语音性别的自适应。当男性说话时翻译出来的语音是男声,当女性说话时翻译出来的语音是女声,使得原始语音与翻译语音协调一致,大大增强了交流的真实感,提升了用户体验。附图说明图1是本专利技术的语音翻译方法一实施例的流程图;图2是图1中步骤S11的具体流程图;图3是本专利技术的语音翻译装置一实施例的模块示意图;图4是图3中的性别识别模块的模块示意图;图5是图4中的获取单元的模块示意图;图6是图3中的声纹选择模块的模块示意图;图7是图3中的翻译处理模块的模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。本
技术人员本文档来自技高网
...
语音翻译方法和装置

【技术保护点】
一种语音翻译方法,其特征在于,包括以下步骤:识别原始的语音信息的语音性别;根据所述语音性别选择对应的语音合成声纹;根据选择的语音合成声纹对所述原始的语音信息进行翻译处理,以使翻译处理后的语音信息的语音性别与原始的语音信息的语音性别相一致。

【技术特征摘要】
1.一种语音翻译方法,其特征在于,包括以下步骤:识别原始的语音信息的语音性别;根据所述语音性别选择对应的语音合成声纹;根据选择的语音合成声纹对所述原始的语音信息进行翻译处理,以使翻译处理后的语音信息的语音性别与原始的语音信息的语音性别相一致。2.根据权利要求1所述的语音翻译方法,其特征在于,所述识别原始的语音信息的语音性别的步骤包括:获取所述原始的语音信息的基音的频率;比较所述基音的频率与门限值的大小;当所述基音的频率小于或等于门限值时,识别所述原始的语音信息的语音性别为男声;当所述基音的频率大于门限值时,识别所述原始的语音信息的语音性别为女声。3.根据权利要求2所述的语音翻译方法,其特征在于,所述获取所述原始的语音信息的基音的频率的步骤包括:以预设的采样频率对所述原始的语音信息连续采样M帧,M≥2;对采集的语音帧进行基音频率特征提取;根据提取的基音频率特征统计出所述原始的语音信息的基音的频率。4.根据权利要求1-3任一项所述的语音翻译方法,其特征在于,所述根据选择的语音合成声纹对所述原始的语音信息进行翻译处理的步骤包括:对所述原始的语音信息进行语音识别处理,得到原始语言的第一字符串;对所述第一字符串进行文字翻译处理,得到目标语言的第二字符串;利用选择的语音合成声纹对所述第二字符串进行语音合成处理,得到目标语言的语音信息。5.根据权利要求2或3所述的语音翻译方法,其特征在于,所述语音合成声纹包括男声声纹和女声声纹,所述根据所述语音性别选择对应的语音合成声纹的步骤包括:当所述语音性别为男声时,选择所述男声声纹;当所述语音性别为女声时,选择所述女声声纹。6.一种语音翻译装置,其特征在于,包括:性别识别模块,用于...

【专利技术属性】
技术研发人员:郑勇王文祺
申请(专利权)人:深圳市沃特沃德股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1