基于机器学习的同声传译方法及装置制造方法及图纸

技术编号:20274952 阅读:20 留言:0更新日期:2019-02-02 04:32
本发明专利技术公开一种基于机器学习的同声传译方法及装置,其中,所述基于机器学习的同声传译方法包括:采集目标人讲话的讲话内容及讲话特征;利用机器学习并模仿目标人的讲话特征;将目标人的讲话内容翻译为指定语言的讲话内容;以及以指定语言输出经机器模仿目标人讲话特征的讲话内容,其中,所述目标人的语言与指定语言为不同语种。本发明专利技术的技术方案能够自动识别翻译,将翻译结果以目标人的讲话特征输出,使翻译结果更加真切,有利于提升用户体验。

【技术实现步骤摘要】
基于机器学习的同声传译方法及装置
本专利技术涉及一种数据处理
,尤其涉及一种基于机器学习的同声传译方法及装置。
技术介绍
同声传译是指将在讲话人讲话的同时将讲话人的语言翻译成不同的语言。现有技术的同声传译大都通过人工来实现,然而通过人为实现同声传译往往需要对译员具有较高的要求,导致这部分人才稀缺。目前,越来越多的场合,如国际会议等均需要同声传译,以人工的方式实现同声传译已满足不了市场的需求。近年来,市面上也存在一些翻译产品,如翻译机,利用翻译机可以将讲话翻译成各种语言,但翻译的时间较长,输出机器语言较呆板,导致用户的体验效果差。有鉴于此,有必要提出对目前的同声传译方法进行进一步的改进。
技术实现思路
为解决上述至少一技术问题,本专利技术的主要目的是提供一种基于机器学习的同声传译方法及装置。为实现上述目的,本专利技术采用的一个技术方案为:提供一种基于机器学习的同声传译方法,包括:采集目标人讲话的讲话内容及讲话特征;利用机器学习并模仿目标人的讲话特征;将目标人的讲话内容翻译为指定语言的讲话内容;以及以指定语言输出经机器模仿目标人讲话特征的讲话内容,其中,所述目标人的语言与指定语言为不同语种。其中,所述利用机器学习并模仿目标人的讲话特征,包括:将目标人的讲话内容拆解成多个词语和/或单词;识别并存储目标人讲话时各个词语和/或单词的发音特征;利用机器学习并模仿目标人对词语和/或单词的发音特征。其中,所述发音特征包括目标人讲话的音色数据及音调数据。其中,所述将目标人的讲话内容拆解成多个词语和/或单词,包括:从多个词语和/或单词中选出至少一关键词语和/或单词;根据采集的关键词语和/或单词及其音调数据确定目标人的讲话语境;所述用机器学习并模仿目标人对词语和/或单词的发音特征,包括,从数据库找出与目标人讲话语境相适应的音译语境;在基于音译语境的前提下利用机器学习并模仿目标人对词语和/或单词的发音特征。其中,所述采集目标人讲话的讲话内容及讲话特征之前,包括,获取对话人讲话的语言信息并识别出对话人的讲话语种;所述以指定语言输出经机器模仿目标人讲话特征的讲话内容,包括,将经机器模仿目标人讲话特征的讲话内容自动匹配输出为以对话人所讲语言。其中,所述以指定语言输出经机器模仿目标人讲话特征的讲话内容,包括:响应用户的语言切换操作;以切换后的语言输出经机器模仿目标人讲话特征的讲话内容。为实现上述目的,本专利技术采用的另一个技术方案为:提供一种基于机器学习的同声传译装置,包括:采集模块,用于采集目标人讲话的讲话内容及讲话特征;学习模块,用于利用机器学习并模仿目标人的讲话特征;翻译模块,用于将目标人的讲话内容翻译为指定语言的讲话内容;以及输出模块,用于以指定语言输出经机器模仿目标人讲话特征的讲话内容,其中,所述目标人的语言与指定语言为不同语种。其中,所述学习模块,具体包括:拆解单元,用于将目标人的讲话内容拆解成多个词语和/或单词;识别单元,用于识别并存储目标人讲话时各个词语和/或单词的发音特征;学习单元,用于利用机器学习并模仿目标人对词语和/或单词的发音特征。其中,所述输出模块,还用于,响应用户的语言切换操作;以切换后的语言输出经机器模仿目标人讲话特征的讲话内容。其中,所述基于机器学习的同声传译装置通过智能手机、电脑、PAD及智能音响来实现。本专利技术的技术方案主要包括采集目标人讲话的讲话内容及讲话特征;利用机器学习并模仿目标人的讲话特征;将目标人的讲话内容翻译为指定语言的讲话内容;以及以指定语言输出经机器模仿目标人讲话特征的讲话内容,区别于现有技术采用同声传译成本高的问题以及采用翻译机翻译时间长的问题,本方案通过采集目标人的讲话内容,一方面将讲话内容翻译成指定语言,另一方面获取目标人的讲话特征,通过利用机器学习目标人的讲话特征,实现以指定语言输出经机器模仿目标人讲话特征的讲话内容,能够将翻译结果以目标人的讲话特征输出,使翻译结果更加真切,为用户带来较佳的听觉体验。附图说明图1为本专利技术一实施例基于机器学习的同声传译方法的方法流程图;图2为本专利技术中步骤S20的具体流程图;图3为本专利技术一实施例基于机器学习的同声传译装置的模块方框图;图4为本专利技术中学习模块的方框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明,本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。请参照图1,图1为本专利技术一实施例基于机器学习的同声传译方法的方法流程图。在本专利技术实施例中,该基于机器学习的同声传译方法,包括:步骤S10、采集目标人讲话的讲话内容及讲话特征;步骤S20、利用机器学习并模仿目标人的讲话特征;步骤S30、将目标人的讲话内容翻译为指定语言的讲话内容;以及步骤S40、以指定语言输出经机器模仿目标人讲话特征的讲话内容,其中,所述目标人的语言与指定语言为不同语种。本实施例中,在采集目标人的讲话的同时,还可以采集对话人的讲话语音。目标人与对话人所将语言为不同的语种。该讲话内容为目标人的语言文字特征,讲话特征为语音特征。利用机器学习和模仿目标人的讲话特征,如此,可以使翻译结果具有目标人的语言特征,而不是机器人内置的其他语音。目标人的讲话内容可以通过机器翻译成指定语言的讲话内容,结合机器学习和模仿目标人的讲话特征,从而可以输出具有以目标人的讲话特征的翻译结果,使翻译结果更加真切,用户带来较佳的听觉体验。本方案通过采集目标人讲话的讲话内容及讲话特征;利用机器学习并模仿目标人的讲话特征;将目标人的讲话内容翻译为指定语言的讲话内容;以及以指定语言输出经机器模仿目标人讲话特征的讲话内容,区别于现有技术采用同声传译成本高的问题以及采用翻译机翻译时间长的问题,本方案通过采集目标人的讲话内容,一方面将讲话内容翻译成指定语言,另一方面获取目标人的讲话特征,通过利用机器学习目标人的讲话特征,实现以指定语言输出经机器模仿目标人讲话特征的讲话内容,能够将翻译结果以目标人的讲话特征输出,使翻译结果更加真切,为用户带来较佳的听觉体验。请参照图2,图2为本专利技术中步骤S20的具体流程图。在一具体的实施例中,所述利用机器学习并模仿目标人的讲话特征的步骤,包括:步骤S21、将目标人的讲话内容拆解成多个词语和/或单词;步骤S22、识别并存储目标人讲话时各个词语和/或单词的发音特征;步骤S23、利用机器学习并模仿目标人对词语和/或单词的发音特征。本实施例中,采集的讲话内容可以拆解成多个词语、多个单词或多个词语与单词的组合,通过多个词语、多个单词或多个词语与单词的组合可以比较准本文档来自技高网...

【技术保护点】
1.一种基于机器学习的同声传译方法,其特征在于,所述基于机器学习的同声传译方法包括:采集目标人讲话的讲话内容及讲话特征;利用机器学习并模仿目标人的讲话特征;将目标人的讲话内容翻译为指定语言的讲话内容;以及以指定语言输出经机器模仿目标人讲话特征的讲话内容,其中,所述目标人的语言与指定语言为不同语种。

【技术特征摘要】
1.一种基于机器学习的同声传译方法,其特征在于,所述基于机器学习的同声传译方法包括:采集目标人讲话的讲话内容及讲话特征;利用机器学习并模仿目标人的讲话特征;将目标人的讲话内容翻译为指定语言的讲话内容;以及以指定语言输出经机器模仿目标人讲话特征的讲话内容,其中,所述目标人的语言与指定语言为不同语种。2.如权利要求1所述的基于机器学习的同声传译方法,其特征在于,所述利用机器学习并模仿目标人的讲话特征,包括:将目标人的讲话内容拆解成多个词语和/或单词;识别并存储目标人讲话时各个词语和/或单词的发音特征;利用机器学习并模仿目标人对词语和/或单词的发音特征。3.如权利要求2所述的基于机器学习的同声传译方法,其特征在于,所述发音特征包括目标人讲话的音色数据及音调数据。4.如权利要求3所述的基于机器学习的同声传译方法,其特征在于,所述将目标人的讲话内容拆解成多个词语和/或单词,包括:从多个词语和/或单词中选出至少一关键词语和/或单词;根据采集的关键词语和/或单词及其音调数据确定目标人的讲话语境;所述用机器学习并模仿目标人对词语和/或单词的发音特征,包括,从数据库找出与目标人讲话语境相适应的音译语境;在基于音译语境的前提下利用机器学习并模仿目标人对词语和/或单词的发音特征。5.如权利要求1所述的基于机器学习的同声传译方法,其特征在于,所述采集目标人讲话的讲话内容及讲话特征之前,包括,获取对话人讲话的语言信息并识别出对话人的讲话语种;所述以指定...

【专利技术属性】
技术研发人员:梁志军
申请(专利权)人:满金坝深圳科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1