基于人工智能的口译自动测评方法、系统及可存储介质技术方案

技术编号:32224923 阅读:20 留言:0更新日期:2022-02-09 17:29
本发明专利技术公开了一种基于人工智能的口译自动测评方法、系统及可存储介质,涉及人工智能领域。本发明专利技术包括以下步骤:接收口译测试请求,获取待口译语音信息和口译语音信息;翻译所述待口译语音信息得到机器翻译信息;将所述机器翻译信息与所述口译语音信息进行相似度分析;结合相似度分析结果与预先设定的相似度阈值,得出测评结果。本发明专利技术能够帮助口译者辨别口译中出现的错误,实现人机对话,得到具体评分结果。果。果。

【技术实现步骤摘要】
基于人工智能的口译自动测评方法、系统及可存储介质


[0001]本专利技术涉及人工智能领域,更具体的说是涉及一种基于人工智能的口译自动测评方法、系统及可存储介质。

技术介绍

[0002]口译(又称传译)是一种翻译活动,顾名思义,是指译员以口语的方式,将译入语转换为译出语。口译依进行的方式,可分为同声传译以及连续传译两大类。口译应用于一般的正式国际会议中,通常口译员会坐在位于后方的“口译室”(Booth)中,透过耳机以及视线或视讯接收讲者的讯息,然后对著麦克风进行翻译,而坐于会场中的听众,则可透过特殊的音讯接收设备,以耳机听取口译员的翻译。
[0003]对于口译资源开发机制的研究,国内外很多高校都已展开并小有成就,如欧洲议会口译语料库(EPIC)、日本名古屋大学的同声传译语料库(CIAIR)、上海交通大学的多模态口译语料库(MMCIS)等。但是目前并没有一种能够有效检测口译内容是否准确的方法,因此,亟需一种人工智能的口译自动测评方法。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种基于人工智能的口译自动测评方法、系统及可存储介质。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]一种基于人工智能的口译自动测评方法,包括以下步骤:
[0007]接收口译测试请求,获取待口译语音信息和口译语音信息;
[0008]翻译所述待口译语音信息得到机器翻译信息;
[0009]将所述机器翻译信息与所述口译语音信息进行相似度分析;
[0010]结合相似度分析结果与预先设定的相似度阈值,得出测评结果。
[0011]可选的,翻译所述待口译语音信息得到机器翻译信息的具体步骤如下:
[0012]将所述口译语音信息拆分成语音词组,翻译语音词组构成候选语句集合;
[0013]第一卷积神经网络模型基于所述语音词组对应的词向量,生成用于表征口译语音信息的高维向量;
[0014]第二卷积神经网络模型基于高维向量以及候选语句集合,确定待口译语音信息对应的机器翻译信息。
[0015]可选的,第二卷积神经网络模型基于高维向量以及候选语句集合,确定待口译语音信息对应的翻译语句具体包括:基于所述高维向量以及已翻译语句对应的词向量,分别计算所述候选语句集合中的每一个候选语句的输出概率,所述已翻译语句为已经作为翻译结果进行输出的候选语句;将对应的输出概率最大的候选语句进行输出;基于输出的候选语句,生成所述待口译语音信息对应的机器翻译信息。
[0016]以上技术方案具有以下有益效果:
[0017]实现了在利用卷积神经网络模型进行翻译时,仅通过计算候选语句的输出概率从而得到待翻译语句的翻译结果,提升了翻译速度。
[0018]可选的,还包括对所述待口译语音信息和所述口译语音信息去噪,具体为:将含噪所述待口译语音信息和所述口译语音信息分解为本征模态函数,并根据自相关理论,对从IMFs中筛选的高频分量应用改进的小波高参数阈值算法处理,低频IMF分量应用小波低参数阈值处理,最后对处理后的所述待口译语音信息和所述口译语音信息进行重构,得到降噪后的所述待口译语音信息和所述口译语音信息。
[0019]以上技术方案具有以下有益效果:
[0020]通过对声音的降噪处理,能够得到更为精确的机器翻译结果,同时提高测试的准确率。
[0021]可选的,将所述机器翻译信息与所述口译语音信息进行相似度分析,具体包括以下步骤:
[0022]获取待比对的两条语音信息,将待比对的每条语音信息生成对应的音频波形图;
[0023]比对所述两条语音信息对应的音频波形图,获得所述两条语音信息的相似度;
[0024]若所述两条语音信息的相似度大于阈值,则输出所述两条语音信息的语音内容相同的比对结果;
[0025]若所述两条语音信息的相似度小于或等于所述阈值,则输出所述两条语音信息的内容不相同的比对结果。
[0026]以上技术方案具有以下有益效果:
[0027]通过波形图的比较确认两条语音信息的语音内容是否一致,使得比对的结果更精确。
[0028]一种基于人工智能的口译自动测评系统,包括:
[0029]语音信息获取模块:用于接收口译测试请求,获取待口译语音信息和口译语音信息;
[0030]语音信息翻译模块:用于翻译所述待口译语音信息得到机器翻译信息;
[0031]相似度分析模块:用于将所述机器翻译信息与所述口译语音信息进行相似度分析;
[0032]测评结果模块:用于结合相似度分析结果与预先设定的相似度阈值,得出测评结果。
[0033]可选的,还包括语音信息降噪模块:用于对所述待口译语音信息和所述口译语音信息去噪。
[0034]一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现任意一项所述的一种基于人工智能的口译自动测评方法的步骤。
[0035]经由上述的技术方案可知,与现有技术相比,本专利技术提供了一种基于人工智能的口译自动测评方法、系统及可存储介质,能够帮助口译者辨别口译中出现的错误,实现人机对话,得到具体评分结果;同时,通过本专利技术的技术方案使得口译测试结果更为精确。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0037]图1为本专利技术的流程示意图;
[0038]图2为本专利技术的结构示意图。
具体实施方式
[0039]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0040]本专利技术实施例一方面提供一种基于人工智能的口译自动测评方法,如图1所示,包括以下步骤:
[0041]接收口译测试请求,获取待口译语音信息和口译语音信息;
[0042]翻译待口译语音信息得到机器翻译信息;
[0043]将机器翻译信息与口译语音信息进行相似度分析;
[0044]结合相似度分析结果与预先设定的相似度阈值,得出测评结果。
[0045]其中,翻译待口译语音信息得到机器翻译信息的具体步骤如下:
[0046]将口译语音信息拆分成语音词组,翻译语音词组构成候选语句集合;
[0047]第一卷积神经网络模型基于语音词组对应的词向量,生成用于表征口译语音信息的高维向量;
[0048]第二卷积神经网络模型基于高维向量以及候选语句集合,确定待口译语音信息对应的机器翻译信息;第二卷积神经网络模型基于高维向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的口译自动测评方法,其特征在于,包括以下步骤:接收口译测试请求,获取待口译语音信息和口译语音信息;翻译所述待口译语音信息得到机器翻译信息;将所述机器翻译信息与所述口译语音信息进行相似度分析;结合相似度分析结果与预先设定的相似度阈值,得出测评结果。2.根据权利要求1所述的一种基于人工智能的口译自动测评方法,其特征在于,翻译所述待口译语音信息得到机器翻译信息的具体步骤如下:将所述口译语音信息拆分成语音词组,翻译语音词组构成候选语句集合;第一卷积神经网络模型基于所述语音词组对应的词向量,生成用于表征口译语音信息的高维向量;第二卷积神经网络模型基于高维向量以及候选语句集合,确定待口译语音信息对应的机器翻译信息。3.根据权利要求2所述的一种基于人工智能的口译自动测评方法,其特征在于,第二卷积神经网络模型基于高维向量以及候选语句集合,确定待口译语音信息对应的翻译语句具体包括:基于所述高维向量以及已翻译语句对应的词向量,分别计算所述候选语句集合中的每一个候选语句的输出概率,所述已翻译语句为已经作为翻译结果进行输出的候选语句;将对应的输出概率最大的候选语句进行输出;基于输出的候选语句,生成所述待口译语音信息对应的机器翻译信息。4.根据权利要求1所述的一种基于人工智能的口译自动测评方法,其特征在于,还包括对所述待口译语音信息和所述口译语音信息去噪,具体为:将含噪所述待口译语音信息和所述口译语音信息分解为本征模态函数,并根据自相关理论,对从IMFs中筛选的高频分量应用改进的小波高参数阈值算法处理,低...

【专利技术属性】
技术研发人员:许文胜韩彩虹程璐璐
申请(专利权)人:郑州科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1