一种现场会议人工智能同传设备制造技术

技术编号:20972346 阅读:24 留言:0更新日期:2019-04-29 17:47
本发明专利技术公开了一种现场会议人工智能同传设备,其中麦克风阵列可提高各个方向上的拾音能力,让会议桌各个方向说话都能被设备识别;回声消除模块可消除接收语音中的回声,噪声消除模块能够消除接收语音中的各种噪声,提高接收语音的清晰度;声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;ASR语音识别模块能够将用户语音翻译成文字;自动判断语种模块能够将自动判断用户说话的语种,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;神经网络翻译模块配合翻译库,给出参会对应国家语种翻译结果的文字,TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,显示屏显示最终翻译的文字结果。

An Artificial Intelligence Simultaneous Transmission Equipment for On-site Meeting

【技术实现步骤摘要】
一种现场会议人工智能同传设备
本专利技术涉及智能同传翻译设备
,特别是涉及一种现场会议人工智能同传设备。
技术介绍
目前市面上逐渐出现了会议翻译机的硬件设备,其集成运用了google、微软等AI人工智能,极大的简化了会议流程,让沟通更加顺畅便捷,相对于人工翻译更加简洁高效,但目前的会议翻译机,一人一个话筒,说A语言的人拿A话筒,说B语言的人拿B话筒,十分不便,且翻译设备还存在种种不足,严重影响了翻译质量,容易对会议造成一定的影响。
技术实现思路
为了克服现有技术的不足,本专利技术提供一种现场会议人工智能同传设备,其翻译质量高、能快速同传翻译多国语言文字,并进行同步播报,有利于会议的进行。为解决上述技术问题,本专利技术提供如下技术方案:一种现场会议人工智能同传设备,所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;所述麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;所述回声消除模块可消除接收语音中的回声,所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;所述声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;所述ASR语音识别模块能够将用户语音翻译成文字;所述自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;所述神经网络翻译模块连接有翻译库,所述翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,所述神经网络翻译模块还连接有TTS播报模块和显示器,所述TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,所述显示屏显示最终翻译的文字结果。作为本专利技术的一种有限技术方案,所述显示屏通过外接接口连接投屏模块,所述投屏模块投影显示最终翻译的文字结果,便于参会人员观看。作为本专利技术的一种有限技术方案,所述显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。作为本专利技术的一种有限技术方案,所述麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。作为本专利技术的一种有限技术方案,所述TTS播报模块连接有手动开关,方便手动开关TTS播报模块,若会场需要安静可手动关闭TTS播报模块,通过显示屏呈现最终翻译的文字结果。与现有技术相比,本专利技术能达到的有益效果是:1)本专利技术能够自动判断语言,一直记录谈话内容,并实时显示在屏幕上,由于能自动判断语言,无需专用语种话筒,会议桌上直接放置麦克风,自由说话,还原开会真实场景;2)可以实时更换翻译语料库,根据会议性质切换翻译的语料,例如医学翻译语料、电子翻译语料、金融翻译语料,提高会议专业术语的翻译准确度,从而保证翻译质量;3)可“流式翻译”:一边识别说话者说话,一边显示他说的话,一边立刻显示翻译文字,呈现出来的几乎是说话者吐一个字翻译一个字,并根据上下句实时调整翻译结果;4)自带声纹识别,不仅会自动判断语种,而且会标记是哪个人说话的话,谁发言的都有详细记录并有对应翻译;5)自带屏幕,且拥有蓝牙、wifi、HDMI有线、android、Airplay等投屏手段,投放到会议屏幕或电视机上,让开会过程实时展现;6)拥有环形麦克风阵列,在会场各个角落都能清晰识别说话者声音;7)拥有回声消除装置、噪声消除装置,在会议封闭环境下,能有效消除会议室回声,从而保证录音效果。附图说明图1是本专利技术的模块结构原理图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。请参照图1所示,一种现场会议人工智能同传设备,设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;回声消除模块可消除接收语音中的回声,噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;ASR语音识别模块能够将用户语音翻译成文字;自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;神经网络翻译模块连接有翻译库,翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,神经网络翻译模块还连接有TTS播报模块和显示器,TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,显示屏显示最终翻译的文字结果。显示屏通过外接接口连接投屏模块,投屏模块投影显示最终翻译的文字结果,便于参会人员观看。显示屏通过蓝牙或wifi或HDMI有线或android或Airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。TTS播报模块连接有手动开关,方便手动开关TTS播报模块,若会场需要安静可手动关闭TTS播报模块,通过显示屏呈现最终翻译的文字结果。具体的,该装置使用时,会议举办者在会议开始前,在会议机上设置这次会议会有哪几种语言,例如选择中文、英语、法语、日语四种;会议机摆放在会议桌中间,并且会议机投屏到会议屏幕上;会议各人员到达会议室,开始会议,若用户A说中文,B说英语,C说法语,D说日语;A说话时,会议屏幕上记录下A用户说的话,并且下方实时展示将用户A中文翻译成的英语、法语、日语;B说话时,会议屏幕上记录下B用户说的话,并且下方实时展示用户B英文翻译成的中文、法语、日语;依次类推。本专利技术的实施方式不限于此,按照本专利技术的上述实施例内容,利用本领域的常规技术知识和惯用手段,在不脱离本专利技术上述基本技术思想前提下,以上优选实施例还可以做出其它多种形式的修改、替换或组合,所获得的其它实施例均落在本专利技术权利保护范围之内。本文档来自技高网...

【技术保护点】
1.一种现场会议人工智能同传设备,其特征在于,所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;所述麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;所述回声消除模块可消除接收语音中的回声,所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;所述声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;所述ASR语音识别模块能够将用户语音翻译成文字;所述自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;所述神经网络翻译模块连接有翻译库,所述翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,所述神经网络翻译模块还连接有TTS播报模块和显示器,所述TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,所述显示屏显示最终翻译的文字结果。...

【技术特征摘要】
1.一种现场会议人工智能同传设备,其特征在于,所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、ASR语音识别模块、自动判断语种模块、神经网络翻译模块;所述麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;所述回声消除模块可消除接收语音中的回声,所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;所述声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;所述ASR语音识别模块能够将用户语音翻译成文字;所述自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;所述神经网络翻译模块连接有翻译库,所述翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过ASR语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,所述神经网络翻译模...

【专利技术属性】
技术研发人员:张岩代同杰熊涛
申请(专利权)人:深圳市合言信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1