翻译方向自动切换方法、装置以及设备制造方法及图纸

技术编号:26846151 阅读:16 留言:0更新日期:2020-12-25 13:08
本发明专利技术公开了一种翻译方向自动切换方法、装置以及设备。本发明专利技术针对实时翻译场景,聚焦于由语音识别引擎提供的连续语音的转写文本,即先辨识出待处理的当前文本其中是否混杂着多种语种字词,当判定为混语种文本后进而结合语句之间的时间间隔以及在先语句的语种,即处理当前文本之前所使用的翻译方向,得到切换阈值,最后根据该切换阈值以及当前待处理文本中的不同语种字词的占比,决策是否需要将处理当前文本之前所使用的翻译方向进行切换,本发明专利技术核心思路中结合了前后间隔时间、在先语句所用翻译方向、动态阈值以及当前文本的各语种字数比例等多个维度进行综合决策,因此可以与实际应用场景结合,灵活、动态、准确地决策翻译方向切换动作。

【技术实现步骤摘要】
翻译方向自动切换方法、装置以及设备
本专利技术涉及机器翻译领域,尤其涉及一种翻译方向自动切换方法、装置以及设备。
技术介绍
随着日益增多的国际经贸活动,对于机器翻译服务的需求也较以往有了明显增加,同时,国内企业国际化以及本土文化“走出去”也需要大量专业、高质量的机器翻译服务。但是现有的机器翻译技术,对于语种变更频率较大的应用场景,例如国际会议,不同语种的发言人交替发言,则一般很少能够实现较为迅速、准确的语种自动识别及相应的翻译方向动态切换,多数情况下这类场景还需由支撑人员手动调整翻译方向,这里所说的翻译方向是指由什么语种翻译到什么语种,比如翻译方向为中英方向,意思就是由中文翻译到英文。
技术实现思路
鉴于上述,本专利技术旨在提供一种翻译方向自动切换方法、装置以及设备,并相应地提出一种计算机可读存储介质以及计算机程序产品,用以针对特定的多语种变更场景下,实现准确、灵活地确定当前语句、切换翻译方向。本专利技术采用的技术方案如下:第一方面,本专利技术提供了一种翻译方向自动切换方法,包括:接收输入语句的转写文本;判断当前转写文本是否为混语种文本;若是,则计算与所述当前转写文本对应的当前语句与前一语句的时间间隔;根据所述时间间隔以及所述前一语句的语种,确定切换阈值;基于所述当前转写文本中不同语种字词的占比以及所述切换阈值,决策是否切换翻译方向。在其中至少一种可能的实现方式中,所述判断当前转写文本是否为混语种文本包括:预设混合容忍度;判断所述当前转写文本是否包含其他语种字词;若包含,则判断所述其他语种字词的数量是否符合所述混合容忍度;若不符合,则确定所述当前转写文本为混语种文本。在其中至少一种可能的实现方式中,所述根据所述时间间隔以及所述前一语句的语种,确定切换阈值包括:从所述前一语句中获取所属语种的字词的比例;基于所述比例以及所述时间间隔,确定所述切换阈值。在其中至少一种可能的实现方式中,所述基于所述比例以及所述时间间隔,确定所述切换阈值包括:利用所述比例以及所述时间间隔调整预设的初始占比值;结合调整前后的所述初始占比值,确定所述切换阈值。在其中至少一种可能的实现方式中,在确定为混语种文本之后,且在计算所述时间间隔之前,还包括:判断所述当前转写文本是否包含分隔符;若否,则执行计算时间间隔的步骤;若是,则判断以分隔符拆分的各文本片段是否存在混语种文本片段;若存在,则执行计算时间间隔的步骤;若不存在,则依次根据各文本片段的语种以及在先所用的翻译方向,决策是否切换翻译方向。在其中至少一种可能的实现方式中,所述依次根据各文本片段的语种以及在先所用的翻译方向,决策是否切换翻译方向包括:依次判断当前文本片段的语种与在先所用的翻译方向中的原语种是否一致;若一致,则保持翻译方向;若不一致,则切换翻译方向。第二方面,本专利技术提供了一种翻译方向自动切换装置,包括:识别结果接收模块,用于接收输入语句的转写文本;混语种判定模块,用于判断当前转写文本是否为混语种文本;时间间隔计算模块,用于当所述混语种判定模块输出为是时,计算与所述当前转写文本对应的当前语句与前一语句的时间间隔;切换阈值确定模块,用于根据所述时间间隔以及所述前一语句的语种,确定切换阈值;第一切换决策模块,用于基于所述当前转写文本中不同语种字词的占比以及所述切换阈值,决策是否切换翻译方向。在其中至少一种可能的实现方式中,所述混语种判定模块包括:容忍度设置单元,用于预设混合容忍度;其他语种字词检测单元,用于判断所述当前转写文本是否包含其他语种字词;容忍度判定单元,用于当所述其他语种字词检测单输出为是时,判断所述其他语种字词的数量是否符合所述混合容忍度;混语种文本判定单元,用于当所述容忍度判定单元输出为否时,确定所述当前转写文本为混语种文本。在其中至少一种可能的实现方式中,所述切换阈值确定模块包括:字词比例获取单元,用于从所述前一语句中获取所属语种的字词的比例;阈值确定单元,用于基于所述比例以及所述时间间隔,确定所述切换阈值。在其中至少一种可能的实现方式中,所述阈值确定单元包括:基础占比调整组件,用于利用所述比例以及所述时间间隔调整预设的初始占比值;阈值确定组件,用于结合调整前后的所述初始占比值,确定所述切换阈值。在其中至少一种可能的实现方式中,所述装置还包括第二切换决策模块,所述第二切换决策模块具体包括:分隔符检测单元,用于当所述混语种判定模块输出为是时,判断所述当前转写文本是否包含分隔符;混语种文本片段检测单元,用于当所述分隔符检测单元输出为是时,判断以分隔符拆分的各文本片段是否存在混语种文本片段;切换决策单元,用于当所述混语种文本片段检测单元输出为是时,依次根据各文本片段的语种以及在先所用的翻译方向,决策是否切换翻译方向;并且,所述时间间隔计算模块还用于:当所述分隔符检测单元输出为否或者所述混语种文本片段检测单元输出为是时,计算与所述当前转写文本对应的当前语句与前一语句的时间间隔。在其中至少一种可能的实现方式中,所述切换决策单元包括:语种比对组件,用于依次判断当前文本片段的语种与在先所用的翻译方向中的原语种是否一致;切换决策组件,用于当所述语种比对组件输出为是时,保持翻译方向;以及当所述语种比对组件输出为否时,切换翻译方向。第三方面,本专利技术提供了一种翻译方向自动切换设备,包括:一个或多个处理器、存储器以及一个或多个计算机程序,所述存储器可以采用非易失性存储介质,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行如第一方面或者第一方面的任一可能实现方式中的所述方法。第四方面,本专利技术提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机至少执行如第一方面或者第一方面的任一可能实现方式中的所述方法。第五方面,本专利技术还提供了一种计算机程序产品,当所述计算机程序产品被计算机执行时,用于至少执行第一方面或者第一方面的任一可能实现方式中的所述方法。在第五方面的至少一种可能的实现方式中,该产品涉及到的相关程序可以全部或者部分存储在与处理器封装在一起的存储器上,也可以部分或者全部存储在不与处理器封装在一起的存储介质上。本专利技术的构思在于,针对实时语音识别翻译场景,不对发言人个体自身语种以及使用不同语种的人数作特别关注,而是聚焦于由语音识别引擎提供的连续语音的转写文本(也不特别关注该转写文本是来自一个人的语句还是多人语句),即,仅从转写文本自身入手,先辨识出待处理的当前文本其中是否混杂着多种语种字词,也即是确定出当前文本是纯语种文本还是混语种文本文档来自技高网...

【技术保护点】
1.一种翻译方向自动切换方法,其特征在于,包括:/n接收输入语句的转写文本;/n判断当前转写文本是否为混语种文本;/n若是,则计算与所述当前转写文本对应的当前语句与前一语句的时间间隔;/n根据所述时间间隔以及所述前一语句的语种,确定切换阈值;/n基于所述当前转写文本中不同语种字词的占比以及所述切换阈值,决策是否切换翻译方向。/n

【技术特征摘要】
1.一种翻译方向自动切换方法,其特征在于,包括:
接收输入语句的转写文本;
判断当前转写文本是否为混语种文本;
若是,则计算与所述当前转写文本对应的当前语句与前一语句的时间间隔;
根据所述时间间隔以及所述前一语句的语种,确定切换阈值;
基于所述当前转写文本中不同语种字词的占比以及所述切换阈值,决策是否切换翻译方向。


2.根据权利要求1所述的翻译方向自动切换方法,其特征在于,所述判断当前转写文本是否为混语种文本包括:
预设混合容忍度;
判断所述当前转写文本是否包含其他语种字词;
若包含,则判断所述其他语种字词的数量是否符合所述混合容忍度;
若不符合,则确定所述当前转写文本为混语种文本。


3.根据权利要求1所述的翻译方向自动切换方法,其特征在于,所述根据所述时间间隔以及所述前一语句的语种,确定切换阈值包括:
从所述前一语句中获取所属语种的字词的比例;
基于所述比例以及所述时间间隔,确定所述切换阈值。


4.根据权利要求3所述的翻译方向自动切换方法,其特征在于,所述基于所述比例以及所述时间间隔,确定所述切换阈值包括:
利用所述比例以及所述时间间隔调整预设的初始占比值;
结合调整前后的所述初始占比值,确定所述切换阈值。


5.根据权利要求1~4任一项所述的翻译方向自动切换方法,其特征在于,在确定为混语种文本之后,且在计算所述时间间隔之前,还包括:
判断所述当前转写文本是否包含分隔符;
若否,则执行计算时间间隔的步骤;
若是,则判断以分隔符拆分的各文本片段是否存在混语种文本片段;
若存在,则执行计算时间间隔的步骤;
若不存在,则依次根据各文本片段的语种以及在先所用的翻译方向,决策是否切换翻译方向。


6.根据权利要求5所述的翻译方向自动切换方法,其特征在于,所述依次根据各文本片段的语种以及在先所用的翻译方向,决策是否切换翻译方向包括:
依次判断当前文本片段的语种与在先所用的翻译方向中的原语种是否一致;
若一致,则保持翻译方向;
若不一致,则切换翻译方向。
...

【专利技术属性】
技术研发人员:黄爽李飞
申请(专利权)人:安徽听见科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1