同声传译方法、装置、电子设备及存储介质制造方法及图纸

技术编号：24173595 阅读：17 留言：0更新日期：2020-05-16 03:48

本发明专利技术实施例公开了一种同声传译方法、装置、电子设备及存储介质。其中，方法包括：获得语音数据，对所述语音数据进行文本识别，得到识别文本；对所述语音数据进行切分，得到至少一个语音片段；确定所述至少一个语音片段中各语音片段对应的目标人物；确定所述目标人物对应的第一呈现格式，以在呈现所述识别文本时以所述第一呈现格式呈现所述目标人物对应的目标文本片段；所述目标文本片段基于所述目标人物对应的语音片段得到；所述第一呈现格式与第二呈现格式不同；所述第二呈现格式为其他人物对应的识别文本中的文本片段的呈现格式；所述识别文本用于在所述语音数据被播放时进行呈现。

Simultaneous interpretation methods, devices, electronic equipment and storage media

全部详细技术资料下载

【技术实现步骤摘要】
同声传译方法、装置、电子设备及存储介质
本专利技术涉及同声传译领域，尤其涉及一种同声传译方法、装置、电子设备及存储介质。
技术介绍
随着人工智能(AI，ArtificialIntelligence)技术不断发展与成熟，运用人工智能技术解决生活中常见问题的产品不断涌现。其中，机器同声传译(又称为机器同传、AI同声传译、AI同传)，结合了语音识别(ASR，AutomaticSpeechRecognition)、机器翻译(MT，MachineTranslation)等技术，被广泛应用于会议、访谈节目等场景，替代或部分替代了人工，实现同声传译(SI，SimultaneousInterpretation)。相关机器同传系统中，通过语言识别技术自动识别语音，运用机器翻译技术将识别得到的源语言文字翻译成目标语言文字，通过屏幕直接展示翻译后的结果。然而，仅将演讲者的说话内容进行显示，用户在观看时无法确定演讲者，难以结合演讲者的相关身份信息理解演讲内容。
技术实现思路
为解决相关存在的技术问题，本专利技术实施例提供一种同声传译方法、装置、电子设备及存储介质。本专利技术实施例的技术方案是这样实现的：本专利技术实施例提供一种同声传译方法，包括：获得语音数据，对所述语音数据进行文本识别，得到识别文本；对所述语音数据进行切分，得到至少一个语音片段；确定所述至少一个语音片段中各语音片段对应的目标人物；确定所述目标人物对应的第一呈现格式，以在呈现所述识别文本时以所述第一呈现格式呈...

【技术保护点】
1.一种同声传译方法，其特征在于，包括：/n获得语音数据，对所述语音数据进行文本识别，得到识别文本；/n对所述语音数据进行切分，得到至少一个语音片段；确定所述至少一个语音片段中各语音片段对应的目标人物；/n确定所述目标人物对应的第一呈现格式，以在呈现所述识别文本时以所述第一呈现格式呈现所述目标人物对应的目标文本片段；所述目标文本片段基于所述目标人物对应的语音片段得到；所述第一呈现格式与第二呈现格式不同；所述第二呈现格式为其他人物对应的识别文本中的文本片段的呈现格式；所述识别文本用于在所述语音数据被播放时进行呈现。/n

【技术特征摘要】
1.一种同声传译方法，其特征在于，包括：
获得语音数据，对所述语音数据进行文本识别，得到识别文本；
对所述语音数据进行切分，得到至少一个语音片段；确定所述至少一个语音片段中各语音片段对应的目标人物；
确定所述目标人物对应的第一呈现格式，以在呈现所述识别文本时以所述第一呈现格式呈现所述目标人物对应的目标文本片段；所述目标文本片段基于所述目标人物对应的语音片段得到；所述第一呈现格式与第二呈现格式不同；所述第二呈现格式为其他人物对应的识别文本中的文本片段的呈现格式；所述识别文本用于在所述语音数据被播放时进行呈现。

2.根据权利要求1所述的方法，其特征在于，所述对所述语音数据进行切分，得到所述语音数据中的至少一个语音片段，包括：
对所述语音数据进行端点检测，根据检测得到的端点切分所述语音数据，得到至少一个语音片段。

3.根据权利要求1所述的方法，其特征在于，所述对所述语音数据进行切分，得到所述语音数据中的至少一个语音片段，包括：
对所述语音数据进行语义分析，根据语义分析结果对所述语音数据进行切分，得到至少一个语音片段。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述确定所述至少一个语音片段中各语音片段对应的目标人物，包括：
确定所述语音片段对应的目标声纹特征；
根据所述目标声纹特征查询声纹数据库，确定所述语音数据对应的目标人物；所述声纹数据库包括至少一个声纹特征和所述至少一个声纹特征中各声纹特征对应的人物。

5.根据权利要求1至3任一项所述的方法，其特征在于，所述确定所述至少一个语音片段中各语音片段对应的目标人物，包括：
确定所述语音片段对应的目标采集声道；
基于声道和人物的对应关系，确定所述目标采集声道对应的目标人物。

【专利技术属性】
技术研发人员：杨林举，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人