智能语音分离与识别的会议转录方法、装置及系统制造方法及图纸

技术编号：43016611 阅读：23 留言：0更新日期：2024-10-18 17:20

本发明专利技术属于语音识别技术领域，公开了一种智能语音分离与识别的会议转录方法、装置及系统。该方法包括通过麦克风阵列捕捉与会人员的语音信息；通过端到端语音分离模块对捕捉到的语音信息进行分割，得到多个子语音信息；将所述子语音信息和与会人员语音信息库进行匹配，以确定各个子语音信息对应的发音对象；将各个子语音信息通过语音识别模块转换为发音对象的文本输出。通过上述方式，结合高效的语音分离算法，能够有效地分离和识别重叠的语音信号，使得能够区分与会人员的角色并且每个与会人员的说话内容都能够被准确地识别出来，提高工作效率，改善沟通交流体验，并为用户提供更加便捷、安全和高效的服务。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，尤其涉及一种智能语音分离与识别的会议转录方法、装置及系统。

技术介绍

1、在现代商业环境中，远程工作和在线会议已经成为一种常态。团队成员可能分布在不同的地理位置，需要定期进行视频会议来讨论项目、做决策或者进行战略规划。会议系统利用视频、音频和协作工具，让团队成员可以在不同的地理位置参与会议。提高了会议的可访问性，使得团队能够更加灵活地协同工作，促进了信息的共享和决策的制定。然而，许多会议转录系统存在着一个共性问题：多人交叉讲话的情况下，语音识别模块无法根据语音信息自动区分与会人员角色，而且会影响语音识别(asr)结果。

2、传统智能会议转录系统忽略了多人语音分离任务，在多人讲话语音信号重叠的情况下，说话者标识困难，在语音中准确标识不同说话者也是一个挑战。也就是说，在识别出的文本中正确地区分哪些内容来自哪个说话者是困难的，无法区分角色。语音识别系统无法准确地识别各个说话者的文本内容，导致识别出的文本内容中存在误识别、漏识别或替换错误等问题，进而影响后续的业务处理。

3、上述内容仅用于辅助理解...

【技术保护点】

1.一种智能语音分离与识别的会议转录方法，其特征在于，所述智能语音分离与识别的会议转录方法包括：

2.如权利要求1所述的智能语音分离与识别的会议转录方法，其特征在于，所述通过端到端语音分离模块对捕捉到的语音信息进行分割，得到多个子语音信息，包括：

3.如权利要求2所述的智能语音分离与识别的会议转录方法，其特征在于，所述智能语音分离与识别的会议转录方法还包括：

4.如权利要求3所述的智能语音分离与识别的会议转录方法，其特征在于，所述通过聚类方式进行识别并按照声音成分将与会人员划分至不同的说话者群组，以得到初步分离结果，包括：

<...

【技术特征摘要】

1.一种智能语音分离与识别的会议转录方法，其特征在于，所述智能语音分离与识别的会议转录方法包括：

3.如权利要求2所述的智能语音分离与识别的会议转录方法，其特征在于，所述智能语音分离与识别的会议转录方法还包括：

5.如权利要求2或3所述的智能语音分离与识别的会议转录方法，其特征在于，所述智能语音分离与识别的会议转录方法还包括：

6.如权利要求1所述的智能语音分离与识别的会议转录方法，其特征在于，所述智能语音分离...

【专利技术属性】
技术研发人员：闫永泽，牛俊峰，刘君，王飞宇，王颖智，原玉梁，
申请(专利权)人：联通山西产业互联网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人