【技术实现步骤摘要】
本专利技术涉及语音识别,尤其涉及一种智能语音分离与识别的会议转录方法、装置及系统。
技术介绍
1、在现代商业环境中,远程工作和在线会议已经成为一种常态。团队成员可能分布在不同的地理位置,需要定期进行视频会议来讨论项目、做决策或者进行战略规划。会议系统利用视频、音频和协作工具,让团队成员可以在不同的地理位置参与会议。提高了会议的可访问性,使得团队能够更加灵活地协同工作,促进了信息的共享和决策的制定。然而,许多会议转录系统存在着一个共性问题:多人交叉讲话的情况下,语音识别模块无法根据语音信息自动区分与会人员角色,而且会影响语音识别(asr)结果。
2、传统智能会议转录系统忽略了多人语音分离任务,在多人讲话语音信号重叠的情况下,说话者标识困难,在语音中准确标识不同说话者也是一个挑战。也就是说,在识别出的文本中正确地区分哪些内容来自哪个说话者是困难的,无法区分角色。语音识别系统无法准确地识别各个说话者的文本内容,导致识别出的文本内容中存在误识别、漏识别或替换错误等问题,进而影响后续的业务处理。
3、上述内容仅用于辅助理解
...【技术保护点】
1.一种智能语音分离与识别的会议转录方法,其特征在于,所述智能语音分离与识别的会议转录方法包括:
2.如权利要求1所述的智能语音分离与识别的会议转录方法,其特征在于,所述通过端到端语音分离模块对捕捉到的语音信息进行分割,得到多个子语音信息,包括:
3.如权利要求2所述的智能语音分离与识别的会议转录方法,其特征在于,所述智能语音分离与识别的会议转录方法还包括:
4.如权利要求3所述的智能语音分离与识别的会议转录方法,其特征在于,所述通过聚类方式进行识别并按照声音成分将与会人员划分至不同的说话者群组,以得到初步分离结果,包括:
< ...【技术特征摘要】
1.一种智能语音分离与识别的会议转录方法,其特征在于,所述智能语音分离与识别的会议转录方法包括:
2.如权利要求1所述的智能语音分离与识别的会议转录方法,其特征在于,所述通过端到端语音分离模块对捕捉到的语音信息进行分割,得到多个子语音信息,包括:
3.如权利要求2所述的智能语音分离与识别的会议转录方法,其特征在于,所述智能语音分离与识别的会议转录方法还包括:
4.如权利要求3所述的智能语音分离与识别的会议转录方法,其特征在于,所述通过聚类方式进行识别并按照声音成分将与会人员划分至不同的说话者群组,以得到初步分离结果,包括:
5.如权利要求2或3所述的智能语音分离与识别的会议转录方法,其特征在于,所述智能语音分离与识别的会议转录方法还包括:
6.如权利要求1所述的智能语音分离与识别的会议转录方法,其特征在于,所述智能语音分离...
【专利技术属性】
技术研发人员:闫永泽,牛俊峰,刘君,王飞宇,王颖智,原玉梁,
申请(专利权)人:联通山西产业互联网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。