【技术实现步骤摘要】
一种会议语音识别方法及系统、存储介质及终端
本专利技术涉及语音识别的
,特别是涉及一种会议语音识别方法及系统、存储介质及终端。
技术介绍
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。现有技术中,语音识别的应用场景越来越多,常见的应用系统有:(1)语音输入系统相对于键盘输入方法,语音输入更符合人的日常习惯,也更自然、更高效。(2)语音控制系统用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域。(3)智能对话查询系统根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。(4)会议记录在目前智能会议的时代,对于会议中报告及记录的方式,早已摆脱了早期传统的利用专人将会议过程记录于纸张中的人工操 ...
【技术保护点】
1.一种会议语音识别方法,其特征在于:包括以下步骤:提取会议参与人的声纹特征,构建所述会议参与人的声纹特征库;获取会议语音数据,当所述会议语音数据包含至少两个会议发言人的语音数据时,将所述会议语音数据分离为与所述至少两个会议发言人一一对应的发言人语音数据;对于每个发言人语音数据,提取所述发言人语音数据的声纹特征,在所述声纹特征库中查找匹配的声纹特征并判定所述匹配的声纹特征对应的会议参与人为所述发言人语音数据对应的会议发言人;对于每个发言人语音数据,将所述发言人语音数据转换为文本数据和发言人时间信息,并文本输出所述文本数据、对应的会议发言人和发言时间信息。
【技术特征摘要】
1.一种会议语音识别方法,其特征在于:包括以下步骤:提取会议参与人的声纹特征,构建所述会议参与人的声纹特征库;获取会议语音数据,当所述会议语音数据包含至少两个会议发言人的语音数据时,将所述会议语音数据分离为与所述至少两个会议发言人一一对应的发言人语音数据;对于每个发言人语音数据,提取所述发言人语音数据的声纹特征,在所述声纹特征库中查找匹配的声纹特征并判定所述匹配的声纹特征对应的会议参与人为所述发言人语音数据对应的会议发言人;对于每个发言人语音数据,将所述发言人语音数据转换为文本数据和发言人时间信息,并文本输出所述文本数据、对应的会议发言人和发言时间信息。2.根据权利要求1所述的会议语音识别方法,其特征在于:每个发言人语音数据对应的所述文本数据、对应的会议发言人和发言时间信息单独作为一段输出。3.根据权利要求1所述的会议语音识别方法,其特征在于:在所述声纹特征库中查找匹配的声纹特征时,若所述声纹特征库中某一声纹特征与所述发言人语音数据的声纹特征的匹配度大于预设阈值,则判定二者匹配;若所述声纹特征库中至少两个声纹特征与所述发言人语音数据的声纹特征的匹配度大于预设阈值时,选取匹配度最高的声纹特征作为匹配声纹特征,并在输出的会议发言人上设置提醒信息。4.根据权利要求1所述的会议语音识别方法,其特征在于:在所述声纹特征库中查找匹配的声纹特征时,若没有匹配的声纹特征,则将所述发言人语音数据对应的会议发言人设置为预设发言人标识信息。5.根据权利要求1所述的会议语音识别方法,其特征在于:还包括对于下一会议语音数据,判断所述下一会议语音数据的会议发言人是否与在前会议语音数据的会议发言人相同,若是,则将下一会议语音数据的文本数据与所述在...
【专利技术属性】
技术研发人员:杨进玉,许佑骏,刘旭峰,
申请(专利权)人:上海思创华信信息技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。