会议声音采集、会议记录以及会议记录呈现方法和装置制造方法及图纸

技术编号:25839831 阅读:17 留言:0更新日期:2020-10-02 14:19
本公开提供了会议声音采集、会议记录以及会议记录呈现方法和装置。会议记录方法的一具体实施方式包括:接收会议声音采集终端发送的声音数据;对上述声音数据进行人声分离;生成分离后的每个分离声音数据对应的会议记录,其中,每个分离声音数据对应的会议记录包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息;将所生成的各会议记录发送给目标会议标识对应的会议记录呈现终端,其中,上述目标会议标识为发送上述声音数据的会议声音采集终端对应的当前会议标识,各上述会议记录用于触发收到各上述会议记录的会议记录呈现终端呈现各上述会议记录。该实施方式实现了对会议中多人同时讲话的会议内容分别记录。

【技术实现步骤摘要】
会议声音采集、会议记录以及会议记录呈现方法和装置
本公开涉及计算机
,具体涉及会议声音采集、会议记录以及会议记录呈现方法和装置
技术介绍
语音识别已经开始广泛应用于车载、智能音箱、智能家居等多种领域,通过语音识别触发机器能够执行的指令可以极大的提高效率、解放双手、增强产品的用户体验。随着语音识别识别率的提高,将语音转为文字的需求也在人们的日常会议系统中被越来越多的采用。例如,作为个人随身携带的智能录音笔等会议记录产品,能够将录制的语音送往服务器转换成文字,方便检索和查阅。
技术实现思路
本公开提出了会议声音采集、会议记录以及会议记录呈现方法和装置。第一方面,本公开提供了一种会议声音采集方法,上述会议声音采集方法包括:实时获取上述麦克风阵列采集的声音数据;将上述声音数据发送给会议记录服务器,上述声音数据用于触发上述会议记录服务器对上述声音数据进行人声分离,以及生成分离后的每个分离声音数据对应的、包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息的会议记录,并将所生成的各会议记录发送给上述会议声音采集终端对应的当前会议标识对应的各会议记录呈现终端,各上述会议记录用于触发收到各上述会议记录的会议记录呈现终端呈现各上述会议记录。在一些可选的实施方式中,上述会议声音采集终端还设置有至少一个说话人方向指示灯;以及上述会议声音采集方法还包括:对上述声音数据进行到来角估计;对于估计得到的每个到来角,按照预设的到来角与说话人方向指示灯标识之间的对应关系,确定与该到来角对应的说话人方向指示灯,以及将所确定的说话人方向指示灯打开第一预设时长。在一些可选的实施方式中,上述将上述声音数据发送给会议记录服务器,包括:将上述声音数据压缩后发送给上述会议记录服务器。第二方面,本公开提供了会议声音采集装置,应用于设置有麦克风阵列的会议声音采集终端,上述会议声音采集装置包括:声音数据获取单元,被配置成实时获取上述麦克风阵列采集的声音数据;声音数据发送单元,被配置成将上述声音数据发送给会议记录服务器,上述声音数据用于触发上述会议记录服务器对上述声音数据进行人声分离,以及生成分离后的每个分离声音数据对应的、包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息的会议记录,并将所生成的各会议记录发送给上述会议声音采集终端对应的当前会议标识对应的各会议记录呈现终端,各上述会议记录用于触发收到各上述会议记录的会议记录呈现终端呈现各上述会议记录。在一些可选的实施方式中,上述会议声音采集终端还设置有至少一个说话人方向指示灯;以及上述会议声音采集装置还包括:到来角估计单元,被配置成对上述声音数据进行到来角估计;以及指示灯打开单元,被配置成对于估计得到的每个到来角,按照预设的到来角与说话人方向指示灯标识之间的对应关系,确定与该到来角对应的说话人方向指示灯,以及将所确定的说话人方指示灯打开第一预设时长。在一些可选的实施方式中,上述声音数据发送单元进一步被配置成:将上述声音数据压缩后发送给上述会议记录服务器。需要说明的是,本公开提供的会议声音采集装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的相关说明,在此不再赘述。第三方面,本公开提供了一种会议记录方法,应用于会议记录服务器,上述会议记录方法包括:接收会议声音采集终端发送的声音数据;对上述声音数据进行人声分离;生成分离后的每个分离声音数据对应的会议记录,其中,每个分离声音数据对应的会议记录包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息;将所生成的各会议记录发送给目标会议标识对应的会议记录呈现终端,其中,上述目标会议标识为发送上述声音数据的会议声音采集终端对应的当前会议标识,各上述会议记录用于触发收到各上述会议记录的会议记录呈现终端呈现各上述会议记录。在一些可选的实施方式中,上述对上述声音数据进行人声分离,包括:对所收到的声音数据进行人声分离,生成预设数目个分离声音数据,其中,所生成的各分离声音数据分别与预设声源方向范围集合中各声源方向范围一一对应,上述预设声源方向范围集合中各声源方向范围互不重叠。在一些可选的实施方式中,上述生成分离后的每个分离声音数据对应的会议记录,包括:对于所生成的每个分离声音数据,响应于确定该分离声音数据中存在有效语音,执行以下会议记录生成操作:分别对该分离声音数据进行语音识别和声纹识别,得到识别文本和说话人身份信息;响应于确定该分离声音数据为语音起点,新建与上述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本;将所得到的识别文本拼接到与上述目标会议标识和所得到的说话人身份信息对应的当前说话文本的尾部,以及将该分离声音数据拼接到与上述目标会议标识和所得到的说话人身份信息对应的当前语音的尾部;用与上述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成与该分离声音数据对应的会议记录。在一些可选的实施方式中,上述会议记录生成操作还包括:响应于确定该分离声音数据为语音尾点,用与上述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成历史会议记录,以及将所生成的历史会议记录存储为与上述目标会议标识对应的历史会议记录。在一些可选的实施方式中,上述会议记录方法还包括:响应于接收到会议记录呈现终端发送的说话内容文本更新请求,其中,上述说话内容文本更新请求是上述会议记录呈现终端响应于检测到针对所呈现的历史会议记录中说话内容文本的修改操作而向上述会议记录服务器发送的,上述说话内容文本更新请求包括上述修改操作对应的修改后的说话内容文本以及上述修改操作所针对的历史会议记录的会议记录标识,将上述说话内容文本更新请求中的会议记录标识对应的历史会议记录中的说话内容文本更新为上述说话内容文本更新请求中的说话内容文本。在一些可选的实施方式中,上述对该分离声音数据进行语音识别,包括:基于语音识别模型对该分离声音数据进行语音识别;以及上述会议记录方法还包括:响应于确定满足预设语音识别模型更新条件,基于所存储的历史会议记录中修改过说话内容文本的历史会议记录中的声音数据和对应的说话内容文本更新上述语音识别模型。在一些可选的实施方式中,上述会议记录生成操作还包括:响应于确定该分离声音数据为语音起点,将当前时间确定为与上述目标会议标识和所得到的说话人身份信息对应的说话起始时间。在一些可选的实施方式中,上述用与上述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成与该分离声音数据对应的会议记录,包括:用与上述目标会议标识和所得到的说话人身份信息对应的说话起始时间、当前语音和当前说话文本以及所确定的说话人身份信息生成与该分离声音数据对应的会议记录;和/或上述用与上述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成历史会议记录,以及将所生成的历史会议记录存储为与上述目标会议标识对应本文档来自技高网...

【技术保护点】
1.一种会议声音采集方法,应用于设置有麦克风阵列的会议声音采集终端,所述会议声音采集方法包括:/n实时获取所述麦克风阵列采集的声音数据;/n将所述声音数据发送给会议记录服务器,所述声音数据用于触发所述会议记录服务器对所述声音数据进行人声分离,以及生成分离后的每个分离声音数据对应的、包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息的会议记录,并将所生成的各会议记录发送给所述会议声音采集终端对应的当前会议标识对应的各会议记录呈现终端,各所述会议记录用于触发收到各所述会议记录的会议记录呈现终端呈现各所述会议记录。/n

【技术特征摘要】
1.一种会议声音采集方法,应用于设置有麦克风阵列的会议声音采集终端,所述会议声音采集方法包括:
实时获取所述麦克风阵列采集的声音数据;
将所述声音数据发送给会议记录服务器,所述声音数据用于触发所述会议记录服务器对所述声音数据进行人声分离,以及生成分离后的每个分离声音数据对应的、包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息的会议记录,并将所生成的各会议记录发送给所述会议声音采集终端对应的当前会议标识对应的各会议记录呈现终端,各所述会议记录用于触发收到各所述会议记录的会议记录呈现终端呈现各所述会议记录。


2.根据权利要求1所述的会议声音采集方法,其中,所述会议声音采集终端还设置有至少一个说话人方向指示灯;以及
所述会议声音采集方法还包括:
对所述声音数据进行到来角估计;
对于估计得到的每个到来角,按照预设的到来角与说话人方向指示灯标识之间的对应关系,确定与该到来角对应的说话人方向指示灯,以及将所确定的说话人方向指示灯打开第一预设时长。


3.根据权利要求1或2所述的会议声音采集方法,其中,所述将所述声音数据发送给会议记录服务器,包括:
将所述声音数据压缩后发送给所述会议记录服务器。


4.一种会议声音采集装置,应用于设置有麦克风阵列的会议声音采集终端,所述会议声音采集装置包括:
声音数据获取单元,被配置成实时获取所述麦克风阵列采集的声音数据;
声音数据发送单元,被配置成将所述声音数据发送给会议记录服务器,所述声音数据用于触发所述会议记录服务器对所述声音数据进行人声分离,以及生成分离后的每个分离声音数据对应的、包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息的会议记录,并将所生成的各会议记录发送给所述会议声音采集终端对应的当前会议标识对应的各会议记录呈现终端,各所述会议记录用于触发收到各所述会议记录的会议记录呈现终端呈现各所述会议记录。


5.一种会议记录方法,应用于会议记录服务器,所述会议记录方法包括:
接收会议声音采集终端发送的声音数据;
对所述声音数据进行人声分离;
生成分离后的每个分离声音数据对应的会议记录,其中,每个分离声音数据对应的会议记录包括该分离声音数据以及该分离声音数据对应的说话内容文本和说话人身份信息;
将所生成的各会议记录发送给目标会议标识对应的会议记录呈现终端,其中,所述目标会议标识为发送所述声音数据的会议声音采集终端对应的当前会议标识,各所述会议记录用于触发收到各所述会议记录的会议记录呈现终端呈现各所述会议记录。


6.根据权利要求5所述的会议记录方法,其中,所述对所述声音数据进行人声分离,包括:
对所收到的声音数据进行人声分离,生成预设数目个分离声音数据,其中,所生成的各分离声音数据分别与预设声源方向范围集合中各声源方向范围一一对应,所述预设声源方向范围集合中各声源方向范围互不重叠。


7.根据权利要求5或6所述的会议记录方法,其中,所述生成分离后的每个分离声音数据对应的会议记录,包括:
对于所生成的每个分离声音数据,响应于确定该分离声音数据中存在有效语音,执行以下会议记录生成操作:分别对该分离声音数据进行语音识别和声纹识别,得到识别文本和说话人身份信息;响应于确定该分离声音数据为语音起点,新建与所述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本;将所得到的识别文本拼接到与所述目标会议标识和所得到的说话人身份信息对应的当前说话文本的尾部,以及将该分离声音数据拼接到与所述目标会议标识和所得到的说话人身份信息对应的当前语音的尾部;用与所述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成与该分离声音数据对应的会议记录。


8.根据权利要求7所述的会议记录方法,其中,所述会议记录生成操作还包括:
响应于确定该分离声音数据为语音尾点,用与所述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成历史会议记录,以及将所生成的历史会议记录存储为与所述目标会议标识对应的历史会议记录。


9.根据权利要求8所述的会议记录方法,其中,所述会议记录方法还包括:
响应于接收到会议记录呈现终端发送的说话内容文本更新请求,其中,所述说话内容文本更新请求是所述会议记录呈现终端响应于检测到针对所呈现的历史会议记录中说话内容文本的修改操作而向所述会议记录服务器发送的,所述说话内容文本更新请求包括所述修改操作对应的修改后的说话内容文本以及所述修改操作所针对的历史会议记录的会议记录标识,将所述说话内容文本更新请求中的会议记录标识对应的历史会议记录中的说话内容文本更新为所述说话内容文本更新请求中的说话内容文本。


10.根据权利要求9所述的会议记录方法,其中,所述对该分离声音数据进行语音识别,包括:基于语音识别模型对该分离声音数据进行语音识别;以及
所述会议记录方法还包括:
响应于确定满足预设语音识别模型更新条件,基于所存储的历史会议记录中修改过说话内容文本的历史会议记录中的声音数据和对应的说话内容文本更新所述语音识别模型。


11.根据权利要求10所述的会议记录方法,其中,所述会议记录生成操作还包括:
响应于确定该分离声音数据为语音起点,将当前时间确定为与所述目标会议标识和所得到的说话人身份信息对应的说话起始时间。


12.根据权利要求11所述的会议记录方法,其中,所述用与所述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成与该分离声音数据对应的会议记录,包括:
用与所述目标会议标识和所得到的说话人身份信息对应的说话起始时间、当前语音和当前说话文本以及所确定的说话人身份信息生成与该分离声音数据对应的会议记录;和/或
所述用与所述目标会议标识和所得到的说话人身份信息对应的当前语音和当前说话文本以及所确定的说话人身份信息生成历史会议记录,以及将所生成的历史会议记录存储为与所述目标会议标识对应的历史会议记录,包括:
用与所述目标会议标识和所得到的说话人身份信息对应的说话起始时间、当前语音和当前说话文本以及所确定的说话人身份信息生成历史会议记录,以及将所生成的历史会议记录存储为与所述目标会议标识对应的历史会议记录。


13.根据权利要求12所述的会议记录方法,其中,所述分别对该分离声音数据进行语音识别和声纹识别,得到识别文本和说话人身份信息,包括:
分别将该分离声音数据发送给语音识别服务器和声纹识别服务器,其中,该分离声音数据用于触发所述语音识别服务器对收到的声音数据进行语音识别并返回识别结果,以及用于触发所述声纹识别服务器对收到的声音数据进行声纹识别并返回识别结果;
分别将从所述语音识别服务器收到的识别结果和从所述声纹识别服务器收到的识别结果确定为对该分离声音数据进行语音识别和声纹识别所得到的识别文本和说话人身份信息。


14.根据权利要求7-13中任一项所述的会议记录方法,其中,所述会议记录方法还包括:
响应于接收到会议记录呈现终端发送的包括待查阅会议标识和查阅人标识的会议记录查阅请求,确定所述查阅人标...

【专利技术属性】
技术研发人员:张铖
申请(专利权)人:深圳市未艾智能有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1