用于企业会议的数据智能存储方法及装置制造方法及图纸

技术编号:39332431 阅读:9 留言:0更新日期:2023-11-12 16:07
本发明专利技术提供了用于企业会议的数据智能存储方法及装置,涉及数据处理技术领域,通过对会议视音频数据进行视音频同步分析获得K个参会声纹特征并进一步基于特征识别和声量处理获得K组声量统一化音频,进一步采用时序还原获得存储音频数据,对存储音频数据进行文本化处理获得存储文本数据,并根据会议数据查阅权限将存储音频数据和存储文本数据存储至企业云空间。解决了现有技术中存在对企业会议数据不加处理直接存储,导致实际记录存储的企业会议数据的复用性较差的技术问题。达到了提高企业会议数据存储安全性和可用性,提高企业会议数据在后续进行提取播放和工作复盘时的收听体验的技术效果。体验的技术效果。体验的技术效果。

【技术实现步骤摘要】
用于企业会议的数据智能存储方法及装置


[0001]本专利技术涉及数据处理
,具体涉及用于企业会议的数据智能存储方法及装置。

技术介绍

[0002]很多企业在会议室设备方面可能没有购买专业的摄像头和麦克风组合设备的需求。因此,它们在会议过程中仅仅是将音视频数据直接存储下来,而没有进行任何后续的处理或转换为文字内容,这样做可能导致存储的企业会议数据声音大小不一,导致会议音视频数据的复用性往往会受到影响。
[0003]如果企业需要复查会议内容、提取重要信息或与其他文件进行整合,那么采用原始的会议视音频数据无法快速搜索特定话题、人员发言或进行全文检索,会对会议记录和知识管理造成限制。
[0004]综上所述,现有技术中存在对企业会议数据不加处理直接存储,导致实际记录存储的企业会议数据的复用性较差的技术问题。

技术实现思路

[0005]本申请提供了用于企业会议的数据智能存储方法及装置,用于针对解决现有技术中存在对企业会议数据不加处理直接存储,导致实际记录存储的企业会议数据的复用性较差的技术问题。
[0006]鉴于上述问题,本申请提供了用于企业会议的数据智能存储方法及装置。
[0007]本申请的第一个方面,提供了用于企业会议的数据智能存储方法,所述方法包括:交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射;对所述目标会议视音频数据进行音轨提取,获得目标音频数据;获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得;预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频;获得目标存储音频数据,其中,所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得;获得目标存储文本数据,其中,所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得;预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间。
[0008]本申请的第二个方面,提供了用于企业会议的数据智能存储装置,所述装置包括:会议数据交互模块,用于交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;声纹特征生成模块,用于生成K个参会声纹特征,其中,所述K个参会声纹特征通过对
目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射;音轨提取执行模块,用于对所述目标会议视音频数据进行音轨提取,获得目标音频数据;参会音频拆分模块,用于获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得;声量处理执行模块,用于预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频;存储音频生成模块,用于获得目标存储音频数据,其中,所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得存储文本获得模块,用于获得目标存储文本数据,其中,所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得;查阅权限设定模块,用于预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间。
[0009]本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:本申请实施例提供的方法通过交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射;对所述目标会议视音频数据进行音轨提取,获得目标音频数据;获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得;预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频;获得目标存储音频数据,其中,所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得;获得目标存储文本数据,其中,所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得;预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间。达到了提高企业会议数据存储安全性和可用性,提高企业会议数据在后续进行提取播放和工作复盘时的收听体验的技术效果。
附图说明
[0010]图1为本申请提供的用于企业会议的数据智能存储方法流程示意图;图2为本申请提供的用于企业会议的数据智能存储方法中构建声纹特征识别子网络的流程示意图;图3为本申请提供的用于企业会议的数据智能存储方法中进行声量统一化处理的流程示意图;图4为本申请提供的用于企业会议的数据智能存储装置的结构示意图。
[0011]附图标记说明:会议数据交互模块1,声纹特征生成模块2,音轨提取执行模块3,参会音频拆分模块4,声量处理执行模块5,存储音频生成模块6,存储文本获得模块7,查阅权限设定模块8。
具体实施方式
[0012]本申请提供了用于企业会议的数据智能存储方法及装置,用于针对解决现有技术中存在对企业会议数据不加处理直接存储,导致实际记录存储的企业会议数据的复用性较
差的技术问题。达到了提高企业会议数据存储安全性和可用性,提高企业会议数据在后续进行提取播放和工作复盘时的收听体验的技术效果。
[0013]本专利技术技术方案中对数据的获取、存储、使用、处理等均符合相关规定。
[0014]下面,将参考附图对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部。
实施例一
[0015]如图1所示,本申请提供了用于企业会议的数据智能存储方法,所述方法包括:A100:交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;具体而言,在本实施例中,在目标企业开会期间,采用会议室摄像头和收音组合设备对所述目标企业会议进行视音频同步采集收录,从而获得所述目标会议视音频数据,所述目标企业会议中理论上每个参会人员都会发言,所述目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于企业会议的数据智能存储方法,其特征在于,所述方法包括:交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射;对所述目标会议视音频数据进行音轨提取,获得目标音频数据;获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得;预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频;获得目标存储音频数据,其中,所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得;获得目标存储文本数据,其中,所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得;预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间。2.如权利要求1所述的方法,其特征在于,生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射,所述方法还包括:预设会议音频采集节点,并基于所述会议音频采集节点对所述目标音频数据进行音频采集,获得M段局部音频数据,其中,所述M段局部音频数据具有M个局部音频采集节点,M为正整数;预设声纹特征提取规则,并基于所述声纹特征提取规则遍历所述M段局部音频数据,获得M组声纹特征参数;对所述M组声纹特征参数进行聚合处理,获得N种参会声纹特征和N个特征采集节点,其中,N为小于等于K的正整数;判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员;若所述N种参会声纹特征的特征数量满足所述K个参会人员,则基于所述N个特征采集节点在所述目标会议视音频数据中提取获得N个会议视频信息;对所述N个会议视频信息进行行为特征分析,定位获得N个发言参会人员;对所述N个发言参会人员进行身份识别,并构建参会人员身份和所述N种参会声纹特征之间的关联映射,获得所述K个参会声纹特征。3.如权利要求2所述的方法,其特征在于,判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员,所述方法还包括:判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员;若所述N种参会声纹特征的特征数量不满足所述K个参会人员,则基于所述会议音频采集节点对所述目标音频数据进行二次音频采集,获得M段第二局部音频数据,其中,所述M段第二局部音频数据具有M个第二局部音频采集节点;基于所述声纹特征提取规则遍历所述M段第二局部音频数据,获得M组第二声纹特征参
数;对所述M组声纹特征参数和所述M组第二声纹特征参数进行聚合处理,获得H种参会声纹特征和H个特征采集节点,其中,H为小于等于K的正整数;判断所述H种参会声纹特征的特征数量是否满足所述K个参会人员;以此类推,基于所述会议音频采集节点对所述目标音频数据进行多轮次音频采集和声纹特征分析,直至参会声纹特征的特征数量满足所述目标企业会议的参会人员数量。4.如权利要求1所述的方法,其特征在于,所述方法还包括:预构建声纹特征识别子网络,其中,所述声纹特征识别子网络包括声纹特征识别模块、音频拆分执行模块和参会音频存储模块;其中,所述参会音频存储模块包括K个参会音频存储空间;根据所述K个参会声纹特征与所述K个参会人员的映射关系,获得K组声纹特征

参会人员;将声纹特征作为第一属性,将所述K个参会声纹特征作为第一属性值,将参会人员作为第二属性,将所述K个参会人员作为第二属性值,并以所述K组声纹特征

参会人员为构建数据,基于知识图谱构建所述声纹特征识别模块。5...

【专利技术属性】
技术研发人员:孙立彬
申请(专利权)人:南通话时代信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1