用于企业会议的数据智能存储方法及装置制造方法及图纸

技术编号：39332431 阅读：9 留言：0更新日期：2023-11-12 16:07

本发明专利技术提供了用于企业会议的数据智能存储方法及装置，涉及数据处理技术领域，通过对会议视音频数据进行视音频同步分析获得K个参会声纹特征并进一步基于特征识别和声量处理获得K组声量统一化音频，进一步采用时序还原获得存储音频数据，对存储音频数据进行文本化处理获得存储文本数据，并根据会议数据查阅权限将存储音频数据和存储文本数据存储至企业云空间。解决了现有技术中存在对企业会议数据不加处理直接存储，导致实际记录存储的企业会议数据的复用性较差的技术问题。达到了提高企业会议数据存储安全性和可用性，提高企业会议数据在后续进行提取播放和工作复盘时的收听体验的技术效果。体验的技术效果。体验的技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
用于企业会议的数据智能存储方法及装置

[0001]本专利技术涉及数据处理
，具体涉及用于企业会议的数据智能存储方法及装置。

技术介绍

[0002]很多企业在会议室设备方面可能没有购买专业的摄像头和麦克风组合设备的需求。因此，它们在会议过程中仅仅是将音视频数据直接存储下来，而没有进行任何后续的处理或转换为文字内容，这样做可能导致存储的企业会议数据声音大小不一，导致会议音视频数据的复用性往往会受到影响。
[0003]如果企业需要复查会议内容、提取重要信息或与其他文件进行整合，那么采用原始的会议视音频数据无法快速搜索特定话题、人员发言或进行全文检索，会对会议记录和知识管理造成限制。
[0004]综上所述，现有技术中存在对企业会议数据不加处理直接存储，导致实际记录存储的企业会议数据的复用性较差的技术问题。

技术实现思路

[0005]本申请提供了用于企业会议的数据智能存储方法及装置，用于针对解决现有技术中存在对企业会议数据不加处理直接存储，导致实际记录存储的企业会议数据的复用性较差的技术问题。
[0006]鉴于上述问题，本申请提供了用于企业会议的数据智能存储方法及装置。
[0007]本申请的第一个方面，提供了用于企业会议的数据智能存储方法，所述方法包括：交互获得目标会议视音频数据，其中，所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得，所述目标企业会议共有K个参会人员，K为正整数；生成K个参会声纹特征，其中，所述K个参会声纹特征通过对目标会议视音频数据进行视音...

【技术保护点】

【技术特征摘要】
1.用于企业会议的数据智能存储方法，其特征在于，所述方法包括：交互获得目标会议视音频数据，其中，所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得，所述目标企业会议共有K个参会人员，K为正整数；生成K个参会声纹特征，其中，所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得，所述K个参会声纹特征与所述K个参会人员一一映射；对所述目标会议视音频数据进行音轨提取，获得目标音频数据；获得K组参会音频，其中，所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得；预设标准声量阈值，并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理，获得K组声量统一化音频；获得目标存储音频数据，其中，所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得；获得目标存储文本数据，其中，所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得；预设会议数据查阅权限，并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间。2.如权利要求1所述的方法，其特征在于，生成K个参会声纹特征，其中，所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得，所述K个参会声纹特征与所述K个参会人员一一映射，所述方法还包括：预设会议音频采集节点，并基于所述会议音频采集节点对所述目标音频数据进行音频采集，获得M段局部音频数据，其中，所述M段局部音频数据具有M个局部音频采集节点，M为正整数；预设声纹特征提取规则，并基于所述声纹特征提取规则遍历所述M段局部音频数据，获得M组声纹特征参数；对所述M组声纹特征参数进行聚合处理，获得N种参会声纹特征和N个特征采集节点，其中，N为小于等于K的正整数；判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员；若所述N种参会声纹特征的特征数量满足所述K个参会人员，则基于所述N个特征采集节点在所述目标会议视音频数据中提取获得N个会议视频信息；对所述N个会议视频信息进行行为特征分析，定位获得N个发言参会人员；对所述N个发言参会人员进行身份识别，并构建参会人员身份和所述N种参会声纹特征之间的关联映射，获得所述K个参会声纹特征。3.如权利要求2所述的方法，其特征在于，判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员，所述方法还包括：判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员；若所述N种参会声纹特征的特征数量不满足所述K个参会人员，则基于所述会议音频采集节点对所述目标音频数据进行二次音频采集，获得M段第二局部音频数据，其中，所述M段第二局部音频数据具有M个第二局部音频采集节点；基于所述声纹特征提取规则遍历所述M段第二局部音频数据，获得M组第二声纹特征参
数；对所述M组声纹特征参数和所述M组第二声纹特征参数进行聚合处理，获得H种参会声纹特征和H个特征采集节点，其中，H为小于等于K的正整数；判断所述H种参会声纹特征的特征数量是否满足所述K个参会人员；以此类推，基于所述会议音频采集节点对所述目标音频数据进行多轮次音频采集和声纹特征分析，直至参会声纹特征的特征数量满足所述目标企业会议的参会人员数量。4.如权利要求1所述的方法，其特征在于，所述方法还包括：预构建声纹特征识别子网络，其中，所述声纹特征识别子网络包括声纹特征识别模块、音频拆分执行模块和参会音频存储模块；其中，所述参会音频存储模块包括K个参会音频存储空间；根据所述K个参会声纹特征与所述K个参会人员的映射关系，获得K组声纹特征
‑
参会人员；将声纹特征作为第一属性，将所述K个参会声纹特征作为第一属性值，将参会人员作为第二属性，将所述K个参会人员作为第二属性值，并以所述K组声纹特征
‑
参会人员为构建数据，基于知识图谱构建所述声纹特征识别模块。5...

【专利技术属性】
技术研发人员：孙立彬，
申请(专利权)人：南通话时代信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人