基于人工智能的商务会议场景下花絮生成方法技术

技术编号:45024801 阅读:22 留言:0更新日期:2025-04-18 17:06
本发明专利技术公开了基于人工智能的商务会议场景下花絮生成方法,具体涉及数据处理技术领域;通过利用自然语言处理和计算机视觉技术分析会议内容,筛选出高价值的花絮片段,并采用多模态一致性检测模型,对发言者的语音特征与面部表情变化特征进行比对,识别Deepfake或GANs生成的伪造内容,确保视频真实性,进一步结合长短时记忆网络模型追踪音画同步情况,检测错误剪辑或篡改内容,并设定权限控制,对通过真实性验证的花絮片段进行智能剪辑和优化,将优化后的花絮视频导出至企业内部平台或社交媒体,并支持用户反馈与二次编辑优化,确保视频的真实性、可读性和传播价值,提高商务会议内容的可信度和影响力。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及基于人工智能的商务会议场景下花絮生成方法


技术介绍

1、基于人工智能的商务会议场景下花絮生成,指的是利用ai技术对会议过程中的关键片段、精彩瞬间或有趣互动进行智能提取、剪辑和自动生成内容。这些花絮可以包括演讲者的精彩发言、观众的互动、数据可视化展示,甚至是ai生成的字幕、配乐或风格化视频,以便于会议回顾、宣传或社交媒体分享。这一技术通常结合自然语言处理(nlp)、计算机视觉和视频编辑算法,通过分析会议视频、音频和文本数据,智能识别和筛选出最具价值的片段。例如,ai可以自动提取高频讨论话题、情绪高涨的瞬间或关键决策的形成过程,并将其整合为简短的花絮视频,使会议内容更具传播性和回顾价值。

2、现有技术存在以下不足之处:

3、在ai自动剪辑和优化花絮的过程中,某些算法(如deepfake或gans)可能会生成虚假或误导性内容。例如,ai可能会因为音画同步错误,导致某个发言者的语音与其面部表情不匹配,甚至生成虚假的面部表情或手势,使视频内容看起来像是篡改过的,影响会议的可信度。此外,如果ai错误剪辑或篡改会本文档来自技高网...

【技术保护点】

1.基于人工智能的商务会议场景下花絮生成方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:S3中,对提取出的语音特征进行分析后生成语音识别异常指数,语音识别异常指数的获取方法为:

3.根据权利要求2所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:设定异常阈值,若SRAI<0.2,则ASR识别质量好,误差可接受;若0.2≤SRAI<0.5,则存在部分识别错误,需要进一步评估;若SRAI≥0.5,则识别质量差,包含严重的误识别或ASR模型异常。

4.根据权利要求3所述的基...

【技术特征摘要】

1.基于人工智能的商务会议场景下花絮生成方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:s3中,对提取出的语音特征进行分析后生成语音识别异常指数,语音识别异常指数的获取方法为:

3.根据权利要求2所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:设定异常阈值,若srai<0.2,则asr识别质量好,误差可接受;若0.2≤srai<0.5,则存在部分识别错误,需要进一步评估;若srai≥0.5,则识别质量差,包含严重的误识别或asr模型异常。

4.根据权利要求3所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:s3中,对提取出的面部表情变化特征进行分析后生成面部表情变异指数,面部表情变异指数的获取方法为:

5.根据权利要求4所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:若fevi<0.2,则表情变化正常,无异常;若0.2≤fevi<0.5,表情变化存在异常,需进一步分析;若fevi≥0.5,表情变化高度异常,为deepfake或不自然的面部表情合成。

6.根据权利要求5所述的基于人工智能的商务会议场景下花絮生成方法,其特征在于:s3中,将语音识别异常指数和面部表情变异指数转换为综合特征向量,将综合特征向量作为机器学习模型的输入,机器学习模型以每组综合特征向量预测所筛选花絮片段的真实性值标签为预测目标,以最小化对所有所筛选花絮片段的真实性值标签的预测误差之和作为训练目...

【专利技术属性】
技术研发人员:李灯陈兵
申请(专利权)人:南京微特喜网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1