一种采用主题模型实现会议纪要自动聚类的方法技术

技术编号:46484635 阅读:5 留言:0更新日期:2025-09-26 19:06
本发明专利技术涉及会议信息处理与管理决策分析技术领域,公开一种采用主题模型实现会议纪要自动聚类的方法,包括:通过并行分析会议音频信号与对应转写的文本,分别获取声学置信度序列和原始主题熵序列;进而利用声学置信度对原始主题熵序列进行强制性加权校正,在得到的可靠熵序列中识别出决策锚点,并以此为核心对文本进行逆向关联聚类,本发明专利技术避免了现有技术仅能进行内容归纳的局限,通过识别由声学置信度校正后的熵序列中的决策锚点,不仅实现了对决策形成过程的自动化重构,还能进一步甄别决策共识的质量,为管理追溯与风险审计提供了客观的逻辑链路。

【技术实现步骤摘要】

本专利技术涉及一种采用主题模型实现会议纪要自动聚类的方法,属于会议信息处理与管理决策分析。


技术介绍

1、当前在现代化的行政,商业或金融管理实践中,会议是形成决策分配任务与同步信息的关键环节,其产生的语音或文本记录,是后续进行管理、监督与复盘的核心依据;当前,为提升信息处理效率,业界普遍采用主题模型一类的自然语言处理技术,对会议记录文本进行自动化分析,通过识别并聚合高频词汇与语义关联,来归纳出会议所讨论的各项核心议题,这种方式在快速提炼会议内容要点方面,确实提供了一定的便利。

2、然而,当我们将这种普遍采用的技术方式,置于企业管理与行政监督等所关注的对流程合规性与决策可追溯性有严格要求的管理场景中进行审视时,其内在的一个制约便凸显出来:现有技术方式根植于一个静态文档隐喻,其核心机制在于打破原始文本的时间顺序,以内容相似性作为唯一准则对信息进行重组,其结果是,会议作为一种管理活动所独有的最有价值的过程价值,即群体共识是如何从分歧走向统一决策是如何在众多讨论中最终收敛并形成的动态逻辑,被这一重组过程完全消解了;这种过程信息的丢失并非简单的细节缺损,本文档来自技高网...

【技术保护点】

1.一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤c中,并行地分析与每一窗口对应的实时音频信号,还用于计算出说话人重叠率;并且,步骤c还包括,基于信噪比有效语音时长占比和说话人重叠率,通过设定的归一化函数,输出声学置信度时间序列。

3.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤f中,熵反弹因子的计算遵循以下规则:,其中,为校正后主题熵时间序列在时刻的熵值,为决策锚点对应的时刻,为一设定的最小分析时间步长。

...

【技术特征摘要】

1.一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤c中,并行地分析与每一窗口对应的实时音频信号,还用于计算出说话人重叠率;并且,步骤c还包括,基于信噪比有效语音时长占比和说话人重叠率,通过设定的归一化函数,输出声学置信度时间序列。

3.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤f中,熵反弹因子的计算遵循以下规则:,其中,为校正后主题熵时间序列在时刻的熵值,为决策锚点对应的时刻,为一设定的最小分析时间步长。

4.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,方法还包括:在会议开始前,依据参会者列表及其组织层级,为每一位参会者分别设定决策权重系数;并且,在步骤b中,针对每一窗口内的文本单元输出主题概率分布向量时,还依据文本单元的发言人身份及其对应的决策权重系数,对文本单元在主题模型运算中的影响力进行加权。

5.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,方法还包括:在会议开始前,依据会议议程文本,运行与步骤b相同的主题模型,以生成至少一个议程基准主题向量;在会议进行中,将步骤b为每一窗口生成的主题概率分布向量作为实时议题向量,并实时计算实时议题向量与议程基准主题向量之间的语义距离,以生成偏离度序列;当偏离度序列中连续超过设定数量窗口的偏离度均高于设定的偏离阈值时,触发议题偏离预警。

6.根据权利要求1...

【专利技术属性】
技术研发人员:商永金薛元谢特辉
申请(专利权)人:厦门厦华科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1