【技术实现步骤摘要】
本专利技术涉及一种采用主题模型实现会议纪要自动聚类的方法,属于会议信息处理与管理决策分析。
技术介绍
1、当前在现代化的行政,商业或金融管理实践中,会议是形成决策分配任务与同步信息的关键环节,其产生的语音或文本记录,是后续进行管理、监督与复盘的核心依据;当前,为提升信息处理效率,业界普遍采用主题模型一类的自然语言处理技术,对会议记录文本进行自动化分析,通过识别并聚合高频词汇与语义关联,来归纳出会议所讨论的各项核心议题,这种方式在快速提炼会议内容要点方面,确实提供了一定的便利。
2、然而,当我们将这种普遍采用的技术方式,置于企业管理与行政监督等所关注的对流程合规性与决策可追溯性有严格要求的管理场景中进行审视时,其内在的一个制约便凸显出来:现有技术方式根植于一个静态文档隐喻,其核心机制在于打破原始文本的时间顺序,以内容相似性作为唯一准则对信息进行重组,其结果是,会议作为一种管理活动所独有的最有价值的过程价值,即群体共识是如何从分歧走向统一决策是如何在众多讨论中最终收敛并形成的动态逻辑,被这一重组过程完全消解了;这种过程信息的丢失
...【技术保护点】
1.一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤c中,并行地分析与每一窗口对应的实时音频信号,还用于计算出说话人重叠率;并且,步骤c还包括,基于信噪比有效语音时长占比和说话人重叠率,通过设定的归一化函数,输出声学置信度时间序列。
3.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤f中,熵反弹因子的计算遵循以下规则:,其中,为校正后主题熵时间序列在时刻的熵值,为决策锚点对应的时刻,为一设定的最小分析时间
...
【技术特征摘要】
1.一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤c中,并行地分析与每一窗口对应的实时音频信号,还用于计算出说话人重叠率;并且,步骤c还包括,基于信噪比有效语音时长占比和说话人重叠率,通过设定的归一化函数,输出声学置信度时间序列。
3.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,步骤f中,熵反弹因子的计算遵循以下规则:,其中,为校正后主题熵时间序列在时刻的熵值,为决策锚点对应的时刻,为一设定的最小分析时间步长。
4.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,方法还包括:在会议开始前,依据参会者列表及其组织层级,为每一位参会者分别设定决策权重系数;并且,在步骤b中,针对每一窗口内的文本单元输出主题概率分布向量时,还依据文本单元的发言人身份及其对应的决策权重系数,对文本单元在主题模型运算中的影响力进行加权。
5.根据权利要求1所述的一种采用主题模型实现会议纪要自动聚类的方法,其特征在于,方法还包括:在会议开始前,依据会议议程文本,运行与步骤b相同的主题模型,以生成至少一个议程基准主题向量;在会议进行中,将步骤b为每一窗口生成的主题概率分布向量作为实时议题向量,并实时计算实时议题向量与议程基准主题向量之间的语义距离,以生成偏离度序列;当偏离度序列中连续超过设定数量窗口的偏离度均高于设定的偏离阈值时,触发议题偏离预警。
6.根据权利要求1...
【专利技术属性】
技术研发人员:商永金,薛元,谢特辉,
申请(专利权)人:厦门厦华科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。