会后执行事项确定方法、系统、装置及设备制造方法及图纸

技术编号:33538806 阅读:14 留言:0更新日期:2022-05-21 09:39
本申请公开了会后行动信息确定方法、系统、装置及设备。其中,方法包括:确定会议记录;通过会后执行事项识别模型中的特征提取器,确定会议记录中句子的特征数据;通过会后执行事项识别模型中的分类器,根据句子特征数据,判断会议记录中句子是否包括会后执行事项。采用这种处理方式,使得从大量句子级的会后执行事项标注信息中学习得到会后行动识别模型,通过该模型可识别多人对话会议记录中各个句子是否包括会后执行事项;因此,可以有效提升多人对话会议场景下的会后执行事项识别准确率,同样也适用于单人讲话会议场景,从而提升会后执行效率。行效率。行效率。

【技术实现步骤摘要】
会后执行事项确定方法、系统、装置及设备


[0001]本申请涉及数据处理
,具体涉及会后执行事项识别方法、系统和装 置,会后执行事项识别模型构建方法和装置,会议记录生成方法和装置,会议记 录的处理方法和装置,以及电子设备。

技术介绍

[0002]随着技术的不断发展,线上会议变得越来越普遍,线上会议可以有效提高工 作效率。在线上会议的会后阶段,会议人员可在会议管理系统的辅助下,根据会 议语音整理得到会议纪要,包括议题、结论、问题、会后执行事项等。
[0003]目前,会议管理系统主要采用以下三种方式,根据会议记录确定出会议纪要。 方式一,通过文本摘要方式,自动生成会议纪要;方式二,会议管理系统提供会 议纪要的模板,由用户来撰写模板内容;方式三、会议管理系统允许用户在会议 过程中,标记或记录重要的文本信息,这些信息会高亮提供给用户,方便会议纪 要整理。
[0004]在实现本专利技术过程中,专利技术人发现会议纪要中的会后执行事项是提高会后 执行效率的关键内容,然而通过上述技术方案识别会后执行事项时至少存在如 下问题:1)方式一适用于正式会议,正式会议的文本记录大多是单一作者的书 面语言,文本摘要效果较好;而普通的工作会议大多是多人口语对话,自动文本 摘要模型的生成质量无法保证,因而无法准确识别到会后执行事项;2)方式二 尽管有会议记录和模板格式上的支撑,但用户整理会议纪要内容仍然费时费力, 机器所起到的辅助作用极为有限;3)方式三仍然很依赖于用户,而且对会议的 顺畅性也有所破坏。综上所述,如何提升多人对话会议场景下的会后执行事项识 别准确率,降低人工工作量,确保会议的顺畅性,成为本领域技术人员迫切需要 解决的问题。

技术实现思路

[0005]本申请提供会后执行事项确定方法,以解决现有技术存在的多人对话会议 场景下会后执行事项识别准确率较低等问题。本申请另外提供会后执行事项识 别系统和装置,会后执行事项识别模型构建方法和装置,会议记录生成方法和装 置,会议记录的处理方法和装置,以及电子设备。
[0006]本申请提供一种会后执行事项确定方法,包括:
[0007]确定待处理的会议记录;
[0008]通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的 特征数据;所述会后执行事项识别模型从训练数据集中学习得到;
[0009]通过所述会后执行事项识别模型中的分类器,根据句子特征数据,判断所述 会议记录中句子是否包括会后执行事项。
[0010]可选的,所述特征提取器包括多层循环神经网络;
[0011]所述通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句 子的
特征数据,包括:
[0012]通过基于多层循环神经网络的特征提取器,确定所述句子的多个不同深度 等级的特征数据;
[0013]所述通过所述会后执行事项识别模型中的分类器,根据句子特征数据,判断 所述会议记录中句子是否包括会后执行事项,包括:
[0014]通过分类器,根据多个不同深度等级的句子特征数据,判断所述句子是否包 括会后执行事项。
[0015]可选的,还包括:
[0016]确定所述会议记录中句子的位置信息;
[0017]所述通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句 子的特征数据,包括:
[0018]通过所述特征提取器,根据会议记录中句子和位置信息,确定句子特征数据。
[0019]可选的,所述位置信息包括:文档级的位置信息和/或议题级的位置信息。
[0020]可选的,还包括:
[0021]通过所述分类器,根据句子特征数据,确定目标会议记录中句子包括的会后 执行事项要素信息。
[0022]可选的,所述事项要素信息包括以下要素信息的至少一个:事项内容,相关 用户,执行时间。
[0023]可选的,一个会后行动的多个行动要素信息分布在多个句子中。
[0024]可选的,所述会议记录包括多人对话会议记录。
[0025]可选的,还包括:
[0026]将会后执行事项发送至客户端,以使得客户端显示会后执行事项。
[0027]可选的,所述方法还包括:
[0028]确定会后执行事项的相关用户信息;
[0029]所述将会后执行事项发送至客户端,包括:
[0030]根据相关用户信息,将会后执行事项发送至相关用户的客户端。
[0031]可选的,还包括:
[0032]确定会后执行事项的执行时间信息;
[0033]根据执行时间信息,向客户端发送会后执行事项的时间提醒信息。
[0034]可选的,所述确定待处理的会议记录,包括:
[0035]接收会议语音数据;
[0036]通过语音识别算法,将所述语音数据转换为所述会议记录。
[0037]本申请还提供一种课后执行事项确定方法,包括:
[0038]确定待处理的授课记录;
[0039]通过课后执行事项识别模型中的特征提取器,确定所述授课记录中句子的 特征数据;所述课后执行事项识别模型从训练数据集中学习得到;
[0040]通过所述课后执行事项识别模型中的分类器,根据句子特征数据,判断所述 授课记录中的句子是否包括课后执行事项。
[0041]本申请还提供一种直播执行事项确定方法,包括:
[0042]确定待处理的直播记录;
[0043]通过直播执行事项识别模型中的特征提取器,确定所述直播记录中句子的 特征数据;所述直播执行事项识别模型从训练数据集中学习得到;
[0044]通过所述直播执行事项识别模型中的分类器,根据句子特征数据,判断所述 直播记录中的句子是否包括直播行动事项。
[0045]本申请还提供一种会后执行事项识别模型构建方法,包括:
[0046]确定训练数据集;
[0047]构建会后执行事项识别模型的网络结构;
[0048]根据训练数据集,学习得到会后执行事项识别模型;
[0049]其中,所述训练数据包括会议记录中句子、及会后执行事项标注信息。
[0050]可选的,所述训练数据集中句子顺序与句子在会议记录中的顺序不同;
[0051]所述确定训练数据集包括:
[0052]调整多个会议记录中句子之间的顺序;
[0053]根据打乱顺序的句子,确定所述标注信息。
[0054]可选的,所述确定训练数据集包括:
[0055]清除会议记录中的敏感信息。
[0056]可选的,所述敏感信息包括以下内容的至少一项:人名,机构名。
[0057]可选的,所述确定训练数据集,包括:
[0058]根据标注规则,确定与会议记录中句子对应的所述标注信息。
[0059]可选的,所述标注规则包括以下规则的至少一个:
[0060]将不包括时间信息和动作信息的句子作为负样本;
[0061]将包括会前执行事项的句子作为负本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种会后执行事项确定方法,其特征在于,包括:确定待处理的会议记录;通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据;所述会后执行事项识别模型从训练数据集中学习得到;通过所述会后执行事项识别模型中的分类器,根据句子特征数据,判断所述会议记录中句子是否包括会后执行事项。2.根据权利要求1的方法,其特征在于,所述特征提取器包括多层循环神经网络;所述通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据,包括:通过基于多层循环神经网络的特征提取器,确定所述句子的多个不同深度等级的特征数据;所述通过所述会后执行事项识别模型中的分类器,根据句子特征数据,判断所述会议记录中句子是否包括会后执行事项,包括:通过分类器,根据多个不同深度等级的句子特征数据,判断所述句子是否包括会后执行事项。3.根据权利要求1的方法,其特征在于,还包括:确定所述会议记录中句子的位置信息;所述通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据,包括:通过所述特征提取器,根据会议记录中句子和位置信息,确定句子特征数据。4.根据权利要求3的方法,其特征在于,所述位置信息包括:文档级的位置信息和/或议题级的位置信息。5.根据权利要求1的方法,其特征在于,还包括:通过所述分类器,根据句子特征数据,确定目标会议记录中句子包括的会后执行事项要素信息。6.根据权利要求5的方法,其特征在于,所述事项要素信息包括以下要素信息的至少一个:事项内容,相关用户,执行时间。7.根据权利要求5的方法,其特征在于,一个会后行动的多个行动要素信息分布在多个句子中。8.根据权利要求1的方法,其特征在于,所述会议记录包括多人对话会议记录。9.根据权利要求1的方法,其特征在于,还包括:将会后执行事项发送至客户端,以使得客户端显示会后执行事项。10.根据权利要求9的方法,其特征在于,所述方法还包括:确定会后执行事项的相关用户信息;所述将会后执行事项发送至客户端,包括:根据相关用户信息,将会后执行事项发送至相关用户的客户端。11.根据权利要求9的方法,其特征在于,还包括:
确定会后执行事项的执行时间信息;根据执行时间信息,向客户端发送会后执行事项的时间提醒信息。12.根据权利要求1的方法,其特征在于,所述确定待处理的会议记录,包括:接收会议语音数据;通过语音识别算法,将所述语音数据转换为所述会议记录。13.一种课后执行事项确定方法,其特征在于,包括:确定待处理的授课记录;通过课后执行事项识别模型中的特征提取器,确定所述授课记录中句子的特征数据;所述课后执行事项识别模型从训练数据集中学习得到;通过所述课后执行事项识别模型中的分类器,根据句子特征数据,判断所述授课记录中的句子是否包括课后执行事项。14.一种直播执行事项确定方法,其特征在于,包括:确定待处理的直播记录;通过直播执行事项识别模型中的特征提取器,确定所述直播记录中句子的特征数据;所述直播执行事项识别模型从训练数据集中学习得到;通过所述直播执行事项识别模型中的分类器,根据句子特征数据,判断所述直播记录中的句子是否包括直播行动事项。15.一种会后执行事项识别模型构建方法,其特征在于,包括:确定训练数据集;构建会后执行事项识别模型的网络结构;根据训练数据集,学习得到会后执行事项识别模型;其中,所述训练数据包括会议记录中句子、及会后执行事项标注信息。16.根据权利要求15的方法,其特征在于,所述训练数据集中句子顺序与句子在会议记录中的顺序不同;所述确定训练数据集包括:调整多个会议记录中句子之间的顺序;根据打乱顺序的句子,确定所述标注信息。17.根据权利要求15的方法,其特征在于,所述确定训练数据集包括:清除会议记录中的敏感信息。18.根据权利要求16的方法,其特征在于,所述敏感信息包括以下内容的至少一项:人名,机构名。19.根据权利要求15的方法,其特征在于,所述确定训练数据集,包括:根据标注规则,确定与会议记录中句子对应的所述标注信息。20.根据权利要求19的方法,其特征在于,所述标注规则包括以下规则的至少一个:将不包括时间信息和动作信息的句子作为负样本;将包括会前执行事项的句子作为负样本;将包括会中执行事项的句子作为负样本;将包括不需会后执行的事项描述信息的句子作为负样本。21.根据权利要求15的方法,其特征在于,所述确定训练数据集,包括:
确定包括会议记录中句子及所述标注信息的第一训练数据集;通过数据增强算法,根据第一训练数据集,生成第二训练数据集;将第一训练数据集与第二训练数据集的合集作为所述训练数据集。22.根据权利要求15的方法,其特征在于,还包括:通过所述模型,确定测试句子的会后执行事项预测信息;若所述预测信息与测试句子的会后执行事项标注信息不同,则校正测试句子的会后执行事项标注信息;根据校正后的标注信息,更新所述模型。23.根据权利要求15的方法,其特征在于,所述模型包括特征提取器,用于确定句子特征数据;所述模型包括分类器,用于根据句子特征数据,确定句子中的会后执行事项。24.根据权利要求23的方法,其特征在于,所述特征提取器包括多层循环神经网络;所述特征提取器,具体用于确定多个不同深度等级的句子特征数据;所述分类器,具体用于根据多个不同深度等级的句子特征数据,确定句子中的会后执行事项。25.根据权利要求23的方法,其特征在于,所述训练数据还包括:句子在会议记录中的位置信息;所述特征提取器,具体用于根据句子和位置信息,确定句子特征数据。26.根据权利要求15的方法,其特征在于,所述会后执行事项标注信息包括:句子是否包括会后执行事项,和/或句子中的会后执行事项要素信息。27.一种会后执行事项确定方法,其特征在于,包括:确定待处理的会议记录;通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据;所述会后执行事项识别模型从训练数据集中学习得到;通过所述会后执行事项识别模型中的分类器,根据句子特征数据,确定所述会议记录中句子包括的会后执行...

【专利技术属性】
技术研发人员:刘嘉庆李亚丽
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1