【技术实现步骤摘要】
会后执行事项确定方法、系统、装置及设备
[0001]本申请涉及数据处理
,具体涉及会后执行事项识别方法、系统和装 置,会后执行事项识别模型构建方法和装置,会议记录生成方法和装置,会议记 录的处理方法和装置,以及电子设备。
技术介绍
[0002]随着技术的不断发展,线上会议变得越来越普遍,线上会议可以有效提高工 作效率。在线上会议的会后阶段,会议人员可在会议管理系统的辅助下,根据会 议语音整理得到会议纪要,包括议题、结论、问题、会后执行事项等。
[0003]目前,会议管理系统主要采用以下三种方式,根据会议记录确定出会议纪要。 方式一,通过文本摘要方式,自动生成会议纪要;方式二,会议管理系统提供会 议纪要的模板,由用户来撰写模板内容;方式三、会议管理系统允许用户在会议 过程中,标记或记录重要的文本信息,这些信息会高亮提供给用户,方便会议纪 要整理。
[0004]在实现本专利技术过程中,专利技术人发现会议纪要中的会后执行事项是提高会后 执行效率的关键内容,然而通过上述技术方案识别会后执行事项时至少存在如 下问题:1)方式一适用于正式会议,正式会议的文本记录大多是单一作者的书 面语言,文本摘要效果较好;而普通的工作会议大多是多人口语对话,自动文本 摘要模型的生成质量无法保证,因而无法准确识别到会后执行事项;2)方式二 尽管有会议记录和模板格式上的支撑,但用户整理会议纪要内容仍然费时费力, 机器所起到的辅助作用极为有限;3)方式三仍然很依赖于用户,而且对会议的 顺畅性也有所破坏。综上所述,如何提升多人对话 ...
【技术保护点】
【技术特征摘要】
1.一种会后执行事项确定方法,其特征在于,包括:确定待处理的会议记录;通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据;所述会后执行事项识别模型从训练数据集中学习得到;通过所述会后执行事项识别模型中的分类器,根据句子特征数据,判断所述会议记录中句子是否包括会后执行事项。2.根据权利要求1的方法,其特征在于,所述特征提取器包括多层循环神经网络;所述通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据,包括:通过基于多层循环神经网络的特征提取器,确定所述句子的多个不同深度等级的特征数据;所述通过所述会后执行事项识别模型中的分类器,根据句子特征数据,判断所述会议记录中句子是否包括会后执行事项,包括:通过分类器,根据多个不同深度等级的句子特征数据,判断所述句子是否包括会后执行事项。3.根据权利要求1的方法,其特征在于,还包括:确定所述会议记录中句子的位置信息;所述通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据,包括:通过所述特征提取器,根据会议记录中句子和位置信息,确定句子特征数据。4.根据权利要求3的方法,其特征在于,所述位置信息包括:文档级的位置信息和/或议题级的位置信息。5.根据权利要求1的方法,其特征在于,还包括:通过所述分类器,根据句子特征数据,确定目标会议记录中句子包括的会后执行事项要素信息。6.根据权利要求5的方法,其特征在于,所述事项要素信息包括以下要素信息的至少一个:事项内容,相关用户,执行时间。7.根据权利要求5的方法,其特征在于,一个会后行动的多个行动要素信息分布在多个句子中。8.根据权利要求1的方法,其特征在于,所述会议记录包括多人对话会议记录。9.根据权利要求1的方法,其特征在于,还包括:将会后执行事项发送至客户端,以使得客户端显示会后执行事项。10.根据权利要求9的方法,其特征在于,所述方法还包括:确定会后执行事项的相关用户信息;所述将会后执行事项发送至客户端,包括:根据相关用户信息,将会后执行事项发送至相关用户的客户端。11.根据权利要求9的方法,其特征在于,还包括:
确定会后执行事项的执行时间信息;根据执行时间信息,向客户端发送会后执行事项的时间提醒信息。12.根据权利要求1的方法,其特征在于,所述确定待处理的会议记录,包括:接收会议语音数据;通过语音识别算法,将所述语音数据转换为所述会议记录。13.一种课后执行事项确定方法,其特征在于,包括:确定待处理的授课记录;通过课后执行事项识别模型中的特征提取器,确定所述授课记录中句子的特征数据;所述课后执行事项识别模型从训练数据集中学习得到;通过所述课后执行事项识别模型中的分类器,根据句子特征数据,判断所述授课记录中的句子是否包括课后执行事项。14.一种直播执行事项确定方法,其特征在于,包括:确定待处理的直播记录;通过直播执行事项识别模型中的特征提取器,确定所述直播记录中句子的特征数据;所述直播执行事项识别模型从训练数据集中学习得到;通过所述直播执行事项识别模型中的分类器,根据句子特征数据,判断所述直播记录中的句子是否包括直播行动事项。15.一种会后执行事项识别模型构建方法,其特征在于,包括:确定训练数据集;构建会后执行事项识别模型的网络结构;根据训练数据集,学习得到会后执行事项识别模型;其中,所述训练数据包括会议记录中句子、及会后执行事项标注信息。16.根据权利要求15的方法,其特征在于,所述训练数据集中句子顺序与句子在会议记录中的顺序不同;所述确定训练数据集包括:调整多个会议记录中句子之间的顺序;根据打乱顺序的句子,确定所述标注信息。17.根据权利要求15的方法,其特征在于,所述确定训练数据集包括:清除会议记录中的敏感信息。18.根据权利要求16的方法,其特征在于,所述敏感信息包括以下内容的至少一项:人名,机构名。19.根据权利要求15的方法,其特征在于,所述确定训练数据集,包括:根据标注规则,确定与会议记录中句子对应的所述标注信息。20.根据权利要求19的方法,其特征在于,所述标注规则包括以下规则的至少一个:将不包括时间信息和动作信息的句子作为负样本;将包括会前执行事项的句子作为负样本;将包括会中执行事项的句子作为负样本;将包括不需会后执行的事项描述信息的句子作为负样本。21.根据权利要求15的方法,其特征在于,所述确定训练数据集,包括:
确定包括会议记录中句子及所述标注信息的第一训练数据集;通过数据增强算法,根据第一训练数据集,生成第二训练数据集;将第一训练数据集与第二训练数据集的合集作为所述训练数据集。22.根据权利要求15的方法,其特征在于,还包括:通过所述模型,确定测试句子的会后执行事项预测信息;若所述预测信息与测试句子的会后执行事项标注信息不同,则校正测试句子的会后执行事项标注信息;根据校正后的标注信息,更新所述模型。23.根据权利要求15的方法,其特征在于,所述模型包括特征提取器,用于确定句子特征数据;所述模型包括分类器,用于根据句子特征数据,确定句子中的会后执行事项。24.根据权利要求23的方法,其特征在于,所述特征提取器包括多层循环神经网络;所述特征提取器,具体用于确定多个不同深度等级的句子特征数据;所述分类器,具体用于根据多个不同深度等级的句子特征数据,确定句子中的会后执行事项。25.根据权利要求23的方法,其特征在于,所述训练数据还包括:句子在会议记录中的位置信息;所述特征提取器,具体用于根据句子和位置信息,确定句子特征数据。26.根据权利要求15的方法,其特征在于,所述会后执行事项标注信息包括:句子是否包括会后执行事项,和/或句子中的会后执行事项要素信息。27.一种会后执行事项确定方法,其特征在于,包括:确定待处理的会议记录;通过会后执行事项识别模型中的特征提取器,确定所述会议记录中句子的特征数据;所述会后执行事项识别模型从训练数据集中学习得到;通过所述会后执行事项识别模型中的分类器,根据句子特征数据,确定所述会议记录中句子包括的会后执行...
【专利技术属性】
技术研发人员:刘嘉庆,李亚丽,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。