一种纪要生成方法、装置、设备及存储介质制造方法及图纸

技术编号:32858264 阅读:7 留言:0更新日期:2022-03-30 19:33
本申请提供了一种纪要生成方法、装置、设备及存储介质,其中,方法包括:获取待生成纪要的文本,作为目标文本;获取目标文本的词级信息、句级信息和话题级信息,其中,词级信息包括目标文本中词的上下文信息和目标文本的关键词信息,句级信息包括目标文本中句子的上下文信息和目标文本的重点句信息,话题级信息包括目标文本的话题分割信息;根据目标文本的词级信息、句级信息和话题级信息,生成目标文本对应的纪要。本申请提供的纪要生成方法可自动生成目标文本对应的纪要。成目标文本对应的纪要。成目标文本对应的纪要。

【技术实现步骤摘要】
一种纪要生成方法、装置、设备及存储介质


[0001]本申请涉及自然语言处理
,尤其涉及一种纪要生成方法、装置、设备及存储介质。

技术介绍

[0002]在某些应用场景中,需要获取文本对应的纪要(文本对应的纪要描述的是文本的要点),比如,在涉及会议的场景,通常需要获取会议纪要,以将会议内容、重要精神进行传达和下发。
[0003]目前,获取文本对应的纪要的方式主要为人工获取方式,即,人工对文本进行整理,以得到文本对应的纪要。然而,在某些时候,文本的篇幅较长,比如,政府、企业日常办公会议、高校学术研讨会等会议的时长普遍较长,因此,会议文本的篇幅通常较长,可以理解的是,人工对篇幅较长的文本进行整理十分耗时,即人工获取纪要的方式效率较为低下。

技术实现思路

[0004]有鉴于此,本申请提供了一种纪要生成方法、装置、设备及存储介质,用以解决现有的纪要获取方式效率较为低下的问题,其技术方案如下:
[0005]一种纪要生成方法,包括:
[0006]获取待生成纪要的文本,作为目标文本;
[0007]获取所述目标文本的词级信息、句级信息和话题级信息,其中,所述词级信息包括所述目标文本中词的上下文信息和所述目标文本的关键词信息,所述句级信息包括所述目标文本中句子的上下文信息和所述目标文本的重点句信息,所述话题级信息包括所述目标文本的话题分割信息;
[0008]根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要。
[0009]可选的,所述获取所述目标文本的词级信息、句级信息和话题级信息,以及,所述根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要,包括:
[0010]利用纪要生成模块的文本理解部分,获取所述目标文本的词级信息、句级信息以及话题级信息;
[0011]利用所述纪要生成模块的纪要生成部分,以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要。
[0012]可选的,获取所述目标文本的词级信息和句级信息,包括:
[0013]获取所述目标文本包含的每个句子中每个词对应的融合有上下文信息的词特征,并以获取的词特征为依据,预测所述目标文本包含的每个句子中每个词为关键词的概率;
[0014]获取所述目标文本中每个句子对应的融合有上下文信息的句特征,并以获取的句特征为依据,预测所述目标文本包含的每个句子为重点句的概率;
[0015]所述目标文本包含的每个句子中每个词对应的词特征和每个句子中每个词为关键词的概率作为所述目标文本的词级信息,所述目标文本中每个句子对应的句特征和每个句子为重点句的概率作为所述目标文本的句级信息。
[0016]可选的,获取所述目标文本的词级信息和句级信息,还包括:
[0017]针对所述目标文本中的每个句子:
[0018]根据该句子中每个词为关键词的概率和该句子为重点句的概率,确定联合该句子为重点句的概率后,该句子中的每个词为关键词的概率,作为该句子中每个词对应的联合重点句概率后的关键词概率;
[0019]根据该句子中每个词为关键词的概率和该句子为重点句的概率,确定联合该句子中每个词为关键词的概率后,该句子为重点句的概率,作为该句子对应的联合关键词概率后的重点句概率;
[0020]所述目标文本包含的每个句子中每个词对应的词特征和每个句子中每个词对应的联合重点句概率后的关键词概率作为所述目标文本的词级信息,所述目标文本中每个句子对应的句特征和每个句子对应的联合关键词概率后的重点句概率,作为所述目标文本的句级信息。
[0021]可选的,获取所述目标文本的话题级信息,包括:
[0022]根据所述目标文本的句级信息,对所述目标文本进行话题分割,得到话题分割结果,作为所述目标文本的话题级信息。
[0023]可选的,所述根据所述目标文本的句级信息,对所述目标文本进行话题分割,得到话题分割结果,包括:
[0024]针对所述目标文本中的每个句子,根据该句子对应的句特征和该句子对应的联合关键词概率后的重点句概率,确定该句子对应的联合关键词概率后的句特征,并以该句子对应的联合关键词概率后的句特征为依据,预测该句子为话题结束句的概率;
[0025]根据所述目标文本中的每个句子为话题结束句的概率,确定话题分割结果。
[0026]可选的,所述以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要,包括:
[0027]在每个解码时刻:
[0028]根据当前解码时刻的状态向量、所述目标文本的词级信息和句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,其中,当前解码时刻的状态向量为表示已解码结果信息的状态向量;
[0029]根据当前解码时刻的状态向量、所述目标文本的话题级信息,确定所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量;
[0030]根据当前解码时刻的状态向量、所述目标文本的所有句子在当前解码时刻对应的上下文向量和所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量,确定当前解码时刻的纪要生成结果。
[0031]可选的,所述根据当前解码时刻的状态向量、所述目标文本的词级信息和句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,包括:
[0032]根据当前解码时刻的状态向量和所述目标文本的词级信息,确定所述目标文本包含的每个句子的所有词在当前解码时刻对应的上下文向量;
[0033]根据当前解码时刻的状态向量、所述目标文本包含的每个句子的所有词在当前解码时刻对应的上下文向量和所述目标文本的句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量。
[0034]可选的,所述目标文本的句级信息包括所述目标文本包含的每个句子对应的句特征和每个句子对应的联合关键词概率后的重点句概率;
[0035]所述根据当前解码时刻的状态向量、所述目标文本包含的每个句子的所有词在当前解码时刻对应的上下文向量和所述目标文本的句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,包括:
[0036]针对所述目标文本中的每个句子,根据当前解码时刻的状态向量、该句子的所有词在当前解码时刻对应的上下文向量、该句子对应的句特征和该句子对应的联合关键词概率后的重点句概率,确定该句子在当前解码时刻对应的权重;
[0037]根据所述目标文本包含的每个句子在当前解码时刻对应的权重、每个句子对应的句特征和每个句子的所有词在当前解码时刻对应的上下文向量,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量。
[0038]可选的,所述根据当前解码时刻的状态向量、所述目标文本的话题级信息,确定所述目标文本的所有话题在当前解码时刻对应的上下文向量,包括:
[0039]根据所述目标文本的话题级信息,确定所述目标文本涉及的每个话题包含的句子;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种纪要生成方法,其特征在于,包括:获取待生成纪要的文本,作为目标文本;获取所述目标文本的词级信息、句级信息和话题级信息,其中,所述词级信息包括所述目标文本中词的上下文信息和所述目标文本的关键词信息,所述句级信息包括所述目标文本中句子的上下文信息和所述目标文本的重点句信息,所述话题级信息包括所述目标文本的话题分割信息;根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要。2.根据权利要求1所述的纪要生成方法,其特征在于,所述获取所述目标文本的词级信息、句级信息和话题级信息,以及,所述根据所述目标文本的词级信息、句级信息和话题级信息,生成所述目标文本对应的纪要,包括:利用纪要生成模块的文本理解部分,获取所述目标文本的词级信息、句级信息以及话题级信息;利用所述纪要生成模块的纪要生成部分,以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要。3.根据权利要求2所述的纪要生成方法,其特征在于,获取所述目标文本的词级信息和句级信息,包括:获取所述目标文本包含的每个句子中每个词对应的融合有上下文信息的词特征,并以获取的词特征为依据,预测所述目标文本包含的每个句子中每个词为关键词的概率;获取所述目标文本中每个句子对应的融合有上下文信息的句特征,并以获取的句特征为依据,预测所述目标文本包含的每个句子为重点句的概率;所述目标文本包含的每个句子中每个词对应的词特征和每个句子中每个词为关键词的概率作为所述目标文本的词级信息,所述目标文本中每个句子对应的句特征和每个句子为重点句的概率作为所述目标文本的句级信息。4.根据权利要求3所述的纪要生成方法,其特征在于,获取所述目标文本的词级信息和句级信息,还包括:针对所述目标文本中的每个句子:根据该句子中每个词为关键词的概率和该句子为重点句的概率,确定联合该句子为重点句的概率后,该句子中的每个词为关键词的概率,作为该句子中每个词对应的联合重点句概率后的关键词概率;根据该句子中每个词为关键词的概率和该句子为重点句的概率,确定联合该句子中每个词为关键词的概率后,该句子为重点句的概率,作为该句子对应的联合关键词概率后的重点句概率;所述目标文本包含的每个句子中每个词对应的词特征和每个句子中每个词对应的联合重点句概率后的关键词概率作为所述目标文本的词级信息,所述目标文本中每个句子对应的句特征和每个句子对应的联合关键词概率后的重点句概率,作为所述目标文本的句级信息。5.根据权利要求4所述的纪要生成方法,其特征在于,获取所述目标文本的话题级信息,包括:
根据所述目标文本的句级信息,对所述目标文本进行话题分割,得到话题分割结果,作为所述目标文本的话题级信息。6.根据权利要求5所述的纪要生成方法,其特征在于,所述根据所述目标文本的句级信息,对所述目标文本进行话题分割,得到话题分割结果,包括:针对所述目标文本中的每个句子,根据该句子对应的句特征和该句子对应的联合关键词概率后的重点句概率,确定该句子对应的联合关键词概率后的句特征,并以该句子对应的联合关键词概率后的句特征为依据,预测该句子为话题结束句的概率;根据所述目标文本中的每个句子为话题结束句的概率,确定话题分割结果。7.根据权利要求2所述的纪要生成方法,其特征在于,所述以所述目标文本的词级信息、句级信息和话题级信息为依据,生成所述目标文本对应的纪要,包括:在每个解码时刻:根据当前解码时刻的状态向量、所述目标文本的词级信息和句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,其中,当前解码时刻的状态向量为表示已解码结果信息的状态向量;根据当前解码时刻的状态向量、所述目标文本的话题级信息,确定所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量;根据当前解码时刻的状态向量、所述目标文本的所有句子在当前解码时刻对应的上下文向量和所述目标文本涉及的所有话题在当前解码时刻对应的上下文向量,确定当前解码时刻的纪要生成结果。8.根据权利要求7所述的纪要生成方法,其特征在于,所述根据当前解码时刻的状态向量、所述目标文本的词级信息和句级信息,确定所述目标文本的所有句子在当前解码时刻对应的上下文向量,包括:根据当前解码时刻的状态向量和所述目标文...

【专利技术属性】
技术研发人员:戚婷万根顺王智国高建清刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1