【技术实现步骤摘要】
摘要生成方法、装置、设备及介质
本公开涉及网络
,特别涉及一种摘要生成方法、装置、设备及介质。
技术介绍
近年来,随着智能语音技术的发展,出现了一系列的智能会议系统,能够将会议内容通过语音识别生成对应的会议文本信息,对会议文本信息进行记录和存储,还可以基于该会议文本信息自动生成摘要,会议中使用者无需再慌乱的打字记录,只需要收录音频,进行自动识别和生成摘要即可。在相关技术中,具体的生成摘要的方法可以为:通过语音识别生成会议对应的会议文本信息,使用文字排名(TextRank)算法,根据会议文本信息中任两个句子之间的相似度来获得每个句子的权重,根据句子权重生成目标摘要。在上述生成摘要的方法中,生成摘要时仅依据会议文本信息中任两个句子之间的相似度来生成摘要,但在真实的会议场景中,影响一句话是否是会议摘要的因素有很多,基于上述方法,生成的摘要准确率低,与实际情况不符。
技术实现思路
本公开实施例提供了一种摘要生成方法、装置、设备及介质,可以解决相关技术中仅依据会议文本信息中任两个句子之间的相似 ...
【技术保护点】
1.一种摘要生成方法,其特征在于,所述方法包括:/n基于第一会议文本信息中多个文本片段和所述多个文本片段中每个文本片段的发言人信息,获取所述多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重;/n基于所述任两个文本片段的相似度和每个文本片段的发言人对应的身份权重,获取每个文本片段的权重;/n基于所述第一会议文本信息中所述权重符合目标条件的文本片段,生成目标摘要。/n
【技术特征摘要】
1.一种摘要生成方法,其特征在于,所述方法包括:
基于第一会议文本信息中多个文本片段和所述多个文本片段中每个文本片段的发言人信息,获取所述多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重;
基于所述任两个文本片段的相似度和每个文本片段的发言人对应的身份权重,获取每个文本片段的权重;
基于所述第一会议文本信息中所述权重符合目标条件的文本片段,生成目标摘要。
2.根据权利要求1所述的方法,其特征在于,所述基于所述任两个文本片段的相似度和每个文本片段的发言人对应的身份权重,获取每个文本片段的权重,包括:
对于任一文本片段,基于与所述任一文本片段的相似度大于相似度阈值的文本片段集合中每个文本片段的所述权重,所述文本片段集合中每个文本片段与其他的文本片段的相似度,以及所述任一文本片段的发言人对应的身份权重,获取所述任一文本片段的权重。
3.根据权利要求1所述的方法,其特征在于,所述每个文本片段的发言人对应的身份权重的获取过程包括下述任一项:
对于每个发言人,获取预设的所述发言人对应的第一身份权重作为所述发言人对应的身份权重;
对于每个发言人,基于所述发言人的身份信息,获取预设的所述身份信息对应的第二身份权重作为所述发言人对应的身份权重;
对于每个发言人,基于所述第一会议文本信息中目标时间之前的第二会议文本信息,对所述发言人对应的第一身份权重或所述发言人的身份信息对应的第二身份权重进行更新,将更新后的第三身份权重作为所述发言人对应的身份权重。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一会议文本信息中目标时间之前的第二会议文本信息,对所述发言人对应的第一身份权重或所述发言人的身份信息对应的第二身份权重进行更新,包括下述任一项:
对于每个发言人,基于所述第二会议文本信息,提取所述发言人的多个文本片段对应的第一摘要和所述第二会议文本信息中所有文本片段对应的第二摘要,根据所述第一摘要和所述第二摘要的相似度,对所述第一身份权重或所述第二身份权重进行更新;
对于每个发言人,基于所述第二会议文本信息,根据所述发言人的多个文本片段和所述第二会议文本信息中所有文本片段的相似度,对所述第一身份权重或所述第二身份权重进行更新。
5.根据权利要求3所述的方法,其特征在于,所述文...
【专利技术属性】
技术研发人员:王磊,冯大航,陈孝良,常乐,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。