System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种摘要生成方法、装置、设备及介质制造方法及图纸_技高网

一种摘要生成方法、装置、设备及介质制造方法及图纸

技术编号:40507355 阅读:6 留言:0更新日期:2024-03-01 13:22
本申请公开了一种应用于数据处理技术领域的摘要生成方法、装置、设备及介质。在该方法中,获取媒体内容包括的各个子内容的内容数据,基于各个子内容的内容数据,确定各个子内容的摘要。子内容的摘要能够描述子内容的主要内容。先提取子内容的摘要,能够降低生成媒体内容的总摘要的难度。基于各个子内容的权重,对各个子内容的摘要进行融合,得到媒体内容的摘要。其中,子内容的权重能够反映子内容在媒体内容中的重要程度。如此,参照各个子内容在媒体内容中的重要程度,融合子内容的摘要,能够减少重要内容的遗漏,也能够避免过多描述非重要内容,得到的媒体内容的摘要能够较为准确地描述媒体内容的主要内容,便于用户通过摘要了解媒体内容。

【技术实现步骤摘要】

本申请涉及数据处理,具体涉及一种摘要生成方法、装置、设备及介质


技术介绍

1、对于一些媒体内容,用户需要快速了解具体的内容。比如,在视频播放场景中,用户可能需要了解视频的大致内容,以确定是否继续观看。又比如,在会议场景中,在会议结束后,用户可能需要查看会议内容来了解本次会议所讨论的内容。

2、目前,用户能够通过媒体内容的摘要快速了解内容。但是,媒体内容的摘要难以较为准确地概括媒体内容的主要内容,影响用户对于媒体内容的了解。


技术实现思路

1、有鉴于此,本申请提供一种摘要生成方法、装置、设备及介质,旨在生成较为准确地描述媒体内容的主要内容的摘要,便于用户通过摘要了解媒体内容。

2、基于此,本申请提供的技术方案如下:

3、第一方面,本申请提供一种摘要生成方法,所述方法包括:获取媒体内容包括的各个子内容的内容数据,所述子内容是对所述媒体内容划分得到的;基于各个所述子内容的内容数据,确定所述子内容的摘要;基于各个所述子内容的权重对各个所述子内容的摘要进行融合,得到所述媒体内容的摘要,所述子内容的权重用于表示所述子内容在所述媒体内容中的重要程度。

4、在一种可能的实现方式中,所述子内容的权重根据所述子内容的内容信息确定,所述内容信息基于所述子内容在所述媒体内容中的时间信息以及所述子内容的内容数据确定。

5、在一种可能的实现方式中,所述子内容的权重基于所述子内容的内容信息包括的子信息对应的子权重确定。

6、在一种可能的实现方式中,所述内容信息包括以下一项或者多项子信息:所述子内容的时长,所述子内容涉及的人物的数量,以及所述子内容的时间段在所述媒体内容的时间段中的位置。

7、在一种可能的实现方式中,所述子内容的权重基于人工智能模型确定,所述人工智能模型用于基于输入的内容信息输出权重。

8、在一种可能的实现方式中,所述基于各个所述子内容的权重对各个所述子内容的摘要进行融合,得到所述媒体内容的摘要,包括:基于第一语言处理模型处理各个所述子内容的权重和各个所述子内容的摘要,得到所述媒体内容的摘要。

9、在一种可能的实现方式中,所述内容数据为文本数据,所述基于各个所述子内容的内容数据,确定所述子内容的摘要,包括:基于第二语言处理模型分别处理各个所述子内容的内容数据,得到各个所述子内容的摘要。

10、在一种可能的实现方式中,所述媒体内容为会议的内容,所述子内容为对所述会议进行划分得到的子会议的内容,或者所述会议为重复性日程会议,所述子内容为所述重复性日程会议包括的至少一个日程会议的内容。

11、在一种可能的实现方式中,所述子会议采用以下方法对所述会议划分得到:基于所述会议的会议类型以及所述会议的会议内容划分所述会议得到所述子会议。

12、在一种可能的实现方式中,所述子会议采用以下方法对所述会议划分得到:基于所述会议的至少两种内容维度划分所述会议,得到所述子会议。

13、第二方面,本申请提供一种摘要生成装置,所述装置包括:获取单元,用于获取媒体内容包括的各个子内容的内容数据,所述子内容是对所述媒体内容划分得到的;确定单元,用于基于各个所述子内容的内容数据,确定所述子内容的摘要;生成单元,用于基于各个所述子内容的权重对各个所述子内容的摘要进行融合,得到所述媒体内容的摘要,所述子内容的权重用于表示所述子内容在所述媒体内容中的重要程度。

14、在一种可能的实现方式中,所述子内容的权重根据所述子内容的内容信息确定,所述内容信息基于所述子内容在所述媒体内容中的时间信息以及所述子内容的内容数据确定。

15、在一种可能的实现方式中,所述子内容的权重基于所述子内容的内容信息包括的子信息对应的子权重确定。

16、在一种可能的实现方式中,所述内容信息包括以下一项或者多项子信息:所述子内容的时长,所述子内容涉及的人物的数量,以及所述子内容的时间段在所述媒体内容的时间段中的位置。

17、在一种可能的实现方式中,所述子内容的权重基于人工智能模型确定,所述人工智能模型用于基于输入的内容信息输出权重。

18、在一种可能的实现方式中,所述生成单元,具体用于基于第一语言处理模型处理各个所述子内容的权重和各个所述子内容的摘要,得到所述媒体内容的摘要。

19、在一种可能的实现方式中,所述内容数据为文本数据,所述确定单元,用于基于第二语言处理模型分别处理各个所述子内容的内容数据,得到各个所述子内容的摘要。

20、在一种可能的实现方式中,所述媒体内容为会议的内容,所述子内容为对所述会议进行划分得到的子会议的内容,或者所述会议为重复性日程会议,所述子内容为所述重复性日程会议包括的至少一个日程会议的内容。

21、在一种可能的实现方式中,所述子会议采用以下方法对所述会议划分得到:基于所述会议的会议类型以及所述会议的会议内容划分所述会议得到所述子会议。

22、在一种可能的实现方式中,所述子会议采用以下方法对所述会议划分得到:基于所述会议的至少两种内容维度划分所述会议,得到所述子会议。

23、第三方面,本申请提供一种电子设备,包括:

24、一个或多个处理器;

25、存储装置,其上存储有一个或多个程序,

26、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任一所述的方法。

27、第四方面,本申请提供一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现第一方面或者第一方面中任一实现方式所述的方法。

28、第五方面,本申请提供一种计算机程序产品,所述计算机程序产品在设备上运行时,使得所述设备执行第一方面或者第一方面中任一实现方式所述的方法。

29、由此可见,本申请具有如下有益效果:

30、本申请提供一种摘要生成方法、装置、设备及介质。在该方法中,获取媒体内容包括的各个子内容的内容数据,基于各个子内容的内容数据,确定各个子内容的摘要。子内容的摘要能够描述子内容的主要内容。先提取子内容的摘要,能够降低生成媒体内容的总摘要的难度。基于各个子内容的权重,对各个子内容的摘要进行融合,得到媒体内容的摘要。其中,子内容的权重能够反映子内容在媒体内容中的重要程度。如此,参照各个子内容在媒体内容中的重要程度,融合子内容的摘要,能够减少重要内容的遗漏,也能够避免过多描述非重要内容,得到的媒体内容的摘要能够较为准确地描述媒体内容的主要内容,便于用户通过摘要了解媒体内容。

本文档来自技高网...

【技术保护点】

1.一种摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述子内容的权重根据所述子内容的内容信息确定,所述内容信息基于所述子内容在所述媒体内容中的时间信息以及所述子内容的内容数据确定。

3.根据权利要求2所述的方法,其特征在于,所述子内容的权重基于所述子内容的内容信息包括的子信息对应的子权重确定。

4.根据权利要求3所述的方法,其特征在于,所述内容信息包括以下一项或者多项子信息:

5.根据权利要求2所述的方法,其特征在于,所述子内容的权重基于人工智能模型确定,所述人工智能模型用于基于输入的内容信息输出权重。

6.根据权利要求1所述的方法,其特征在于,所述基于各个所述子内容的权重对各个所述子内容的摘要进行融合,得到所述媒体内容的摘要,包括:

7.根据权利要求1所述的方法,其特征在于,所述内容数据为文本数据,所述基于各个所述子内容的内容数据,确定所述子内容的摘要,包括:

8.根据权利要求1-7任一项所述的方法,其特征在于,

9.根据权利要求8所述的方法,其特征在于,所述子会议采用以下方法对所述会议划分得到:

10.根据权利要求8所述的方法,其特征在于,所述子会议采用以下方法对所述会议划分得到:

11.一种摘要生成装置,其特征在于,所述装置包括:

12.一种电子设备,其特征在于,包括:

13.一种计算机可读介质,其特征在于,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-10中任一项所述的方法。

...

【技术特征摘要】

1.一种摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述子内容的权重根据所述子内容的内容信息确定,所述内容信息基于所述子内容在所述媒体内容中的时间信息以及所述子内容的内容数据确定。

3.根据权利要求2所述的方法,其特征在于,所述子内容的权重基于所述子内容的内容信息包括的子信息对应的子权重确定。

4.根据权利要求3所述的方法,其特征在于,所述内容信息包括以下一项或者多项子信息:

5.根据权利要求2所述的方法,其特征在于,所述子内容的权重基于人工智能模型确定,所述人工智能模型用于基于输入的内容信息输出权重。

6.根据权利要求1所述的方法,其特征在于,所述基于各个所述子内容的权重对各个所述子内容的摘要进...

【专利技术属性】
技术研发人员:耿心昀
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1