System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种话题生成方法、装置和设备制造方法及图纸_技高网

一种话题生成方法、装置和设备制造方法及图纸

技术编号:40558033 阅读:11 留言:0更新日期:2024-03-05 19:19
本申请提供一种话题生成方法、装置和设备。本申请提供的话题生成方法,包括:针对用户实时发布的每条实时发布内容,利用预训练的跨模态对齐的图文模型,对该实时发布内容进行特征提取,得到该实时发布内容的实时文本特征向量和/或实时图像特征向量;基于多条实时发布内容的实时文本特征向量和/或实时图像特征向量,构建特征向量库;确定特征向量库中的实时文本特征向量和实时图像特征向量的话题;针对待确定话题的目标实时发布内容,从特征向量库中查找与其匹配的匹配特征向量;根据匹配特征向量的话题,确定目标实时发布内容的话题。本申请提供的话题生成方法、装置和设备,无需人工参与,降低了成本,便于推广应用。

【技术实现步骤摘要】

本申请涉及互联网,尤其涉及一种话题生成方法、装置和设备


技术介绍

1、随着移动互联网的普及,人们越来越依赖手机进行社交和娱乐活动。社交平台的兴起为用户提供了便捷的社交网络,使得用户可以随时随地与他人保持联系,分享生活点滴。

2、对于社交平台而言,用户在平台内所发布的发布内容是构建社交关系的主要入口,优质的发布内容能够吸引内容消费者在平台内长时间驻留,提升付费意愿。为使内容消费者对发布内容产生兴趣,需要对平台内的发布内容进行内容理解,提取其主题内容,生成其话题,从而提升对该类话题感兴趣的内容消费者的消费意愿。

3、现有的话题生成方法通常需要人工参与,耗费大量人力资源、开发成本较高。因此,如何减少人工参与、降低成本成为了亟待解决的问题。


技术实现思路

1、有鉴于此,本申请提供一种话题生成方法、装置和设备,用以解决现有的话题生成方法耗费大量人力资源、开发成本较高的问题。

2、具体地,本申请是通过如下技术方案实现的:

3、本申请第一方面提供一种话题生成方法,所述方法包括:

4、针对用户实时发布的每条实时发布内容,利用预训练的跨模态对齐的图文模型,对该实时发布内容进行特征提取,得到该实时发布内容的实时文本特征向量和/或实时图像特征向量;

5、基于多条实时发布内容的实时文本特征向量和/或实时图像特征向量,构建特征向量库;

6、确定所述特征向量库中的实时文本特征向量和实时图像特征向量的话题;

7、针对待确定话题的目标实时发布内容,从所述特征向量库中查找与其匹配的匹配特征向量;

8、根据所述匹配特征向量的话题,确定所述目标实时发布内容的话题。

9、本申请第二方面提供一种话题生成装置,所述装置包括提取模块、构建模块、确定模块和查找模块;其中,

10、所述提取模块,用于针对用户实时发布的每条实时发布内容,利用预训练的跨模态对齐的图文模型,对该实时发布内容进行特征提取,得到该实时发布内容的实时文本特征向量和/或实时图像特征向量;

11、所述构建模块,用于基于多条实时发布内容的实时文本特征向量和/或实时图像特征向量,构建特征向量库;

12、所述确定模块,用于确定所述特征向量库中的实时文本特征向量和实时图像特征向量的话题;

13、所述查找模块,用于针对待确定话题的目标实时发布内容,从所述特征向量库中查找与其匹配的匹配特征向量;

14、所述确定模块,还用于根据所述匹配特征向量的话题,确定所述目标实时发布内容的话题。

15、本申请第三方面提供一种话题生成设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请第一方面提供的任一项所述方法的步骤。

16、本申请第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本申请第一方面提供的任一项所述方法的步骤。

17、本申请提供的话题生成方法、装置和设备,针对用户实时发布的每条实时发布内容,通过利用预训练的跨模态对齐的图文模型,对该实时发布内容进行特征提取,得到该实时发布内容的实时文本特征向量和/或实时图像特征向量,并基于多条实时发布内容的实时文本特征向量和/或实时图像特征向量,构建特征向量库,进而确定所述特征向量库中的实时文本特征向量和实时图像特征向量的话题,从而针对待确定话题的目标实时发布内容,从所述特征向量库中查找与其匹配的匹配特征向量,并根据所述匹配特征向量的话题,确定所述目标实时发布内容的话题。这样,可根据多条实时发布内容构建特征向量库,并基于特征向量库自动确定待确定话题的目标实时发布内容的话题,无需人工参与,降低了成本,便于推广应用。

本文档来自技高网...

【技术保护点】

1.一种话题生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,确定所述特征向量库中的实时文本特征向量和实时图像特征向量的话题,包括:

3.根据权利要求2所述的方法,其特征在于,针对所述第一聚类结果中的每个类,利用该类中的历史文本特征向量所对应的文本内容,确定该类中的实时文本特征向量和实时图像特征向量的话题,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述预训练的跨模态对齐的图文模型的预训练过程,包括:

6.根据权利要求1所述的方法,其特征在于,从所述特征向量库中查找与其匹配的相似特征向量,包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述匹配特征向量的话题,确定所述目标实时发布内容的话题,包括:

8.一种话题生成装置,其特征在于,所述装置包括提取模块、构建模块、确定模块和查找模块;其中,

9.一种话题生成设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种话题生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,确定所述特征向量库中的实时文本特征向量和实时图像特征向量的话题,包括:

3.根据权利要求2所述的方法,其特征在于,针对所述第一聚类结果中的每个类,利用该类中的历史文本特征向量所对应的文本内容,确定该类中的实时文本特征向量和实时图像特征向量的话题,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述预训练的跨模态对齐的图文模型的预训练过程,包括:

6.根据权利要求1所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:赵旭高龙成梁广东
申请(专利权)人:北京陌陌信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1