【技术实现步骤摘要】
本专利技术涉及一种带有多模态锚点的自适应文本摘要方法,属于智能化摘要。
技术介绍
1、多模态摘要旨在利用来源于多种不同的媒体数据(如图像、音频、文本等)进行凝练和压缩,通过不同的表现手法来生成摘要或概括。多模态摘要使自然语言处理与计算机图像领域的交叉方向,旨在结合多种媒体数据来生成更全面、准确和可读性更强的摘要内容。
2、现有的多模态摘要方法面临着以下挑战:
3、1)、不同模态存在于不同的语义空间中,在更加相似的语义表示空间中表达各种模态信息至关重要。
4、2)、对于文本摘要的结果,必须考虑如何学习各种模态之间的异同,从而减少冗余,提高文本摘要的质量。
5、为了克服上述挑战,对多种不同的媒体数据进行文本摘要是本领域技术人员急需要解决的技术问题。
技术实现思路
1、目的:为了克服现有技术中存在的不足,本专利技术提供一种带有多模态锚点的自适应文本摘要方法,以新闻内容中的源文本、源图像和图像文本标题作为输入,并将生成的文本摘要和生成的图像摘要作为输
2本文档来自技高网...
【技术保护点】
1.一种带有多模态锚点的自适应文本摘要方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的一种带有多模态锚点的自适应文本摘要方法,其特征在于:还包括:
3.根据权利要求1或2所述的一种带有多模态锚点的自适应文本摘要方法,其特征在于:所述源文本句子特征hi,图像目标特征vj获取方法,具体包括:
4.根据权利要求1或2所述的一种带有多模态锚点的自适应文本摘要方法,其特征在于:所述多模态交叉注意力模块由k层Cross-transformers串联组成;其中,第k层的Cross-transformers实现过程:将k-1层Cross-
...【技术特征摘要】
1.一种带有多模态锚点的自适应文本摘要方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的一种带有多模态锚点的自适应文本摘要方法,其特征在于:还包括:
3.根据权利要求1或2所述的一种带有多模态锚点的自适应文本摘要方法,其特征在于:所述源文本句子特征hi,图像目标特征vj获取方法,具体包括:
4.根据权利要求1或2所述的一种带有多模态锚点的自适应文本摘要方法,其特征在于:所述多模态交叉注意力模块由k层cross-transformers串联组成;其中,第k层的cross-transformers实现过程:将k-1层cross-transformers输出的作为将输入selfattl→l模块,得到自注意源文本句子特征将输入selfattr→r模块,得到自注意图像目标特征再将输入c...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。