【技术实现步骤摘要】
基于深度学习的图像意境挖掘与意境转换中国古诗的方法
[0001]本专利技术属于深度学习识别与生成
,具体涉及一种基于深度学习的图像意境挖掘与意境转换中国古诗的方法。
技术介绍
[0002]中国古诗是中华传统文化中的瑰宝,历史悠久,可以追溯至两千余年前的《诗经》。作为古代劳动人民记录事件、抒发情感的主要载体,中国古诗在独特的历史文化背景下形成了形神兼备、情景交融的美学追求。《关于实施中华优秀传统文化传承发展工程的意见》中指出,传承中华人文精神是中华优秀传统文化传承发展工程的主要内容之一。因此,推广普及古诗文化有着重要的现实意义。随着人工智能技术的不断发展,其在各个领域的应用也如过江之鲫,但跨模态进行图像生成古诗的相关研究尚且较少,而单模态的古诗生成方法也存在着主题漂移、一致性差、灵活性差、自学习能力差以及没有自动评价体系等问题。如何从图像中提取图像意境信息,并根据意境生成质量更高的中国古诗,是当前研究中的重要难点。
[0003]现有的单模态古诗生成方法包括传统的方法与基于深度学习的方法。传统的方法包括基于模板的方法、基于模式的方法、基于实例推理的方法、基于遗传算法的方法、基于摘要生成的方法和基于统计机器翻译的方法等。基于深度学习的方法包括基于RNN等序列模型生成古诗。
[0004]现有的跨模态图像生成古诗方法包括两种,第一种是基于人工收集图像
‑
古诗配对数据集,通过模版匹配的方法根据图像检索古诗;第二种主要是从图像中提取关键词,再以提取到的关键词作为现有的单模态古诗生成方法的输入 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的图像意境挖掘与意境转换中国古诗的方法,其特征在于,包括:步骤1,接收用户生成古诗的用户任务,并从用户任务中提取用户提交的目标图片;步骤2,将所述目标图片输入至经过训练的跨模态诗歌生成器中,为用户所提交的图像生成对应的古诗;其中,预训练的跨模态诗歌生成器的训练过程如下:(1)从开源数据库获取开源古诗数据集,并进行关键词预处理得到筛选后的高频关键词;其中,所述开源古诗数据集包括古诗的相关信息以及每首古诗对应的多个关键词;(2)将每首古诗对应的多个关键词与所述高频关键词进行匹配,如仅有一个关键词匹配不上,则保留古诗的相关信息以及匹配上的关键词,以获得待配对数据集;(3)将待配对数据集中同一首古诗的关键词进行串联,作为检索关键词,并根据所述检索关键词从网络获取与古诗配对的多张初始图片;(4)对所述初始匹配图片按照古诗的相关信息进行筛选,得到每一首古诗按照关联度配对的图片,并将每首古诗以及配对的图片作为一个样本数据,将所有样本数据组成图像
‑
古诗配对数据集;(5)提取所述图像
‑
古诗配对数据集多维度的特征向量,并重塑为特征序列,将特征序列作为跨模态诗歌生成器的输入,将预训练单模态语言模型的模型参数导入预设的跨模态诗歌生成器中,进而对所述跨模态诗歌生成器进行微调训练,完成跨模态诗歌生成器的预训练过程。2.根据权利要求1所述的基于深度学习的图像意境挖掘与意境转换中国古诗的方法,其特征在于,(1)包括:(11),从开源数据库获取开源古诗数据集;(12),统计所述开源古诗数据集中的每个关键词的频率,并按照比例选择高频关键词;(13),将所述开源古诗数据集中生僻的关键词替换为语义相同的关键词;(14),删除所述开源古诗数据集中抽象的高频关键词,获得筛选后的高频关键词。3.根据权利要求1所述的基于深度学习的图像意境挖掘与意境转换中国古诗的方法,其特征在于,(3)包括:(31),将待配对数据集中同一首古诗的关键词进行串联,将串联后的关键词作为检索关键词;(32),根据所述检索关键词,利用爬虫技术从网络公开的图像数据库中爬取与古诗配对的多张初始图片。4.根据权利要求1所述的基于深度学习的图像意境挖掘与意境转换中国古诗的方法,其特征在于,(4)包括:(41),对所述初始匹配图片按照古诗的相关信息进行人工筛选,得到每一首古诗按照关联度配对的图片;(42),将每首古诗以及配对的图片作为一个样本数据,将所有样本数据组成图像
‑
古诗配对数据集。5.根据权利要求1所述的基于深度学习的图像意境挖掘与意境转换中国古诗的方法,其特征在于,(4)中的三个特征提取网络通过如下步骤实现:a,分别获取Imagent
‑
1k数据集、Place205数据集以及Sentibank数据集;b,分别在Imagent
‑
1k数据集上训练预设的VGG
‑
16网络、在Place205数据集上训练预设的Place205
‑
VGGNet,在Sentibank数据集上训练预设的DCAN网络,得到三个特征提取网络。
6.根据权利要求5所述的基于深度学习的图像意境挖掘与意境转换中国古诗的方法,其特征在于,(5)包括:(51),利用三个特征提取网络分别提取每个样本数据的特征向量;(52),同一样本数据的三个特征向量串联,将串联后的特征向量重塑为一个特征序列;(53),计算每个样本数据的位置编码,并将位置...
【专利技术属性】
技术研发人员:高大化,董宇波,李雨嫣,邱添,贺昱,鲁永红,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。