当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于语言大模型的可解释性图像美学情感预测方法技术

技术编号:41384991 阅读:32 留言:0更新日期:2024-05-20 19:06
本发明专利技术公开了一种基于语言大模型的可解释性图像美学情感预测方法:步骤1,获取美学数据集,对美学数据集进行数据清洗和预处理,获得每张图片的图像ID、文本描述信息和美学质量评分信息;步骤2,构建图像美学可解释性模型,该模型包括视觉特征提取模块、提示文本特征提取模块、文本‑视觉融合模块、美学情感特征提取模块、美学自适应模块和美学描述生成解码模块;步骤3采用训集对图像美学可解释模型进行训练,得到训练好的图像美学可解释模型。步骤4,将待测的图像输入步骤3得到的训练好的图像美学可解释模型,得到输出结果。本发明专利技术解决有效地提高了美学可解释性的能力。

【技术实现步骤摘要】

本专利技术属于图像美学可解释研究,特别涉及一种基于语言大模型的可解释性图像美学情感预测方法


技术介绍

1、美学是个体情感作用于审美物体获得的一种主观感受,美学研究的内容是个体对于物体或现象的情感领域反应,审美价值基于感官层面的辨别领域,同时审美判断是超越感官的。审美判断往往和喜厌情感相关,而情感受一定文化制约、审美背景制约,使得审美因素过于复杂,总体来讲审美和情感反应相关。如何利用可计算技术来预测人类对视觉刺激产生的情绪反应,使计算机模仿人类的审美过程,从而定量描述美学。这一研究过程称为计算美学,早在20世纪30年代数学家george david birkhoff创造了一种美学测量方式使用顺序和复杂度的比率作为美学量度。之后的工作引入新的相关的属性,例如和信息处理、信息论产生联系,通过验证识别重复、对称等提高美学的科学性。随着深度学习等技术的兴起,越来越多的工作聚焦在自动美学评价,在深度学习中利用大量人工标注的数据来进行训练,使得模型获得人类对于美学评价的能力。

2、在大量的审美领域中,对于图像的审美可以说是应用最广泛并且研究较多的一个领域。本文档来自技高网...

【技术保护点】

1.一种基于语言大模型的可解释性图像美学情感预测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于语言大模型的可解释性图像美学情感预测方法,其特征在于,步骤1包括以下子步骤:

3.如权利要求1所述的基于语言大模型的可解释性图像美学情感预测方法,其特征在于,步骤2中包括以下子步骤:

4.如权利要求1~3任一项所述的基于语言大模型的可解释性图像美学情感预测方法,其特征在于,步骤3具体如下:采用训练集对步骤2构建得到的图像美学可解释模型进行训练,之后将上述训练好的模型进行学习率减小的微调训练;将微调训练之后的图像美学可解释模型的输出文本结果作为最终...

【技术特征摘要】

1.一种基于语言大模型的可解释性图像美学情感预测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于语言大模型的可解释性图像美学情感预测方法,其特征在于,步骤1包括以下子步骤:

3.如权利要求1所述的基于语言大模型的可解释性图像美学情感预测方法,其特征在于,步骤2中包括以下子步骤:

4.如权利要求1~3任一项所述的基于语言大模型的可解释性图像美学情感预测方法,其特征在于,步...

【专利技术属性】
技术研发人员:张晓丹李瑞彭进业胡琦瑶汪霖赵万青王德奎周伟
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1