System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于信息检索技术的设计方案生成方法技术_技高网

基于信息检索技术的设计方案生成方法技术

技术编号:44384098 阅读:9 留言:0更新日期:2025-02-25 09:59
本发明专利技术公开了一种基于信息检索技术的设计方案生成方法,属于信息检索和图文生成领域。收集文本描述以及与文本描述内容匹配的图像,分别进行预处理,并进行特征提取处理,得到提取的视觉特征僧人和语义特征:提取图像类数据中的视觉特征;对与图像匹配的文字描述数据,使用语义分割网络对文字图像进行处理,以识别并分割出文字区域,通过四叉树分配算法取出均匀分布的语义特征点,整合所有区域的语义特征点,形成完整、与包括文字的图像类数据对应的语义特征点集合;使用特征金字塔网络构建多尺度特征图,将提取的视觉特征和语义特征映射到多尺度特征图中的统一的特征空间中,确保在映射过程中保留各自特征的关键信息。

【技术实现步骤摘要】

本专利技术涉及信息检索和图文生成领域,具体涉及一种基于信息检索技术的设计方案生成方法


技术介绍

1、在创意产业中,艺术设计方案优化扮演着至关重要的角色,它不仅关乎作品的创意性与美观度,更是决定作品能否在市场上获得成功的关键因素;然而,传统的艺术设计方案优化方法往往受限于设计师的个人经验和创意水平,难以在短时间内产生高质量的设计方案。

2、因此,寻求一种高效、自动化的艺术设计方案优化方法成为了当前研究的热点。

3、信息检索技术作为计算机科学领域的重要分支,其强大的信息检索和信息处理能力为艺术设计方案优化提供了新的可能性;通过利用信息检索技术,设计师可以从海量的设计资源中快速找到与用户需求相似或相关的设计案例,从而为设计师提供灵感和参考;同时,信息检索技术还可以帮助设计师自动化地评估和优化设计方案,提高设计效率和质量;因此,基于信息检索技术的设计方案生成方法的研究,具有重要的理论和实践意义。


技术实现思路

1、针对现有技术的不足之处,提供一种基于信息检索技术的设计方案生成方法,其整合rag技术以及llm大模型,使得从庞大的设计数据库中快速检索并生成与用户需求高度相关的设计方案成为可能,利用自动化工具快速评估和迭代设计,显著提高了设计的质量和创新速度

2、为实现上述技术目的,本专利技术的基于信息检索技术的艺术设计方案生成方法,步骤如下:

3、步骤1、收集文本描述以及与文本描述内容匹配的图像作为原始方案,并将两者原始方案关联后分别存储为数据库,分别对文本描述数据库以及图像数据库进行预处理,去除文本描述中的非关键词,统一图像的参数;

4、步骤2、对图像预处理数据进行特征提取处理,得到视觉特征和语义特征:使用自然编码器提取图像类数据中的视觉特征;对与图像匹配的文字描述数据,使用语义分割网络对文字图像进行处理,以识别并分割出文字区域,通过四叉树分配算法取出均匀分布的语义特征点,整合所有区域的语义特征点,形成完整、与包括文字的图像类数据对应的语义特征点集合;

5、步骤3、使用特征金字塔网络(fpn)构建多尺度特征图,利用多尺度特征图将不同层次的特征图进行融合,同步捕捉丰富的语义特征和视觉特征上下文信息;利用转换矩阵,将上一步骤提取的视觉特征和语义特征映射到多尺度特征图中的统一的特征空间中,确保在映射过程中保留各自特征的关键信息;使用注意力机制对不同的视觉特征和语义特征进行加权处理,实现视觉特征和语义特征的融合,该融合过程可全面反映原始设计方案的核心视觉和语义属性;基于图像描述生成任务预训练端到端的模型,任务预训练端到端的模型为传统编码器-解码器架构,将融合后的语义特征和视觉特征输入任务预训练端到端的模型中进行优化,得到融合特征,将所有的文字、图像的融合特征构成计材料数据库;

6、步骤4、根据需要,使用搜索引擎从设计材料数据库中获取与需要的融合特征相关的设计材料;通过固定大小分块的方式对设计材料进行分块处理,得到多个分块信息;使用transformers库加载bge v1.5模型,而后采用momentum encoder方法对bge v1.5模型进行微调,将分块信息转换为高维向量,根据预设的聚类数量k,使用k-means聚类量化方法初始化k个聚类中心,将每个高维向量分配到最近的聚类中心,形成k个聚类;采用invertedfile(ivf)复核pq的索引结构组织量化后的高维向量;为每个聚类构建一个倒排列表,得到k个倒排列表,倒排列表中包含该聚类中所有高维向量的标识符;使用折叠树策略优化检索过程;根据嵌入信息与向量数据库中的节点向量的相似度,得到候选集,相似度最高的节点向量为需求设计材料;最后采用上下文丰富方法对需求设计材料进行拓展,得到拓展后设计材料;

7、将所述拓展后设计材料输入至llm语言大模型中,得到初步文字设计方案;初步文字设计方案总结和要点提取,得到语义要点,最后将语义要点输入至现有文生图模型中,得到初步图片设计方案,即需要的图像成品;整合初步文字设计方案和初步图片设计方案,得到初步设计方案;

8、步骤5、根据用户反馈的评述信息,根据评述信息判断是否需要优化初步设计方案,优化初步设计方案过程为根据已搜索得到的材料,返回迭代步骤1-步骤4。

9、进一步,自然编码器包括输入层layer1、隐藏层layer 2、layer 3以及输出层layer 4,输入层用于接收图像类数据,并将其转换为神经网络能理解的形式;隐藏层通过relu非线性激活函数,将输入的图像类数据映射到低微空间;输出层用于将隐藏层的输出与输入层的输入进行比较,通过均方误差函数计算损失,然后,通过反向传播算法,根据损失函数计算出的误差来调整网络中的权重和偏置;重复执行损失计算和反向传播过程,直到达到预定的迭代次数,而后输出视觉特征;

10、通过自然编码器,对输入数据进行变换,以输出期望的视觉特征;第一层有两个神经元x1、x2以及一个截距项c1;第二层有两个神经元y1、y2以及一个截距项c2;第三层是输出,有两个神经元h1和h2;每条线上的数值表示神经元之间连接的权重,损失函数σ选用sigmoi函数;

11、对于包括文字的图像类数据,使用语义分割网络对文字图像进行处理,以识别并分割出文字区域;利用四叉树分配算法对图像进行递归分割,直到达到预设的最小分割单元;在每个四叉树的叶节点区域内,应用自适应提取阈值算法,确定特征点的提取阈值;根据设定的阈值,从每个叶节点区域中提取出均匀分布的语义特征点;整合所有区域的语义特征点,形成完整、与包括文字的图像类数据对应的语义特征点集合;

12、对于纯文字数据,即文本描述,使用自然语言处理技术提取文本描述的文本体征,通过文字描述可为素材搜索过程提供更多的关键信息,整合语义特征点集合和文本特征,得到语义特征。

13、进一步,特征金字塔网络(fpn)的backbone采用resnet,包括一个自底向上的线路,一个自顶向下的线路,两个线路横向连接;自底向上:其实就是网络的前向过程;在前向过程中,按2的整数倍进行选取;feature map的大小在经过某些层后会改变,而在经过其他一些层的时候不会改变,将不改变feature map大小的层归为一个stage,每次抽取的特征都是每个stage的最后一个层输出,这样就能构成特征金字塔;在特征选取网络的backbone都是以2的整数倍进行缩放的;自顶向下:过程中采用上采样(upsampling)进行,这里的上采样是一个2倍的上采样,上采样后便保证了高与宽相同,使用横向可以进行相加融合操作;横向连接则是将上采样的结果和自底向上生成的相同大小的feature map进行融合;在融合之后再采用3*3的卷积核对每个融合结果进行卷积,消除上采样的混叠效应。

14、进一步,使用注意力机制加权不同特征的重要性,实现视觉特征和语义特征的融合,该融合过程可全面反映原始设计方案的核心视觉和语义属性;注意力机制加权流程包括三部分,第一部分为特征提取本文档来自技高网...

【技术保护点】

1.基于信息检索技术的设计方案生成方法,其特征在于,步骤如下:

2.根据权利要求1所述的基于信息检索技术的设计方案生成方法,其特征在于,然编码器包括输入层Layer1、隐藏层Layer 2、Layer 3以及输出层Layer4,输入层用于接收图像类数据,并将其转换为神经网络能理解的形式;隐藏层通过ReLU非线性激活函数,将输入的图像类数据映射到低微空间;输出层用于将隐藏层的输出与输入层的输入进行比较,通过均方误差函数计算损失,然后,通过反向传播算法,根据损失函数计算出的误差来调整网络中的权重和偏置;重复执行损失计算和反向传播过程,直到达到预定的迭代次数,而后输出视觉特征;

3.根据权利要求1所述的基于信息检索技术的设计方案生成方法,其特征在于,特征金字塔网络(FPN)的backbone采用ResNet,包括一个自底向上的线路,一个自顶向下的线路,两个线路横向连接;自底向上:其实就是网络的前向过程;在前向过程中,按2的整数倍进行选取;feature map的大小在经过某些层后会改变,而在经过其他一些层的时候不会改变,将不改变feature map大小的层归为一个stage,每次抽取的特征都是每个stage的最后一个层输出,这样就能构成特征金字塔;在特征选取网络的backbone都是以2的整数倍进行缩放的;自顶向下:过程中采用上采样(upsampling)进行,这里的上采样是一个2倍的上采样,上采样后便保证了高与宽相同,使用横向可以进行相加融合操作;横向连接则是将上采样的结果和自底向上生成的相同大小的feature map进行融合;在融合之后再采用3*3的卷积核对每个融合结果进行卷积,消除上采样的混叠效应。

4.根据权利要求3所述的基于信息检索技术的设计方案生成方法,其特征在于,使用注意力机制加权不同特征的重要性,实现视觉特征和语义特征的融合,该融合过程可全面反映原始设计方案的核心视觉和语义属性;注意力机制加权流程包括三部分,第一部分为特征提取器,首先将视觉特征送入预训练好的CNN中,提取N个栅格化特征X={x 1,x 2,……,xN};第二部分为编码器,将语义特征以及栅格化特征分别送入编码器,得到编码后的特征,编码器由具有跨尺度特征融合自注意力的L层编码层构成;第三部分为解码器,将编码后的特征送入解码器,得到解码后的描述序列,解码器由具有普通自注意力的L层解码层构成;所述解码后的描述序列为融合后的语义特征和视觉特征。

5.根据权利要求1所述的基于信息检索技术的设计方案生成方法,其特征在于,Transformers框架微调的BGE v1.5模型具体为:

6.根据权利要求1所述的基于信息检索技术的设计方案生成方法,其特征在于,采用Inverted File(IVF)复核PQ的索引结构组织量化后的向量;IVF索引将数据点分配到多个“倒排列表”中,每个聚类代表一个视觉词汇,使用聚类中心来表示;即为每个聚类构建一个倒排列表,得到K个倒排列表,列表中包含该聚类中所有向量的标识符;

7.根据权利要求6所述的基于信息检索技术的设计方案生成方法,其特征在于,使用折叠树策略来优化检索过程;

8.根据权利要求6所述的基于信息检索技术的设计方案生成方法,其特征在于:

...

【技术特征摘要】

1.基于信息检索技术的设计方案生成方法,其特征在于,步骤如下:

2.根据权利要求1所述的基于信息检索技术的设计方案生成方法,其特征在于,然编码器包括输入层layer1、隐藏层layer 2、layer 3以及输出层layer4,输入层用于接收图像类数据,并将其转换为神经网络能理解的形式;隐藏层通过relu非线性激活函数,将输入的图像类数据映射到低微空间;输出层用于将隐藏层的输出与输入层的输入进行比较,通过均方误差函数计算损失,然后,通过反向传播算法,根据损失函数计算出的误差来调整网络中的权重和偏置;重复执行损失计算和反向传播过程,直到达到预定的迭代次数,而后输出视觉特征;

3.根据权利要求1所述的基于信息检索技术的设计方案生成方法,其特征在于,特征金字塔网络(fpn)的backbone采用resnet,包括一个自底向上的线路,一个自顶向下的线路,两个线路横向连接;自底向上:其实就是网络的前向过程;在前向过程中,按2的整数倍进行选取;feature map的大小在经过某些层后会改变,而在经过其他一些层的时候不会改变,将不改变feature map大小的层归为一个stage,每次抽取的特征都是每个stage的最后一个层输出,这样就能构成特征金字塔;在特征选取网络的backbone都是以2的整数倍进行缩放的;自顶向下:过程中采用上采样(upsampling)进行,这里的上采样是一个2倍的上采样,上采样后便保证了高与宽相同,使用横向可以进行相加融合操作;横向连接则是将上采样的结果和自底向上生成的相同大小的feature map进行融合;在融合之后再...

【专利技术属性】
技术研发人员:刘一铄吴佳琦吴星辰刘振
申请(专利权)人:江苏建筑职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1