一种包装设计语言模型的训练方法、装置、介质及设备制造方法及图纸

技术编号：38392147 阅读：9 留言：0更新日期：2023-08-05 17:45

本发明专利技术涉及一种包装设计语言模型的训练方法、装置、设备及介质，属于包装设计技术领域，本发明专利技术技术方案主要包括：获取包装设计用语数据和预训练语言模型；对所述包装设计用语数据进行分词处理，以提取所述包装设计用语数据中的关键词、短语或者行业术语；将所述关键词、短语和行业术语进行去重之后加入所述预训练语言模型的词汇表中；获取自定义包装设计数据集；根据设定的损失函数和优化器，基于所述自定义包装设计数据集对所述预训练语言模型进行微调，以更新所述预训练语言模型的网络权重和所述词汇表中词汇对应的词向量，获得所述包装语言模型。包装语言模型。包装语言模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种包装设计语言模型的训练方法、装置、介质及设备

[0001]本专利技术属于包装设计
，具体而言涉及一种包装设计语言模型的训练方法、装置、介质及设备。

技术介绍

[0002]随着市场竞争的加剧，各种产品的包装设计越来越受到企业和消费者的重视。
[0003]传统的包装设计方法耗时、耗费人力物力，且设计师与客户沟通存在误解，导致设计效果与客户需求存在一定的差距。因此，能够提高设计效率并满足客户需求，具有重要的现实意义。
[0004]本专利技术的目的在于解决对于用户包装设计需求的信息理解问题。

技术实现思路

[0005]鉴于上述的分析，本专利技术实施例旨在提供一种包装设计语言模型的训练方法、装置、设备及介质，用以解决现有技术中用户包装设计需求的信息理解的问题。
[0006]本专利技术第一方面实施例提供一种包装设计语言模型的训练方法，包括以下步骤：获取包装设计用语数据和预训练语言模型；对所述包装设计用语数据进行分词处理，以提取所述包装设计用语数据中的关键词、短语或者行业术语；将所述关键词、短语和行业术语进行去重之后加入所述预训练语言模型的词汇表中；获取自定义包装设计数据集；根据设定的损失函数和优化器，基于所述自定义包装设计数据集对所述预训练语言模型进行微调，以更新所述预训练语言模型的网络权重和所述词汇表中词汇对应的词向量，获得所述包装语言模型。
[0007]在一些实施例中，在对所述包装设计用语数据进行分词处理之前还包括：对所述包装设计用语数据进行第一预处理，所述第一预处理...

【技术保护点】

【技术特征摘要】
1.一种包装设计语言模型的训练方法，其特征在于，包括：获取包装设计用语数据和预训练语言模型；对所述包装设计用语数据进行分词处理，以提取所述包装设计用语数据中的关键词、短语或者行业术语；将所述关键词、短语和行业术语进行去重之后加入所述预训练语言模型的词汇表中；获取自定义包装设计数据集；根据设定的损失函数和优化器，基于所述自定义包装设计数据集对所述预训练语言模型进行微调，以更新所述预训练语言模型的网络权重和所述词汇表中词汇对应的词向量，获得所述包装语言模型。2.根据权利要求1所述的包装设计语言模型的训练方法，其特征在于：在对所述包装设计用语数据进行分词处理之前还包括：对所述包装设计用语数据进行第一预处理，所述第一预处理包括去除HTML标签和特殊字符、进行数据清洗以及去除停用词。3.根据权利要求1所述的包装设计语言模型的训练方法，其特征在于：所述分词处理包括采用文本处理工具对所述包装设计用语数据进行分词处理以获得分词结果，所述文本处理工具包括jieba分词或者THULAC。4.根据权利要求1所述的包装设计语言模型的训练方法，其特征在于：所述关键词的提取方法包括基于BERT的TextRank或者BERT关键词抽取库从所述分词结果中提取所述关键词，所述BERT关键词抽取库包括Bert
‑
extractive
‑
keywords；所述短语和所述行业术语的提取包括，通过词性标注工具对所述分词结果进行词性分析，通过组合不同词性的词汇提取包含实际意义的短语和行业术语，所述词性标注工具包括jieba词性标注或者LTP。5.根据权利要求1所述的包装设计语言模型的训练方法，其特征在于：所述获取自定义包装设计数据集，包括：对包装设...

【专利技术属性】
技术研发人员：陈彦，郝晓伟，
申请(专利权)人：大家智合北京网络科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人