一种场景分类方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号：40549104 阅读：7 留言：0更新日期：2024-03-05 19:07

本发明专利技术公开了一种场景分类方法、装置、计算机设备及可读存储介质，方法包括：获取待分类图片和场景图片；将待分类图片输入至FCOS算法模型，得到待分类图片中目标物的类别和置信度信息；利用颜色提取方法得到待分类图片的颜色占比信息；将目标物的类别、置信度信息和颜色占比信息输入多层感知机模型进行场景分类，得到每个场景的概率值；利用Swin‑Transformer网络模型分别对场景图片和待分类图片进行特征提取，得到场景图片向量和待分类图片向量；利用余弦相似度函数对待分类图片向量与场景图片向量进行计算，得到相似度；将每个场景的概率值和相似度输入至D‑S证据融合模型进行融合，得到待分类图片的场景类别。本发明专利技术通过该方法提升了图片场景分类的效率和精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理，特别涉及一种场景分类方法、装置、计算机设备及可读存储介质。

技术介绍

1、现有技术中，收集到的图片数据需要进行分类处理，以便更好地理解和分析图片所处的各种场景。传统的分类方法主要包括人工区分法和规则匹配法。

2、人工区分法是依靠人力对图片进行分类，这种方法虽然简单直接，但效率低下，无法处理大规模的数据集。特别是在需要快速响应的场景中，人工区分法就显得力不从心。

3、规则匹配法是一种基于规则的分类方法，通过预设的规则对图片进行逐级匹配，将图片分为多级类别。虽然这种方法在一定程度上提高了分类的精度，但由于规则的设定需要耗费大量时间和精力，且对于复杂多变的场景适应性较差，因此其工作效率和精度仍不能满足大规模数据分类的需求。

技术实现思路

1、本专利技术的目的是提供一种场景分类方法、装置、计算机设备及可读存储介质，旨在解决现有图片分类方法的分类效率低等问题。

2、第一方面，本专利技术实施例提供一种场景分类方法，包括：

3、获取待分类图片和场景图片；

4、将所述待分类图片输入至fcos算法模型，得到所述待分类图片中目标物的类别和置信度信息；

5、利用颜色提取方法得到所述待分类图片的颜色占比信息；

6、将所述目标物的类别、置信度信息和所述颜色占比信息输入多层感知机模型中进行场景分类，得到每个场景的概率值；

7、利用swin-transformer网络模型分别对所述场景图片和所

8、利用余弦相似度函数对所述待分类图片向量与所述场景图片向量进行计算，得到所述场景图片和所述待分类图片之间的相似度；

9、将所述每个场景的概率值和所述相似度输入至d-s证据融合模型进行融合，得到所述待分类图片的场景类别。

10、第二方面，本专利技术实施例提供一种场景分类装置，包括：

11、图片获取单元，用于获取待分类图片和场景图片；

12、类别获取单元，用于将所述待分类图片输入至fcos算法模型，得到所述待分类图片中目标物的类别和置信度信息；

13、提取单元，用于利用颜色提取方法得到所述待分类图片的颜色占比信息；

14、分类单元，用于将所述目标物的类别、置信度信息和所述颜色占比信息输入多层感知机模型中进行场景分类，得到每个场景的概率值；

15、特征提取单元，用于利用swin-transformer网络模型分别对所述场景图片和所述待分类图片进行特征提取，得到场景图片向量和待分类图片向量；

16、计算单元，用于利用余弦相似度函数对所述待分类图片向量与所述场景图片向量进行计算，得到所述场景图片和所述待分类图片之间的相似度；

17、融合单元，用于将所述每个场景的概率值和所述相似度输入至d-s证据融合模型进行融合，得到所述待分类图片的场景类别。

18、第三方面，本专利技术实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的场景分类方法。

19、第四方面，本专利技术实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时实现上述第一方面所述的场景分类方法。

20、本专利技术公开了一种场景分类方法、装置、计算机设备及可读存储介质，方法包括：获取待分类图片和场景图片；将所述待分类图片输入至fcos算法模型，得到所述待分类图片中目标物的类别和置信度信息；利用颜色提取方法得到所述待分类图片的颜色占比信息；将所述目标物的类别、置信度信息和所述颜色占比信息输入多层感知机模型中进行场景分类，得到每个场景的概率值；利用swin-transformer网络模型分别对所述场景图片和所述待分类图片进行特征提取，得到场景图片向量和待分类图片向量；利用余弦相似度函数对所述待分类图片向量与所述场景图片向量进行计算，得到所述场景图片和所述待分类图片之间的相似度；将所述每个场景的概率值和所述相似度输入至d-s证据融合模型进行融合，得到所述待分类图片的场景类别。本专利技术通过将目标物的类别、置信度信息和颜色占比信息输入多层感知机模型中进行场景分类，得到每个场景的概率值（即基于特征信息得到每个场景的概率值），同时利用余弦相似度函数对待分类图片向量与场景图片向量进行计算，得到场景图片和待分类图片之间的相似度（即基于全局信息得到场景图片和待分类图片之间的相似度），接着通过将每个场景的概率值和场景图片和待分类图片之间的相似度融合，从特征信息（也可以说为局部信息）和全局信息两个维度上对待分类图片进行场景分类，实现了对图片的自动分类，提升能够适应复杂多变的场景，极大提升了产品的适应范围，进而提升了分类的效率和准确性。本专利技术实施例同时还提供了一种场景分类装置、一种计算机可读存储介质和一种计算机设备，具有上述有益效果，在此不再赘述。

本文档来自技高网...

【技术保护点】

1.一种场景分类方法，其特征在于，包括：

2.根据权利要求1所述的场景分类方法，其特征在于，所述FCOS算法模型的训练过程包括：

3.根据权利要求2所述的场景分类方法，其特征在于，所述第一损失函数为：

4.根据权利要求1所述的场景分类方法，其特征在于，所述利用颜色提取方法得到所述待分类图片的颜色占比信息包括：

5.根据权利要求2所述的场景分类方法，其特征在于，所述多层感知机模型的训练过程包括：

6.根据权利要求1所述的场景分类方法，其特征在于，所述Swin-Transformer网络模型进行特征提取的过程包括：

7.根据权利要求1所述的场景分类方法，其特征在于，所述将所述每个场景的概率值和所述相似度输入至D-S证据融合模型进行融合，得到所述待分类图片的场景类别包括：

8.一种场景分类装置，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的场景分类方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的场景分类方法。

...

【技术特征摘要】

1.一种场景分类方法，其特征在于，包括：

2.根据权利要求1所述的场景分类方法，其特征在于，所述fcos算法模型的训练过程包括：

3.根据权利要求2所述的场景分类方法，其特征在于，所述第一损失函数为：

4.根据权利要求1所述的场景分类方法，其特征在于，所述利用颜色提取方法得到所述待分类图片的颜色占比信息包括：

5.根据权利要求2所述的场景分类方法，其特征在于，所述多层感知机模型的训练过程包括：

6.根据权利要求1所述的场景分类方法，其特征在于，所述swin-transformer网络模型进行特征提取的过程包括：

7...

【专利技术属性】
技术研发人员：吕勤学，
申请(专利权)人：深圳市万物云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人