数据生成方法、装置、设备及存储介质制造方法及图纸

技术编号：40563133 阅读：9 留言：0更新日期：2024-03-05 19:26

本发明专利技术属于计算机技术领域，公开了一种数据生成方法、装置、设备及存储介质。该方法包括：获取待识别数据；对待识别数据进行处理，得到多组待识别子数据；获取各组待识别子数据的特征序列；将多个特征序列输入至目标数据生成模型中，得到目标子序列；根据目标子序列生成目标数据。通过上述方式，对输入数据生成模型中的数据进行处理，得到多组待识别子数据，使得模型对细节部分进行解析，提升了图片内容描述的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，尤其涉及一种数据生成方法、装置、设备及存储介质。

技术介绍

1、图像描述技术是指以图像为输入，通过数学模型和计算使计算机输出对应图像的自然语言描述文字，使计算机拥有“看图说话”的能力。

2、但是目前机器自动生成文本描述方法，往往需要大量标注样本，且存在生成的文本样式单一，图片内容描述不正确的问题。

3、与之对应的，目前根据文本生成图像的方案中存在生成的图像内容不准确、细节不自然、存在错误等问题。

4、上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

1、本专利技术的主要目的在于提供一种数据生成方法、装置、设备及存储介质，旨在解决目前机器自动生成文本描述方法存在生成的文本样式单一，图片内容描述不正确的技术问题。

2、为实现上述目的，本专利技术提供了一种数据生成方法，所述方法包括以下步骤：

3、获取待识别数据；

4、对所述待识别数据进行处理，得到多组待识别子数据；

5、获取各组所述待识别子数据的特征序列；

6、将多个所述特征序列输入至目标数据生成模型中，得到目标子序列；

7、根据所述目标子序列生成目标数据。

8、可选地，所述目标数据生成模型包括解码器和编码器，所述将多个所述特征序列输入至目标数据生成模型中，得到目标子序列，包括：

9、将多个所述特征序列依次输入至所述编码器，得到若干个固定长度的目标特征序列；

10、确定当前位置的第一目标特征序列和前一位置的第二目标特征序列；

11、将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到目标子序列。

12、可选地，所述将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到目标子序列，包括：

13、将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到多个候选特征序列；

14、分别将各个所述候选特征序列与所述第二目标特征序列进行组合，得到多个候选子序列；

15、计算各个所述候选子序列对应的置信度；

16、选择置信度最大的候选子序列作为目标子序列。

17、可选地，所述获取待识别数据之前，所述方法还包括：

18、获取联合对数据，并基于所述联合对数据训练编码器，得到初始编码器参数和融合编码器参数；

19、利用所述初始编码器参数对数据生成模型的编码器进行初始化，并利用所述融合编码器参数对所述数据生成模型的解码器进行初始化，得到初始数据生成模型；

20、根据相匹配的特征信息和标注信息对所述初始数据生成模型进行训练，得到训练好的目标数据生成模型。

21、可选地，所述联合对数据包括图像样本数据和文本样本数据；

22、所述基于所述联合对数据训练编码器，得到初始编码器参数和融合编码器参数，包括：

23、按照预设像素尺寸将所述图像样本数据切分处理为图像块，得到多个图像特征序列；

24、将所述图像特征序列输入至第一编码器，得到第一特征；

25、对所述文本样本数据进行分词处理，得到多个文本特征序列；

26、将所述文本特征序列输入至第二编码器，得到第二特征；

27、将所述第一特征和所述第二特征输入至图文融合编码器；

28、对所述第一编码器、所述第二编码器以及所述图文融合编码器进行联合训练，得到初始编码器参数和融合编码器参数。

29、可选地，所述待识别数据包括图像数据，所述目标数据包括文本数据。

30、可选地，所述对所述待识别数据进行处理，得到多组待识别子数据，包括：

31、按照预设像素尺寸将所述图像数据切分处理为图像块，得到多组待识别子数据。

32、可选地，所述根据所述目标子序列生成目标数据，包括：

33、对所述目标子序列进行翻译，得到对应的文本数据。

34、可选地，所述待识别数据包括文本数据，所述目标数据包括图像数据。

35、可选地，所述对所述待识别数据进行处理，得到多组待识别子数据，包括：

36、将所述文本数据切分处理为词数据，得到多组待识别子数据。

37、可选地，所述根据所述目标子序列生成目标数据，包括：

38、将所述目标子序列输入至图像解码模型，得到图像数据。

39、此外，为实现上述目的，本专利技术还提出一种数据生成装置，所述数据生成装置包括：

40、获取模块，用于获取待识别数据；

41、处理模块，用于对所述待识别数据进行处理，得到多组待识别子数据；

42、所述模块，还用于获取各组所述待识别子数据的特征序列；

43、生成模块，用于将多个所述特征序列输入至目标数据生成模型中，得到目标子序列；

44、所述生成模块，还用于根据所述目标子序列生成目标数据。

45、可选地，所述目标数据生成模型包括解码器和编码器，所述生成模块，还用于将多个所述特征序列依次输入至所述编码器，得到若干个固定长度的目标特征序列，确定当前位置的第一目标特征序列和前一位置的第二目标特征序列，将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到目标子序列。

46、可选地，所述生成模块，还用于将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到多个候选特征序列，分别将各个所述候选特征序列与所述第二目标特征序列进行组合，得到多个候选子序列，计算各个所述候选子序列对应的置信度，选择置信度最大的候选子序列作为目标子序列。

47、可选地，所述装置还包括训练模块；

48、所述训练模块，用于获取联合对数据，并基于所述联合对数据训练编码器，得到初始编码器参数和融合编码器参数；利用所述初始编码器参数对数据生成模型的编码器进行初始化，并利用所述融合编码器参数对所述数据生成模型的解码器进行初始化，得到初始数据生成模型；根据相匹配的特征信息和标注信息对所述初始数据生成模型进行训练，得到训练好的目标数据生成模型。

49、可选地，所述联合对数据包括图像样本数据和文本样本数据；

50、所述训练模块，还用于按照预设像素尺寸将所述图像样本数据切分处理为图像块，得到多个图像特征序列；将所述图像特征序列输入至第一编码器，得到第一特征；对所述文本样本数据进行分词处理，得到多个文本特征序列；将所述文本特征序列输入至第二编码器，得到第二特征；将所述第一特征和所述第二特征输入至图文融合编码器；对所述第一编码器、所述第二编码器以及所述图文融合编码器进行联合训练，得到初始编码器参数和融合编码器参数。

51、可选地，所述待识别数据包括图像数据，所述目标数据包括文本数据。

52、可选地，所述处理模块，还用于按照预设像素尺寸将所述图像数据本文档来自技高网...

【技术保护点】

1.一种数据生成方法，其特征在于，所述数据生成方法包括：

2.如权利要求1所述的数据生成方法，其特征在于，所述目标数据生成模型包括解码器和编码器，所述将多个所述特征序列输入至目标数据生成模型中，得到目标子序列，包括：

3.如权利要求2所述的数据生成方法，其特征在于，所述将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到目标子序列，包括：

4.如权利要求1所述的数据生成方法，其特征在于，所述获取待识别数据之前，所述方法还包括：

5.如权利要求4所述的数据生成方法，其特征在于，所述联合对数据包括图像样本数据和文本样本数据；

6.如权利要求1-3中任一项所述的数据生成方法，其特征在于，所述待识别数据包括图像数据，所述目标数据包括文本数据。

7.如权利要求6所述的数据生成方法，其特征在于，所述对所述待识别数据进行处理，得到多组待识别子数据，包括：

8.一种数据生成装置，其特征在于，所述数据生成装置包括：

9.一种数据生成设备，其特征在于，所述设备包括：存储器、处理器及存储在所述

10.一种存储介质，其特征在于，所述存储介质上存储有数据生成程序，所述数据生成程序被处理器执行时实现如权利要求1至7中任一项所述的数据生成方法。

...

【技术特征摘要】

1.一种数据生成方法，其特征在于，所述数据生成方法包括：

3.如权利要求2所述的数据生成方法，其特征在于，所述将所述第一目标特征序列和所述第二目标特征序列输入至所述解码器，得到目标子序列，包括：

4.如权利要求1所述的数据生成方法，其特征在于，所述获取待识别数据之前，所述方法还包括：

5.如权利要求4所述的数据生成方法，其特征在于，所述联合对数据包括图像样本数据和文本样本数据；

6.如权利要求1-3中任一项所述...

【专利技术属性】
技术研发人员：邬晓宇，
申请(专利权)人：三六零科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人