当前位置: 首页 > 专利查询>南京大学专利>正文

一种面向众测任务发布的图文生成方法技术

技术编号:28040725 阅读:50 留言:0更新日期:2021-04-09 23:23
本发明专利技术公开了一种面向众测任务发布的图文生成方法,获取足够多的真实众测场景任务发布中的相关数据,针对不同任务,对数据进行整理和清洗;根据预处理后的结构化任务相关词,使用基于规则和模板的方法生成优质的完整任务文本描述;根据相关的任务方提供的任务描述和相关背景图生成与任务相关的词云图。使用统计得到的相关风格数据集,使用MUNIT网络模型进行无监督训练风格迁移模型。本发明专利技术通过生成相对应的任务发布文本和相关任务图片,在减轻了众测平台管理方的压力同时,能够增加众测平台使用人员的交互并且使相关任务重点内容更突出,提高了浏览和查看任务的效率。

【技术实现步骤摘要】
一种面向众测任务发布的图文生成方法
本专利技术涉及图像和文本生成领域,主要应用于众测中的任务发布技术,具体涉及根据结构化数据生成流畅的任务文本和根据相关任务文本描述生成任务图片。
技术介绍
随着智能设备的普及,众测已成为一种新的变革性平台,可以吸引移动用户通过物理旅行到指定位置来执行时空任务。许多科研工作者研究了各种用于性能优化的众测技术,其中如何更智能和更加交互化的任务生成是现在的一个技术挑战。随着大数据捕捉、管理和处理相关技术和计算机视觉、自然语言处理的快速发展,相关图像文本生成技术日益成熟,在任务发布过程中使用上述技术生成有特色的任务图像与具有可读性和逻辑性的任务描述既是挑战也是可能。随着智能众测平台的普及,人们的日常工作,雇用,研究,制造和营销方式都在悄然发生改变,产生了极大的影响。其中任务分配或工作人员选择是一个重大问题,可能会影响到众测任务的完成质量,更加可视化的同参与到众测中的人们交互与智能的任务发布是一个即新颖又有意义的工作。在计算机视觉和自然语言等领域,深度学习取得了很多优秀成果。从深度学习在计算机视觉应用以来,在视觉领域上产生了很多优秀的碰撞。在物体识别,物体检测,视频分析等视觉传统方向都有着很大的突破,以生成式对抗网络为技术主要路线的图像生成任务产生了许多优秀工作。本专利技术针对众测下的任务发布场景,在任务发布过程中,使用相关的图像生成技术,结合众测相关技术,训练模型,能够得到与任务相关的具有一定特色的任务图片。数据到文本生成技术近年来也取得了一些技术成果,其采用结构化的数据例如一张表格作为输入,生成恰当而流畅的文本作为输出来描述数据。相关的主流方法有基于规则和模板的发法以及基于神经网络的方法,其中基于规则和模板的方法由于可控和逻辑性,依旧是主流的应用方法。但是这类方法也需要人工相关特征工程提取和规则的干预,本专利技术在众测场景中任务发布模块,根据结构化的任务词描述,通过与专家合作或从专家生成的语料中获取知识生成具有逻辑的流畅任务描述。
技术实现思路
专利技术目的:针对众测中的相关任务发布结构化相关词生成流畅且可解释的任务内容描述;针对相关任务描述建立专用的任务图,完成对众测任务的图文生成工作,使众测任务更具可视化和可交互性,本专利技术提供一种面向众测任务发布的图文生成方法,使用结构化的任务数据和相关专家特征语料以及自然语言处理相关技术生成合理的任务文本描述;使用关键词提取以及词云可视化等技术生成相关任务词云图;使用生成式对抗网络和计算机视觉等关键技术进行相关风格的迁移,生成风格任务图。技术方案:为实现上述目的,本专利技术采用的技术方案为:本专利技术相比现有技术,具有以下有益效果:一种面向众测任务发布的图文生成方法,数据采集阶段,获取足够多的真实众测场景任务发布中的相关数据,包括结构化的任务关键字段、任务发布的详细描述、任务发布方提供的相关内容图或是logo图片数据;数据预处理阶段,针对不同任务,对数据进行整理和清洗;生成任务文本描述阶段,根据预处理后的结构化任务相关词,使用基于规则和模板的方法生成优质的完整任务文本描述;生成词云图阶段,根据相关的任务方提供的任务描述和相关背景图如logo图生成与任务相关的词云图。生成相关风格图像阶段,使用统计得到的相关风格数据集,使用MUNIT网络模型进行无监督训练风格迁移模型。具体包括如下步骤:步骤1,数据采集:获取众测场景任务发布中的相关数据,包括结构化的任务关键字段、任务发布的详细描述、任务发布方提供的相关内容图或是logo图片。分别用于结构化的任务发布文本生成以及任务发布图片生成,任务发布图片生成包括词云图和相关任务风格迁移图。步骤2,数据预处理,针对不同任务,对数据进行整理和清洗。步骤3,生成任务文本描述:根据预处理后的结构化任务关键字段,使用基于规则和模板的方法生成优质的完整的任务文本描述:步骤3a),统计结构化任务关键字段,包括任务名称、描述信息、任务类型、任务报酬、截止时间、所需人数。步骤3b),使用专家干预的方式设定相关规则和模板,模板的主要内容包括相关情感词、部分幽默词、连接词序列。根据不同任务确定模板的侧重点。步骤3c),基于输入的结构化任务关键字段使用相关专家规则和模板策略生成若干条文本信息。本环节的重点在于根据不同的任务选择合适的模板,确保在内容介绍恰当的同时能够增加整个文本描述的流畅度。通过对相关任务关键词的提取,确定整个任务描述的总体风格,是否有侧重点,完善整个任务发布的文本输出。步骤4,生成词云图:根据相关的任务方提供的任务描述和相关内容图或是logo图片生成与任务相关的词云图。在生成词云图的基础上增加动态修改方法,可视化调整色彩分布,调整相关词的次数和重要程度,合并不必要的相关词重复,使整个可视化词云图更加简洁与合理:步骤4a),对相关的任务方提供的任务描述进行相关中文分词,设置停用词,并进行词频统计。步骤4b),对任务方提供的相关任务图片或是logo图片进行处理,选择合适的区域作为词云的填充背景模板。步骤4c),使用词云可视化方法,设置相关字体、颜色、显示词数,使用步骤4b)中得到的处理图片作为词云背景,使用步骤4a)中的相关任务描述分词结果作为词云内容。步骤4d),动态调整词云图的生成效果,可视化调整色彩分布,调整相关词的次数和重要程度,合并不必要的相关词重复,使整个可视化词云图更加简洁与合理。步骤5,生成相关风格图像,使用统计得到的相关风格数据集,使用生成式对抗网络中MUNIT网络模型进行无监督训练风格迁移模型。优选的:步骤2中数据预处理方法:步骤2a),针对生成流畅的任务文本描述所需的结构化关键字进行处理。步骤2b),针对词云图生成中需要的文本描述进行相关统计,清洗,去掉不合理部分。步骤2c),对风格迁移图生成中需要的源域图像和目标域图像进行相关处理,目标域图像从油画风格图像、emoji图像以及动漫次元图像数据集中或者是相关爬虫获取。步骤2d),将处理后的数据或者是数据集保存并用于后续任务中。优选的:所述步骤3中结构化任务关键词的数据格式为{'entity,'描述','类型','薪酬','截止时间','需要人员数量','任务数量'}。将结构化任务关键词作为输入到规则模板中生成合适的任务描述。优选的:所述步骤5生成相关风格图像可抽象概括为使用GAN实现在不成对数据集条件下的多模态图像翻译。采用MUNIT网络结构模型,MUNIT网络结构模型架构为auto-encoder+GAN。优选的:MUNIT网络结构模型模块结构如下:步骤5a),Content编码器从输入的图像数据中提取内容代码,使用几个分布卷积层对输入的图像数据进行downsample操作,采取Instance_normalization进行实例标准化,在下采样之后,输入到几个残差块ResidualBlock得到contentcode。步骤5b),Style编码器从输入的图像数据中提取本文档来自技高网
...

【技术保护点】
1.一种面向众测任务发布的图文生成方法,其特征在于,包括如下步骤:/n步骤1,数据采集:获取众测场景任务发布中的相关数据,包括结构化的任务关键字段、任务发布的详细描述、任务发布方提供的相关内容图或是logo图片;分别用于结构化的任务发布文本生成以及任务发布图片生成,任务发布图片生成包括词云图和相关任务风格迁移图;/n步骤2,数据预处理,针对不同任务,对数据进行整理和清洗;/n步骤3,生成任务文本描述:根据预处理后的结构化任务关键字段,使用基于规则和模板的方法生成优质的完整的任务文本描述:/n步骤3a),统计结构化任务关键字段,包括任务名称、描述信息、任务类型、任务报酬、截止时间、所需人数;/n步骤3b),使用专家干预的方式设定相关规则和模板,模板的主要内容包括相关情感词、部分幽默词、连接词序列;根据不同任务确定模板的侧重点;/n步骤3c),基于输入的结构化任务关键字段使用相关专家规则和模板策略生成若干条文本信息;本环节的重点在于根据不同的任务选择合适的模板,确保在内容介绍恰当的同时能够增加整个文本描述的流畅度;通过对相关任务关键词的提取,确定整个任务描述的总体风格,是否有侧重点,完善整个任务发布的文本输出;/n步骤4,生成词云图:根据相关的任务方提供的任务描述和相关内容图或是logo图片生成与任务相关的词云图;在生成词云图的基础上增加动态修改方法,可视化调整色彩分布,调整相关词的次数和重要程度,合并不必要的相关词重复,使整个可视化词云图更加简洁与合理:/n步骤4a),对相关的任务方提供的任务描述进行相关中文分词,设置停用词,并进行词频统计;/n步骤4b),对任务方提供的相关任务图片或是logo图片进行处理,选择合适的区域作为词云的填充背景模板;/n步骤4c),使用词云可视化方法,设置相关字体、颜色、显示词数,使用步骤4b)中得到的处理图片作为词云背景,使用步骤4a)中的相关任务描述分词结果作为词云内容;/n步骤4d),动态调整词云图的生成效果,可视化调整色彩分布,调整相关词的次数和重要程度,合并不必要的相关词重复,使整个可视化词云图更加简洁与合理;/n步骤5,生成相关风格图像,使用统计得到的相关风格数据集,使用生成式对抗网络中MUNIT网络模型进行无监督训练风格迁移模型。/n...

【技术特征摘要】
1.一种面向众测任务发布的图文生成方法,其特征在于,包括如下步骤:
步骤1,数据采集:获取众测场景任务发布中的相关数据,包括结构化的任务关键字段、任务发布的详细描述、任务发布方提供的相关内容图或是logo图片;分别用于结构化的任务发布文本生成以及任务发布图片生成,任务发布图片生成包括词云图和相关任务风格迁移图;
步骤2,数据预处理,针对不同任务,对数据进行整理和清洗;
步骤3,生成任务文本描述:根据预处理后的结构化任务关键字段,使用基于规则和模板的方法生成优质的完整的任务文本描述:
步骤3a),统计结构化任务关键字段,包括任务名称、描述信息、任务类型、任务报酬、截止时间、所需人数;
步骤3b),使用专家干预的方式设定相关规则和模板,模板的主要内容包括相关情感词、部分幽默词、连接词序列;根据不同任务确定模板的侧重点;
步骤3c),基于输入的结构化任务关键字段使用相关专家规则和模板策略生成若干条文本信息;本环节的重点在于根据不同的任务选择合适的模板,确保在内容介绍恰当的同时能够增加整个文本描述的流畅度;通过对相关任务关键词的提取,确定整个任务描述的总体风格,是否有侧重点,完善整个任务发布的文本输出;
步骤4,生成词云图:根据相关的任务方提供的任务描述和相关内容图或是logo图片生成与任务相关的词云图;在生成词云图的基础上增加动态修改方法,可视化调整色彩分布,调整相关词的次数和重要程度,合并不必要的相关词重复,使整个可视化词云图更加简洁与合理:
步骤4a),对相关的任务方提供的任务描述进行相关中文分词,设置停用词,并进行词频统计;
步骤4b),对任务方提供的相关任务图片或是logo图片进行处理,选择合适的区域作为词云的填充背景模板;
步骤4c),使用词云可视化方法,设置相关字体、颜色、显示词数,使用步骤4b)中得到的处理图片作为词云背景,使用步骤4a)中的相关任务描述分词结果作为词云内容;
步骤4d),动态调整词云图的生成效果,可视化调整色彩分布,调整相关词的次数和重要程度,合并不必要的相关词重复,使整个可视化词云图更加简洁与合理;
步骤5,生成相关风格图像,使用统计得到的相关风格数据集,使用生成式对抗网络中MUNIT网络模型进行无监督训练风格迁移模型。


2.根据权利要求1所述面向众测任务发布的图文生成方法,其特征在于:步骤2中数据预处理方法:
步骤2a),针对生成流畅的任务文本描述所需的结构化关键字进行处理;
步骤2b),针对词云图生成中需要的文本描述进行相关统计,清洗,去掉不合理部分;
步骤2c),对风格迁移图生成...

【专利技术属性】
技术研发人员:张雷崔风丽姚懿容程浩王崇骏
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1