一种图表的描述文本生成方法、装置、设备及介质制造方法及图纸

技术编号:40422717 阅读:17 留言:0更新日期:2024-02-20 22:42
本申请涉及数据处理技术领域,尤其涉及一种图表的描述文本生成方法、装置、设备及介质。获取待描述图表,及待描述图表中记录的数据,并将预设提示文本和该数据进行拼接,得到目标文本,将待描述图表对应的目标统计图输入到图像编码器中,得到第一图像特征向量,将第一图像特征向量和目标文本输入到大语言模型中,大语言模型的编码模块对目标文本进行编码,得到文本特征向量,并将第一图像特征向量和文本特征向量进行拼接,得到目标特征向量,从而使大语言模型的解码器对综合了第一图像特征向量和文本特征向量的目标特征向量进行处理,得到待描述图表对应的描述文本,提高了生成的描述文本的准确率。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种图表的描述文本生成方法、装置、设备及介质


技术介绍

1、图表描述是指根据给定的统计图或者数据表格生成简洁和准确的描述文本,以说明统计图或者数据表格中的主要信息和趋势,推测数据变化的背后原因,使人们更快速和方便地理解图表的含义。

2、相关技术在生成统计图对应的描述文本时,首先对统计图进行图像特征提取,得到统计图对应的图像特征向量,再使用文本生成模型对该图像特征向量进行处理,得到统计图对应的描述文本。但是图像特征提取可能存在不精确、信息丢失、模型幻觉或者噪声干扰的问题,并且文本生成模型可能无法合理的根据图像特征向量生成文本。

3、相关技术在生成数据表格对应的文字描述时,一般利用大语言模型(largelanguage model,llm)强大的自然语言理解和生成能力,提取出数据表格中的主要信息和关系,生成流畅和准确的文本摘要。但是,大语言模型无法直接对数据表格进行处理,需要先将数据表格转换成文本,再将转换得到的文本输入到大语言模型中进行处理。也就是说,相关技术中为了生成数据表格的描述文本,需要设计一种合理本文档来自技高网...

【技术保护点】

1.一种图表的描述文本生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述待描述图表中记录的数据之后,所述将预设提示文本和所述数据进行拼接,得到目标文本之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述待描述图表对应的目标统计图的确定过程包括:

4.根据权利要求1所述的方法,其特征在于,所述待描述图表对应的目标统计图的确定过程包括:

5.根据权利要求1所述的方法,其特征在于,所述得到第一图像特征向量之后,所述将所述第一图像特征向量和所述目标文本输入到大语言模型中之前,所述方法还包括...

【技术特征摘要】

1.一种图表的描述文本生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述待描述图表中记录的数据之后,所述将预设提示文本和所述数据进行拼接,得到目标文本之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述待描述图表对应的目标统计图的确定过程包括:

4.根据权利要求1所述的方法,其特征在于,所述待描述图表对应的目标统计图的确定过程包括:

5.根据权利要求1所述的方法,其特征在于,所述得到第一图像特征向量之后,所述将所述第一图像特征向量和所述目标文本输入到大语言模型中之前,所述方法还包括:

6.一...

【专利技术属性】
技术研发人员:侯召祥
申请(专利权)人:新奥新智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1