System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据分析领域,尤其涉及一种图表生成方法。
技术介绍
1、各机构组织经常会遇到大量的写报告、处理数据、针对文档中的数据进行协作沟通等场景,在这些场景下用户需要将文档中所出现的数据内容进行可视化处理。当用户手动处理大量数据的时候,手动将数据复制粘贴至excel绘制图表十分耗时、繁琐、且容易出错,甚至会出现图表美观性、一致性的问题。人工处理文本数据并生成图表会使员工无法将精力放在更重要的工作中,无法实现机构组织的生产效率最大化。
2、因此,业内经常采用数据分析与可视化工具来解决以上问题,然而业内常用的数据分析工具的主要设计目标是对结构化数据的处理和可视化,而对于非结构化数据的处理能力有限,面对需要深入分析和处理非结构化数据的任务,往往无法较好地实现。
技术实现思路
1、本专利技术提供了一种图表生成方法,能够自动化地实现数据分析与可视化,实现多种类型数据结构的分析和可视化呈现,保证了图表生成的多样性和实时性,提高了图表生成的效率。
2、第一方面,本公开实施例提供了一种图表生成方法,包括:
3、根据前端发送的图表生成请求,从对应的数据库中提取目标文档并进行文本处理,获得待处理数据,其中,所述目标文档为非结构化数据;
4、对所述待处理数据进行语言处理与数据匹配,获得目标图表数据;
5、将所述目标图表数据反馈至前端,以生成可视化的目标图表。
6、进一步的,所述根据前端发送的图表生成请求,从对应的数据库中提取目标
7、根据前端发送的图表生成请求从对应的数据库中查找并提取目标文档;
8、对所述目标文档进行分类,确定所述目标文档的分类结果;
9、根据所述目标文档的分类结果对所述目标文档进行相应的文本处理,获得待处理数据。
10、进一步的,所述根据所述目标文档的分类结果对所述目标文档进行相应的文本处理,获得待处理数据,包括:
11、针对不同类型的目标文档,分别采用对应的文本分析器对所述目标文档进行文本分析,获得文本分析结果;
12、根据所述文本分析结果进行数据筛选,获得满足数据筛选条件的待处理数据。
13、进一步的,所述针对不同类型的目标文档,分别采用对应的文本分析器对所述目标文档进行文本分析,获得文本分析结果,包括:
14、针对不同类型的目标文档,分别采用对应的分页器对所述目标文档进行文本分页,获得分页文本分析结果;
15、针对不同类型的目标文档,分别采用对应的分段器对所述目标文档进行文本分段,获得分段文本分析结果。
16、进一步的,所述对所述目标文档进行文本分段,获得分段文本分析结果,包括:
17、对所述目标文档进行段落截取,获得各待处理段落;
18、对所述待处理段落进行数量词提取,获得数量词提取结果;
19、对所述待处理段落进行段落关系抽取,获得关系抽取结果;
20、将所述数量词提取结果和所述关系抽取结果确定为分段文本分析结果。
21、可选的,所述根据所述文本分析结果进行数据筛选,获得满足数据筛选条件的待处理数据,包括:
22、根据所述文本分析结果中的数量词提取结果,判断数量词是否满足预设词数阈值;
23、根据所述文本分析结果中的关系抽取结果,判断段落关系是否满足图表逻辑;
24、将同时满足所述预设词数阈值和所述图表逻辑的待处理段落,确定为满足数据筛选条件的待处理数据。
25、可选的,所述根据所述目标文档的分类结果对所述目标文档进行相应的文本处理,获得待处理数据,包括:
26、根据所述目标文档的分类结果,将所述目标文档输入至对应的文本分析模型中,获得所述文本分析模型输出的待处理数据。
27、可选的,所述对所述待处理数据进行语言处理与数据匹配,获得目标图表数据,包括:
28、根据所述图表生成请求确定对应的非结构化输入模板;
29、根据所述非结构化输入模板对所述待处理数据进行语言处理,获得图表数据;
30、将所述图表数据与所述分页文本分析结果进行数据匹配,获得分页匹配结果;
31、将所述分页匹配结果和所述图表数据确定为目标图表数据。
32、进一步的,所述根据所述非结构化输入模板对所述待处理数据进行语言处理,获得图表数据,包括:
33、将所述待处理数据填充至所述非结构化输入模板中,将填充后的所述非结构化输入模板输入至预先训练完备的语言模型中,获得所述语言模型输出的图表数据。
34、可选的,该方法还包括:
35、根据前端发送的图表生成请求,从对应的数据库中提取目标数据,并确定对应的结构化输入模板,其中,所述目标数据为结构化数据;
36、将所述目标数据填充至所述结构化输入模板,并将填充后的所述结构化输入模板输入至预先训练完备的语言模型中,获得模型输出的目标图表数据;
37、将所述目标图表数据反馈至前端,以生成可视化的目标图表。
38、本专利技术实施例的一种图表生成方法,根据前端发送的图表生成请求,从对应的数据库中提取目标文档并进行文本处理,获得待处理数据,其中,所述目标文档为非结构化数据;对所述待处理数据进行语言处理与数据匹配,获得目标图表数据;将所述目标图表数据反馈至前端,以生成可视化的目标图表。上述技术方案,能够自动化地实现数据分析与可视化,实现多种类型数据结构的分析和可视化呈现,保证了图表生成的多样性和实时性,提高了图表生成的效率。
39、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种图表生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据前端发送的图表生成请求,从对应的数据库中提取目标文档并进行文本处理,获得待处理数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标文档的分类结果对所述目标文档进行相应的文本处理,获得待处理数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述针对不同类型的目标文档,分别采用对应的文本分析器对所述目标文档进行文本分析,获得文本分析结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述目标文档进行文本分段,获得分段文本分析结果,包括:
6.根据权利要求3所述的方法,其特征在于,所述根据所述文本分析结果进行数据筛选,获得满足数据筛选条件的待处理数据,包括:
7.根据权利要求2所述的方法,其特征在于,所述根据所述目标文档的分类结果对所述目标文档进行相应的文本处理,获得待处理数据,包括:
8.根据权利要求4所述的方法,其特征在于,所述对所述待处理数据进行语言处理与数据匹配,获得目
9.根据权利要求8所述的方法,其特征在于,所述根据所述非结构化输入模板对所述待处理数据进行语言处理,获得图表数据,包括:
10.根据权利要求1所述的方法,其特征在于,还包括:
...【技术特征摘要】
1.一种图表生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据前端发送的图表生成请求,从对应的数据库中提取目标文档并进行文本处理,获得待处理数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标文档的分类结果对所述目标文档进行相应的文本处理,获得待处理数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述针对不同类型的目标文档,分别采用对应的文本分析器对所述目标文档进行文本分析,获得文本分析结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述目标文档进行文本分段,获得分段文本分析结果,...
【专利技术属性】
技术研发人员:张小宇,王欢,许鹏,
申请(专利权)人:上海爱数信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。