基于多数据源生成图表的方法、系统、设备及存储介质技术方案

技术编号:29054836 阅读:21 留言:0更新日期:2021-06-26 06:24
本发明专利技术提供了基于多数据源生成图表的方法、系统、设备及存储介质,该方法包括:数据采集,接收第一文本信息集合或非文本信息集合;将非文本信息集合转化为第二文本信息;将第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库;对第三文本信息集合根据文本分析,添加标签,标签至少包括观点类标签和情感类标签;基于标签进行聚合计算;响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板;以及将展示数据导入预设数据图表模板,生成展示图表。本发明专利技术能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。提高了数据统计的准确性。提高了数据统计的准确性。

【技术实现步骤摘要】
基于多数据源生成图表的方法、系统、设备及存储介质


[0001]本专利技术涉及多数据源的信息整合领域,具体地说,涉及基于多数据源生成图表的方法、系统、设备及存储介质。

技术介绍

[0002]信息化是当今时代发展的大趋势,代表着先进的生产力,计算机的诞生推动了一次“信息革命”,而随着计算机软硬件的发展,人类可能会爆发第二次第三次“信息革命”;而在信息化的背后,离不开的就是数据,古人结绳记事是数据,而现在不管你做什么,无时无刻都在生产数据,上班乘坐交通、打卡、使用手机或电脑,在这个信息爆炸的时代,怎么使用数据,就成为关键。
[0003]用户对平台的反馈不再仅限于文本,很多用户习惯于使用语音、图片(表情包)等来回复,这加大了数据聚类、合并的难度,难以准确评价客服的服务表现。
[0004]因此,本专利技术提供了一种基于多数据源生成图表的方法、系统、设备及存储介质。

技术实现思路

[0005]针对现有技术中的问题,本专利技术的目的在于提供基于多数据源生成图表的方法、系统、设备及存储介质,克服了现有技术的困难,能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。
[0006]本专利技术的实施例提供一种基于多数据源生成图表的方法,包括以下步骤:
[0007]S110、数据采集,接收第一文本信息集合或非文本信息集合;
[0008]S120、将所述非文本信息集合转化为第二文本信息;
[0009]S130、将所述第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库;
[0010]S140、对所述第三文本信息集合根据文本分析,添加标签,所述标签至少包括观点类标签和情感类标签;
[0011]S150、基于所述标签进行聚合计算;
[0012]S160、响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板;以及
[0013]S170、将所述展示数据导入所述预设数据图表模板,生成展示图表。
[0014]优选地,所述步骤S110中,包括通过数据直连或者数据代理接收第一文本信息集合或非文本信息集合。
[0015]优选地,所述步骤S110中,包括通过SAAS端口接收第一文本信息集合或非文本信息集合,并同步到所述数据仓库;或者,通过数据适配器接收第一文本信息集合或非文本信息集合。
[0016]优选地,所述步骤S120中,所述非文本信息集合包括图片信息和音频信息,通过ORC图文识别自所述图片信息中获取第四文本信息,通过语音识别自所述音频信息获取第
五文本信息,合并所述第四文本信息和第五文本信息为第二文本信息。
[0017]优选地,所述步骤S150中,通过分析所述第三文本信息集合的标签,获得所述第三文本信息中包含的维度信息和度量信息,根据所述维度信息和度量信息进行聚合计算。
[0018]优选地,所述步骤S160中,根据所述查询维度集合中的查询维度来自所述数据仓库中采集展示数据,并根据所述维度信息、所述度量信息来匹配预设数据图表模板。
[0019]优选地,所述步骤S110中,所述第一文本信息集合为用户反馈的文本类服务评价,所述非文本信息集合为用户反馈的非文本信类服务评价;
[0020]所述步骤S170中,还包括通过每个客服获得的第三文本信息集合的标签进行聚合计算,并对所述客服的服务好评度进行排序。
[0021]本专利技术的实施例还提供一种基于多数据源生成图表的系统,用于实现上述的基于多数据源生成图表的方法,所述基于多数据源生成图表的系统包括:
[0022]数据采集模块,接收第一文本信息集合或非文本信息集合;
[0023]信息转化模块,将所述非文本信息集合转化为第二文本信息;
[0024]信息合并模块,将所述第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库;
[0025]文本分析模块,对所述第三文本信息集合根据文本分析,添加标签,所述标签至少包括观点类标签和情感类标签;
[0026]聚合计算模块,基于所述标签进行聚合计算;
[0027]模板匹配模块,响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板;以及
[0028]展示图表模块,将所述展示数据导入所述预设数据图表模板,生成展示图表。
[0029]本专利技术的实施例还提供一种基于多数据源生成图表的设备,包括:
[0030]处理器;
[0031]存储器,其中存储有所述处理器的可执行指令;
[0032]其中,所述处理器配置为经由执行所述可执行指令来执行上述基于多数据源生成图表的方法的步骤。
[0033]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于多数据源生成图表的方法的步骤。
[0034]本专利技术的目的在于提供基于多数据源生成图表的方法、系统、设备及存储介质,能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。
附图说明
[0035]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。
[0036]图1是本专利技术的基于多数据源生成图表的方法的流程图。
[0037]图2是本专利技术的基于多数据源生成图表的方法中数据采集的流程图。
[0038]图3是本专利技术的基于多数据源生成图表的方法数据分析的流程图。
[0039]图4是本专利技术的基于多数据源生成图表的方法图表呈现的流程图。
[0040]图5是本专利技术的基于多数据源生成图表的系统的模块示意图。
[0041]图6是本专利技术的基于多数据源生成图表的设备的结构示意图。以及
[0042]图7是本专利技术一实施例的计算机可读存储介质的结构示意图。
具体实施方式
[0043]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本专利技术将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
[0044]图1是本专利技术的基于多数据源生成图表的方法的流程图。如图1所示,本专利技术的实施例提供的一种基于多数据源生成图表的方法,包括以下步骤:
[0045]S110、数据采集,接收第一文本信息集合或非文本信息集合。
[0046]S120、将非文本信息集合转化为第二文本信息。
[0047]S130、将第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库。
[0048]S140、对第三文本信息集合根据文本分析,添加标签,标签至少包括观点类标签和情感类标签。
[0049]S150、基于标签进行聚合计算。
[0050]S1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多数据源生成图表的方法,其特征在于,包括以下步骤:S110、数据采集,接收第一文本信息集合或非文本信息集合;S120、将所述非文本信息集合转化为第二文本信息;S130、将所述第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库;S140、对所述第三文本信息集合根据文本分析,添加标签,所述标签至少包括观点类标签和情感类标签;S150、基于所述标签进行聚合计算;S160、响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板;以及S170、将所述展示数据导入所述预设数据图表模板,生成展示图表。2.根据权利要求1所述的基于多数据源生成图表的方法,其特征在于:所述步骤S110中,包括通过数据直连或者数据代理接收第一文本信息集合或非文本信息集合。3.根据权利要求2所述的基于多数据源生成图表的方法,其特征在于:所述步骤S110中,包括通过SAAS端口接收第一文本信息集合或非文本信息集合,并同步到所述数据仓库;或者,通过数据适配器接收第一文本信息集合或非文本信息集合。4.根据权利要求1所述的基于多数据源生成图表的方法,其特征在于:所述步骤S120中,所述非文本信息集合包括图片信息和音频信息,通过ORC图文识别自所述图片信息中获取第四文本信息,通过语音识别自所述音频信息获取第五文本信息,合并所述第四文本信息和第五文本信息为第二文本信息。5.根据权利要求1所述的基于多数据源生成图表的方法,其特征在于:所述步骤S150中,通过分析所述第三文本信息集合的标签,获得所述第三文本信息中包含的维度信息和度量信息,根据所述维度信息和度量信息进行聚合计算。6.根据权利要求5所述的基于多数据源生成图表的...

【专利技术属性】
技术研发人员:王长春陈丹陈旭伟郭春雷
申请(专利权)人:上海华客信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1