The invention discloses a method and device for generating a chart, which includes: acquiring a request for generating a chart, the request for generating a chart includes the identification of the information to be rendered and the type of the chart to be rendered; acquiring a sequence of target characters corresponding to the identification of the information to be rendered; the sequence of target characters is obtained by parsing the target text, and the sequence of target characters is used to represent the said sequence. The correspondence between the position information of each character sequence in the target table and the cell in which the character sequence is located in the target text; the target chart is generated according to the target character sequence and the type of chart to be rendered. The invention accurately determines the target character sequence used to generate the target chart, and efficiently generates the target chart by utilizing the structured relationship between each character sequence in the target table represented by the target character sequence and the location information of the cell.
【技术实现步骤摘要】
一种图表生成方法及装置
本专利技术涉及数据信息处理
,尤其涉及一种图表生成方法及装置。
技术介绍
一般地,用户想要查看热门领域中某类别的最新数据,是通过在相关的网站或APP的界面上输入相关关键词,进而查看到对应的最新数据;比如,用户想要查看所关注的某企业的财报数据信息,可以通过在相关的网站(比如东方财富网)上输入企业名称,检索进入财务分析类页面,进而查看到对应企业的最新财报数据,比如得到以静态图的形式展示输出的最新财报数据。对于最新数据的获取过程,目前是通过人工或者爬虫监控上市公司,从公告发布的网站(上交所,深交所等)上发现最新的财报发布信息;自动地下载财报内容并人工解析其中的重要数据指标;可见,在数据获取层面虽然辅助了爬虫监控发布的公告,但针对的主要是普通的文本内容;并且,文本的筛选和提取都需要人工参与、效率低耗时长。因此,需要提供一种能够针对性的获取数据信息,并根据得到的数据信息高效地生成对应图表的技术方案。
技术实现思路
为了解决现有技术中的问题,本专利技术提供了一种图表生成方法及装置,具体地:一方面提供了一种图表生成方法,所述方法包括:获取图表生成请求,所述图表生成请求包括待渲染信息标识和待渲染图表类型;获取与所述待渲染信息标识对应的目标字符序列;所述目标字符序列通过解析目标文本而得到,所述目标字符序列用于表征所述目标文本中位于目标表格内的各个字符序列与所述字符序列所在的单元格的位置信息之间的对应关系;根据所述目标字符序列和所述待渲染图表类型生成目标图表。另一方面提供了一种图表生成装置,所述装置包括:请求获取模块,用于获取图表生成请求,所述图表生 ...
【技术保护点】
1.一种图表生成方法,其特征在于,所述方法包括:获取图表生成请求,所述图表生成请求包括待渲染信息标识和待渲染图表类型;获取与所述待渲染信息标识对应的目标字符序列;所述目标字符序列通过解析目标文本而得到,所述目标字符序列用于表征所述目标文本中位于目标表格内的各个字符序列与所述字符序列所在单元格的位置信息之间的对应关系;根据所述目标字符序列和所述待渲染图表类型生成目标图表。
【技术特征摘要】
1.一种图表生成方法,其特征在于,所述方法包括:获取图表生成请求,所述图表生成请求包括待渲染信息标识和待渲染图表类型;获取与所述待渲染信息标识对应的目标字符序列;所述目标字符序列通过解析目标文本而得到,所述目标字符序列用于表征所述目标文本中位于目标表格内的各个字符序列与所述字符序列所在单元格的位置信息之间的对应关系;根据所述目标字符序列和所述待渲染图表类型生成目标图表。2.根据权利要求1所述的图表生成方法,其特征在于,所述解析目标文本,包括:解析所述目标文本得到字符相关参数和表格相关参数;所述字符相关参数包括所述目标文本中的字符序列以及所述字符序列的位置信息,所述目标表格相关参数包括所述目标表格中的单元格以及所述单元格的位置信息;根据所述字符相关参数和表格相关参数确定出第一字符序列;所述第一字符序列用于表征位于所述目标表格的表头单元格内的各个字符序列与所述字符序列所在的表头单元格的位置信息之间的对应关系;根据所述字符相关参数和表格相关参数确定出第二字符序列;所述第二字符序列用于表征位于所述目标表格的非表头单元格内的各个字符序列与所述字符序列所在的非表头单元格的位置信息之间的对应关系;根据所述第一字符序列和第二字符序列得到目标字符序列。3.根据权利要求2所述的图表生成方法,其特征在于,所述解析所述目标文本得到字符相关参数和表格相关参数,包括:确定出所述目标文本中的字符序列在第一坐标系中的第一位置信息以及所述目标表格中的单元格在第一坐标系中的第一位置信息;所述第一坐标系为将所述目标文本所在页面的顶角作为坐标原点的坐标系。4.根据权利要求3所述的图表生成方法,其特征在于,所述方法还包括:获取位置映射关系,所述位置映射关系为所述单元格的第一位置信息和第二位置信息之间的对应关系;所述第二位置信息通过将所述单元格的第一位置信息转换至第二坐标系中而得到;所述第二坐标系为以所述目标表格的顶角作为坐标原点的坐标系;所述根据所述目标字符序列和所述待渲染图表类型生成目标图表,包括:根据所述目标字符序列以及所述位置映射关系,获取字符映射关系;所述字符映射关系为各个字符序列与所述字符序列所在单元格的第二位置信息之间的对应关系;根据所述字符映射关系以及所述待渲染图表类型生成所述目标图表。5.根据权利要求4所述的图表生成方法,其特征在于,所述第一字符序列包括行表头字符序列,所述根据所述字符相关参数和表格相关参数确定出第一字符序列,包括:获取所述目标表格的初始单元格,所述初始单元格为所述第二坐标系的坐标原点所在的单元格;获取第一数据类型和第二数据类型;所述第一数据类型为所述初始单元格所在行的字符序列的数据类型,所述第二数据类型为所述目标表格的中间行的字符序列的数据类型;所述中间行是所述目标表格中除去所述初始单元格所在行的其他行中的任意一行;在所述第一数据类型与第二数据类型不同时,将所述初始单元格所在行的字符序列与预设词组进行匹配;根据匹配结果确定出行表头字符序列,所述行表头字符序列用于表征位于所述目标表格的行表头单元格内...
【专利技术属性】
技术研发人员:程林,刘康,窦晓妍,赵占平,韩振华,李昌,马龙,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。