表单信息生成方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:38461817 阅读:9 留言:0更新日期:2023-08-11 14:38
本公开的实施例公开了表单信息生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:接收与目标网站对应的表单批数据组集;确定表单批数据组集对应的集中填报日期;对表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集;对表单对象信息组集中的各个表单对象信息组进行识别处理,得到关联属性信息集;基于表单对象信息组集和关联属性信息集,生成表单填报模板信息集;基于目标网站对应的区域标识、表单填报模板信息集和集中填报日期,生成表单信息。该实施方式可以减少计算资源的浪费。实施方式可以减少计算资源的浪费。实施方式可以减少计算资源的浪费。

【技术实现步骤摘要】
表单信息生成方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及表单信息生成方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]表单信息生成方法,对填报表单具有重要意义。目前,在生成表单信息时,通常采用的方式为:首先,获取客户端的待填报的表单数据。然后,服务器端对表单数据进行预处理、解析,以及绑定属性数据,由此生成表单信息。
[0003]然而,专利技术人发现,当采用上述方式生成表单信息时,经常会存在如下技术问题:第一,同一数据源通常关联有多个待填报表单,且各个表单间存在较多冗余数据,若针对每个表单对应的数据分别进行解析和绑定属性数据,则需要额外耗费大量计算资源处理冗余数据,从而,导致计算资源浪费;第二,表单数据的预处理需要占用较多计算资源,若大量表单数据汇集至服务器端,则容易使得服务器端计算压力过大,从而,导致难以及时生成表单信息;第三,在表单提报发生异常时,若对最新收集的表单数据通过上述方式生成表单信息,则耗时较长,难以及时填报表单,降低了表单填报效率;第四,服务器端的地址通常是唯一的,若直接提交上述表单信息,则提交次数较多时,容易导致表单提交请求被目标终端拒绝连接,或者由于目标终端设置了通过前端脚本校验用户的真实性,也会导致表单提交请求被目标终端拒绝连接,从而,降低了表单填报效率。
[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
专利
技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0006]本公开的一些实施例提出了表单信息生成方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0007]第一方面,本公开的一些实施例提供了一种表单信息生成方法,该方法包括:接收与目标网站对应的表单批数据组集,其中,上述表单批数据组集中的每个表单批数据组是对应同一表单的各个字段的数据集合;确定上述表单批数据组集对应的集中填报日期;对上述表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集,其中,上述表单对象信息组集中的每个表单对象信息组是语义相同的各个字段对应的表单对象信息的集合;对上述表单对象信息组集中的各个表单对象信息组进行识别处理,得到关联属性信息集;基于上述表单对象信息组集和上述关联属性信息集,生成表单填报模板信息集,
其中,上述表单填报模板信息集中的每个表单填报模板信息表征表单填报模板,表单填报模板是由对应同一表单的、绑定有属性值来源的、各个字段组成的;基于上述目标网站对应的区域标识、上述表单填报模板信息集和上述集中填报日期,生成表单信息。
[0008]第二方面,本公开的一些实施例提供了一种表单信息生成装置,装置包括:接收单元,被配置成接收与目标网站对应的表单批数据组集,其中,上述表单批数据组集中的每个表单批数据组是对应同一表单的各个字段的数据集合;确定单元,被配置成确定上述表单批数据组集对应的集中填报日期;聚类处理单元,被配置成对上述表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集,其中,上述表单对象信息组集中的每个表单对象信息组是语义相同的各个字段对应的表单对象信息的集合;识别处理单元,被配置成对上述表单对象信息组集中的各个表单对象信息组进行识别处理,得到关联属性信息集;第一生成单元,被配置成基于上述表单对象信息组集和上述关联属性信息集,生成表单填报模板信息集,其中,上述表单填报模板信息集中的每个表单填报模板信息表征表单填报模板,表单填报模板是由对应同一表单的、绑定有属性值来源的、各个字段组成的;第二生成单元,被配置成基于上述目标网站对应的区域标识、上述表单填报模板信息集和上述集中填报日期,生成表单信息。
[0009]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0010]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,上述计算机程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0011]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的表单信息生成方法,可以减少计算资源的浪费。具体来说,造成计算资源浪费的原因在于:同一数据源通常关联有多个待填报表单,且各个表单间存在较多冗余数据,若针对每个表单对应的数据分别进行解析和绑定属性数据,则不得不额外耗费大量计算资源处理冗余数据,从而,导致计算资源浪费。基于此,本公开的一些实施例的表单信息生成方法,首先,接收与目标网站对应的表单批数据组集。其中,上述表单批数据组集中的每个表单批数据组是对应同一表单的各个字段的数据集合。由此,可以得到目标网站关联的多个待提交的表单数据。其次,确定上述表单批数据组集对应的集中填报日期。由此,可以得到填报表单数据的填报时间需求。然后,对上述表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集。其中,上述表单对象信息组集中的每个表单对象信息组是语义相同的各个字段对应的表单对象信息的集合。由此,可以将各个表单中语义相同的字段聚类为一组,便于后续对同一组中、语义相同的各个字段进行统一属性数据绑定处理。之后,对上述表单对象信息组集中的各个表单对象信息组进行识别处理,得到关联属性信息集。由此,可以得到每个语义相同的字段组对应的关联属性字段,便于后续根据关联属性字段,对同一字段组中各字段进行属性数据绑定。接着,基于上述表单对象信息组集和上述关联属性信息集,生成表单填报模板信息集。其中,上述表单填报模板信息集中的每个表单填报模板信息表征表单填报模板。表单填报模板是由对应同一表单的、绑定有属性值来源的、各个字段组成的。由此,可以将关联属性字段对应的、数据源提供的属性数据与表单对象信息对应的字段进行
绑定,并得到表单批数据组集对应的表单填报模板信息集。最后,基于上述目标网站对应的区域标识、上述表单填报模板信息集和上述集中填报日期,生成表单信息。因此,本公开的一些实施例的表单信息生成方法,可以在存在多个待填报表单时,同时对各个表单进行解析和绑定属性数据,而无需额外耗费大量计算资源处理冗余数据。从而,可以减少计算资源的浪费。
附图说明
[0012]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0013]图1是根据本公开的表单信息生成方法的一些实施例的流程图;图2是根据本公开的表单信息生成装置的一些本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表单信息生成方法,包括:接收与目标网站对应的表单批数据组集,其中,所述表单批数据组集中的每个表单批数据组是对应同一表单的各个字段的数据集合;确定所述表单批数据组集对应的集中填报日期;对所述表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集,其中,所述表单对象信息组集中的每个表单对象信息组是语义相同的各个字段对应的表单对象信息的集合;对所述表单对象信息组集中的各个表单对象信息组进行识别处理,得到关联属性信息集;基于所述表单对象信息组集和所述关联属性信息集,生成表单填报模板信息集,其中,所述表单填报模板信息集中的每个表单填报模板信息表征表单填报模板,表单填报模板是由对应同一表单的、绑定有属性值来源的、各个字段组成的;基于所述目标网站对应的区域标识、所述表单填报模板信息集和所述集中填报日期,生成表单信息。2.根据权利要求1所述的方法,其中,所述方法还包括:将预设的表单自动填报开启信息发送至目标客户端以供确认;响应于接收到自动填报确认信息,将所述表单信息发送至所述目标客户端以供定期填报表单。3.根据权利要求1所述的方法,其中,所述对所述表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集,包括:对所述表单批数据组集中的各个表单批数据进行特征提取,得到表单数据向量集;对所述表单数据向量集中的各个表单数据向量进行关联分析,得到表单数据关联分值集;基于所述表单数据关联分值集,确定所述表单批数据组集中的各个表单批数据对应的目标关联矩阵;基于所述目标关联矩阵,对所述表单批数据组集中的各个表单批数据进行聚类处理,得到表单对象信息组集。4.根据权利要求3所述的方法,其中,所述表单批数据组集中的每个表单批数据包括数据属性值组;以及所述对所述表单批数据组集中的各个表单批数据进行特征提取,得到表单数据向量集,包括:对于所述表单批数据组集中的每个表单批数据,执行以下步骤:确定所述表单批数据包括的数据属性值组对应的数据特征向量组;对所述数据特征向量组中的各个数据特征向量进行拼接处理,得到表单数据向量。5.根据权利要求1所述的方法,其中,所述表单批数据组集是通过以下步骤生成的:获取网址信息和网站首页文本信息;对所述网址信息对应的域名字符串进行检测,得到第一检测信息;响应于确定所述第一检测信息满足预...

【专利技术属性】
技术研发人员:张建军冯东王成章牛真王占伟张娟
申请(专利权)人:国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1