农业数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38016667 阅读:10 留言:0更新日期:2023-06-30 10:42
本发明专利技术提供农业数据处理方法、装置、电子设备及存储介质,涉及信息处理技术领域,方法包括:获取第一农业数据库中的第一待匹配键名的第一描述文本,基于第一描述文本与预设参考数据库中的参考键名对应的参考描述文本确定第一待匹配键名与参考键名之间的第一相似度,获取第二农业数据库中的第二待匹配键名的第二描述文本,基于第二描述文本与参考描述文本确定第二待匹配键名与参考键名之间的第二相似度;基于第一相似度和第二相似度,确定第一待匹配键名和第二待匹配键名之间的目标相似度;当目标相似度达到预设阈值时,为第一待匹配键名和第二待匹配键名设置互通标记。本发明专利技术可以实现不同区域农业数据库中的数据互通,提高数据利用率。高数据利用率。高数据利用率。

【技术实现步骤摘要】
农业数据处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及信息处理
,尤其涉及农业数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]经过多年的发展,农业相关数据量快速增加,数据储存及查询量需求也越来越大,目前已有各区域建立了各自的农业数据库,但是由于各区域数据库中对同一农业概念的命名不同,导致农业数据库之间的信息不能互通,存在数据孤岛,无法实现数据的高效利用。

技术实现思路

[0003]本专利技术提供一种农业数据处理方法、装置、电子设备及存储介质,用以解决现有技术中各区域的农业数据库之间的数据无法互通的缺陷,实现各区域的农业数据库数据互通。
[0004]本专利技术提供一种农业数据处理方法,包括:获取第一农业数据库中的第一待匹配键名的第一描述文本,基于所述第一描述文本与预设参考数据库中的参考键名对应的参考描述文本确定所述第一待匹配键名与所述参考键名之间的第一相似度,获取第二农业数据库中的第二待匹配键名的第二描述文本,基于所述第二描述文本与所述参考描述文本确定所述第二待匹配键名与所述参考键名之间的第二相似度,其中,所述第一描述文本反映所述第一待匹配键名的相关信息,所述第二描述文本反映所述第二待匹配键名的相关信息,所述参考描述文本用于描述所述参考键名对应的农业概念;基于所述第一相似度和所述第二相似度,确定所述第一待匹配键名和所述第二待匹配键名之间的目标相似度;当所述目标相似度达到预设阈值时,为所述第一待匹配键名和所述第二待匹配键名设置互通标记,所述互通标记表示所述第一待匹配键名和所述第二待匹配键名对应的均为所述参考键名对应的农业概念。
[0005]根据本专利技术提供的一种农业数据处理方法,所述获取第一农业数据库中的第一待匹配键名的第一描述文本,包括:基于所述第一待匹配键名在预设的第一内容库中查找所述第一描述文本;所述获取第二农业数据库中的第二待匹配键名的第二描述文本,包括:基于所述第二待匹配键名在预设的第二内容库中查找所述第二描述文本;其中,所述第一内容库与所述第一农业数据库对应的地理区域一致,所述第二内容库与所述第二农业数据库对应的地理区域一致。
[0006]根据本专利技术提供的一种农业数据处理方法,所述基于所述第一相似度和所述第二相似度,确定所述第一待匹配键名和所述第二待匹配键名之间的目标相似度,包括:基于所述第一待匹配键名在所述第一农业数据库中获取对应的生产数据,所述生
产数据包括产量数据和气候数据;基于所述生产数据和所述第二待匹配键名确定第一待匹配键名和第二待匹配键名之间的第三相似度;基于所述第一相似度、所述第二相似度和所述第三相似度确定所述目标相似度。
[0007]根据本专利技术提供的一种农业数据处理方法,所述基于所述生产数据和所述第二待匹配键名确定第一待匹配键名和第二待匹配键名之间的第三相似度,包括:基于所述第二待匹配键名在所述第二农业数据库对应的模型库中确定所述第二待匹配键名对应的已训练的预测模型;将所述气候数据输入至所述预测模型,获取所述预测模型输出的预测数据;基于所述预测数据和所述产量数据获取所述第三相似度;其中,所述预测模型是基于多组训练数据训练完成的,每组训练数据包括样本气候数据以及所述样本气候数据对应的产量数据标签,所述样本气候数据与所述第二待匹配键名相对应。
[0008]根据本专利技术提供的一种农业数据处理方法,所述基于所述第一相似度、所述第二相似度和所述第三相似度确定所述目标相似度,包括:基于所述第一相似度和所述第二相似度确定第四相似度,所述第四相似度反映所述第一相似度和所述第二相似度的相似程度;基于所述第四相似度和所述第三相似度确定所述目标相似度。
[0009]根据本专利技术提供的一种农业数据处理方法,所述参考数据库中包括多个层,每个层中包括多个键名;所述基于所述第一相似度和所述第二相似度,确定所述第一待匹配键名和所述第二待匹配键名之间的目标相似度之后,所述方法还包括:当所述目标相似度未达到所述预设阈值时,在所述参考键名所在的目标层中选择新的键名替换所述参考键名,并重新执行所述获取第一农业数据库中的第一待匹配键名的第一描述文本,基于所述第一描述文本与预设参考数据库中的参考键名对应的参考描述文本确定所述第一待匹配键名与所述参考键名之间的第一相似度,获取第二农业数据库中的第二待匹配键名的第二描述文本,基于所述第二描述文本与所述参考描述文本确定所述第二待匹配键名与所述参考键名之间的第二相似度的步骤,直至所述目标相似度达到所述预设阈值;或者,在遍历所述目标层中所有的键名后,所述目标相似度均未达到所述预设阈值时,则在所述目标层的上一层中选择新的键名作为所述参考键名。
[0010]根据本专利技术提供的一种农业数据处理方法,所述在所述目标层的上一层中选择新的键名作为所述参考键名之后,所述方法还包括:若在将连续三层中的所有键名分别作为所述参考键名时,均不能使得所述目标相似度达到所述预设阈值,则发出提示信息以提示对所述参考数据库中的键名以及对应的描述文本进行检查。
[0011]本专利技术还提供一种农业数据处理装置,包括:第一相似度确定模块,用于获取第一农业数据库中的第一待匹配键名的第一描述文本,基于所述第一描述文本与预设参考数据库中的参考键名对应的参考描述文本确定所述第一待匹配键名与所述参考键名之间的第一相似度,获取第二农业数据库中的第二待匹
配键名的第二描述文本,基于所述第二描述文本与所述参考描述文本确定所述第二待匹配键名与所述参考键名之间的第二相似度,其中,所述第一描述文本反映所述第一待匹配键名的相关信息,所述第二描述文本反映所述第二待匹配键名的相关信息,所述参考描述文本用于描述所述参考键名对应的农业概念;第二相似度确定模块,用于基于所述第一相似度和所述第二相似度,确定所述第一待匹配键名和所述第二待匹配键名之间的目标相似度;数据标记模块,用于当所述目标相似度达到预设阈值时,为所述第一待匹配键名和所述第二待匹配键名设置互通标记,所述互通标记表示所述第一待匹配键名和所述第二待匹配键名对应的均为所述参考键名对应的农业概念。
[0012]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述农业数据处理方法。
[0013]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述农业数据处理方法。
[0014]本专利技术提供的农业数据处理方法、装置、电子设备及存储介质,通过分别来自两个农业数据库中的第一待匹配键名和第二待匹配键名分别对应的描述文本与参考数据库中的参考键名的描述文本,确定第一待匹配键名和第二待匹配键名分别与参考数据库中的参考键名之间的第一相似度和第二相似度,基于第一相似度和第二相似度确定第一待匹配键名和第二待匹配键名之间的目标相似度,并在目标相似度达到预设阈值时,为第一待匹配键名和第二待匹配键名设置互通标记,表示二者对应同一农业概念,本专利技术提供的技术方案中,采用一个预先设置的可以用于参考的标准农本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种农业数据处理方法,其特征在于,包括:获取第一农业数据库中的第一待匹配键名的第一描述文本,基于所述第一描述文本与预设参考数据库中的参考键名对应的参考描述文本确定所述第一待匹配键名与所述参考键名之间的第一相似度,获取第二农业数据库中的第二待匹配键名的第二描述文本,基于所述第二描述文本与所述参考描述文本确定所述第二待匹配键名与所述参考键名之间的第二相似度,其中,所述第一描述文本反映所述第一待匹配键名的相关信息,所述第二描述文本反映所述第二待匹配键名的相关信息,所述参考描述文本用于描述所述参考键名对应的农业概念;基于所述第一相似度和所述第二相似度,确定所述第一待匹配键名和所述第二待匹配键名之间的目标相似度;当所述目标相似度达到预设阈值时,为所述第一待匹配键名和所述第二待匹配键名设置互通标记,所述互通标记表示所述第一待匹配键名和所述第二待匹配键名对应的均为所述参考键名对应的农业概念。2.根据权利要求1所述的农业数据处理方法,其特征在于,所述获取第一农业数据库中的第一待匹配键名的第一描述文本,包括:基于所述第一待匹配键名在预设的第一内容库中查找所述第一描述文本;所述获取第二农业数据库中的第二待匹配键名的第二描述文本,包括:基于所述第二待匹配键名在预设的第二内容库中查找所述第二描述文本;其中,所述第一内容库与所述第一农业数据库对应的地理区域一致,所述第二内容库与所述第二农业数据库对应的地理区域一致。3.根据权利要求1所述的农业数据处理方法,其特征在于,所述基于所述第一相似度和所述第二相似度,确定所述第一待匹配键名和所述第二待匹配键名之间的目标相似度,包括:基于所述第一待匹配键名在所述第一农业数据库中获取对应的生产数据,所述生产数据包括产量数据和气候数据;基于所述生产数据和所述第二待匹配键名确定第一待匹配键名和第二待匹配键名之间的第三相似度;基于所述第一相似度、所述第二相似度和所述第三相似度确定所述目标相似度。4.根据权利要求3所述的农业数据处理方法,其特征在于,所述基于所述生产数据和所述第二待匹配键名确定第一待匹配键名和第二待匹配键名之间的第三相似度,包括:基于所述第二待匹配键名在所述第二农业数据库对应的模型库中确定所述第二待匹配键名对应的已训练的预测模型;将所述气候数据输入至所述预测模型,获取所述预测模型输出的预测数据;基于所述预测数据和所述产量数据获取所述第三相似度;其中,所述预测模型是基于多组训练数据训练完成的,每组训练数据包括样本气候数据以及所述样本气候数据对应的产量数据标签,所述样本气候数据与所述第二待匹配键名相对应。5.根据权利要求3所述的农业数据处理方法,其特征在于,所述基于所述第一相似度、所述第二相似度和所述第三相似度确定所述目标相似度,包括:
基于所述第一相似度和所述第二相似度确定第四相似度,所述第四相似度反映所述第一相似度...

【专利技术属性】
技术研发人员:陈飞勇李政道宋杨刘汝鹏肖冰
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1