The invention relates to the technical field of suitability grading for fruit e-commerce producing areas, in particular to a method of suitability grading for fruit e-commerce producing areas based on semantic analysis, which obtains text data of specific fruit varieties on the network, and then uses semantic analysis and text mining technology to analyze and obtain various products of the fruit varieties. Then, by comparing the geographic coordinate distances between the different origins and the core origins in other origins, the distances within the thresholds are determined as the best origins, and the climatic information of the different origins and the core origins in other origins is calculated by comparing the climatic information of the different origins and the core origins. The suitability of the remaining categories of origin and determine the rating. The invention can systematically analyze the different producing areas of specific fruit varieties, obtain the result of suitability rating, help consumers effectively distinguish the varieties from different producing areas, understand the value of the core producing areas, and provide a reference basis for consumers to purchase fruits.
【技术实现步骤摘要】
一种基于语义分析的水果电商产地适宜度评级方法
本专利技术涉及水果电商产地适宜度评级
,更具体地,涉及一种基于语义分析的水果电商产地适宜度评级方法。
技术介绍
目前水果电商市场上的水果品种繁多,其产地相差甚远。不同产地所种植的水果产品,从其产品的质地、口感、形状、大小等各个方面也大相径庭,消费者在电商平台上做出购买决策时,需要获得具有实际意义的参考评价,来帮助消费者进行购买。而目前在电商市面上充斥着大量的水果评级,这些都来源于商家的主观评价,对水果研究的评价内容都较为单一,对购买决策无法提供合理的参考依据。同时作为核心产地标志性的农产品饱受劣币驱逐良币,甚至出现信任危机。尽管造成这种现象的原因很多,但如何做到消费者真真切切能够了解到,同样水果品种因产于核心产地的适宜度高低,而区别于其他产地的品质,是目前所需要解决的评级问题。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于语义分析的水果电商产地适宜度评级方法,能针对具体水果品种的不同产地进行系统分析,得出适宜度评级结果,帮助消费者有效区别不同产地的品种,了解核心产地的价值,为消费者购买水果提供参考依据。为解决上述技术问题,本专利技术采用的技术方案是:提供一种基于语义分析的水果电商产地适宜度评级方法,其特征在于,包括如下步骤:S1.根据水果品种在网络上进行搜索,获取与该水果品种有关的文本数据,以建立原始语料数据库;S2.对原始语料数据库内的数据进行语义分析,以建立地理信息语料数据库;S3.对地理信息语料数据库进行地理属性的文本挖掘,获取与该水果品种有关的产地名,应用主题模型对所有产地名进行 ...
【技术保护点】
1.一种基于语义分析的水果电商产地适宜度评级方法,其特征在于,包括如下步骤:S1.根据水果品种在网络上进行搜索,获取与该水果品种有关的文本数据,以建立原始语料数据库;S2.对原始语料数据库内的数据进行语义分析,以建立地理信息语料数据库;S3.对地理信息语料数据库进行地理属性的文本挖掘,获取与该水果品种有关的产地名,应用主题模型对所有产地名进行分类,以将主题相关联的产地归为一类,得到地理属性数据库;从地理属性数据库中提取出各类产地的关键词,计算各类产地在文本数据中的出现频率,将出现频率最高的这类产地定义为核心产地,将其他类产地定义为其他产地;S4.进行产地适宜度评级,包括如下步骤:S41.在地理信息语料数据库中提取核心产地和其他产地中各类产地的地理经纬度信息及气候信息,根据经纬度信息计算其他产地中各类产地与核心产地两地之间的距离,若两地距离不大于阈值,将该类产地的适宜度评级为优,以完成地理位置评级,若两地距离大于阈值,则进入产地属性适宜度评级;S42.将核心产地的气候信息作为适宜度标准样本,将其他产地中除评级为优外的各类产地的气候信息作为变量,对标准样本和变量进行相似度对比得出该类产地的 ...
【技术特征摘要】
1.一种基于语义分析的水果电商产地适宜度评级方法,其特征在于,包括如下步骤:S1.根据水果品种在网络上进行搜索,获取与该水果品种有关的文本数据,以建立原始语料数据库;S2.对原始语料数据库内的数据进行语义分析,以建立地理信息语料数据库;S3.对地理信息语料数据库进行地理属性的文本挖掘,获取与该水果品种有关的产地名,应用主题模型对所有产地名进行分类,以将主题相关联的产地归为一类,得到地理属性数据库;从地理属性数据库中提取出各类产地的关键词,计算各类产地在文本数据中的出现频率,将出现频率最高的这类产地定义为核心产地,将其他类产地定义为其他产地;S4.进行产地适宜度评级,包括如下步骤:S41.在地理信息语料数据库中提取核心产地和其他产地中各类产地的地理经纬度信息及气候信息,根据经纬度信息计算其他产地中各类产地与核心产地两地之间的距离,若两地距离不大于阈值,将该类产地的适宜度评级为优,以完成地理位置评级,若两地距离大于阈值,则进入产地属性适宜度评级;S42.将核心产地的气候信息作为适宜度标准样本,将其他产地中除评级为优外的各类产地的气候信息作为变量,对标准样本和变量进行相似度对比得出该类产地的气候适宜度结果,以确定剩余类产地的适宜度评级,完成产地属性适宜度评级。2.根据权利要求1所述的一种基于语义分析的水果电商产地适宜度评级方法,其特征在于,气候信息包括温度、降水量及日照信息;步骤S42中,对标准样本和变量进行相似度对比得出该类产地的温度适宜度、降水适宜度及日照时数适宜度结果,并将对比结果加权得出最终分数,获取气候适宜度结果。3.根据权利要求2所述的一种基于语义分析的水果电商产地适宜度评级方法,其特征在于,步骤S42中,其他产地中除评级为优外的各类产地的温度适宜度结果用公式(1)表示:S(T)=[(T-T1)(T2-T)B]/[(T0-T1)(T2-T0)B](1)B=(T2-T0)/(T0-T1)(2)其中,S(T)表示温度为T时...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。