一种基于基因标签的大数据奶粉推荐方法技术

技术编号:27291983 阅读:20 留言:0更新日期:2021-02-06 12:01
本发明专利技术公开了一种基于基因标签的大数据奶粉推荐方法,具体方法包含以下步骤:步骤一、收集奶粉相关数据;步骤二、结合用户自身与奶粉相关标签;步骤三、收集用户的问卷表型数据;步骤四、结合标签数据和表型数据对用户输出符合用户自身状况的相关奶粉。本发明专利技术具备以下优点:拥有数量众多的基因标签数据,覆盖用户身体所需要的各种营养成分;查询速度快,推荐奶粉完美契合用户自身情况;标签数据的持续优化,精准,问卷的持续优化,更精准的定位用户目前的情况。前的情况。前的情况。

【技术实现步骤摘要】
一种基于基因标签的大数据奶粉推荐方法


[0001]本专利技术涉及一种基于基因标签的大数据奶粉推荐方法,属于基因算法方法领域。

技术介绍

[0002]现有技术需要足够多的用户基因标签数据支持,并且需要足够全的奶粉信息。并打通基因各种相关成分标签和奶粉相关成分的数据。

技术实现思路

[0003]针对上述问题,本专利技术要解决的技术问题是提供的一种基于基因标签的大数据奶粉推荐方法。
[0004]本专利技术提供如下技术方案:一种基于基因标签的大数据奶粉推荐方法包含以下步骤:步骤一、收集奶粉相关数据;
[0005]步骤二、结合用户自身与奶粉相关标签;
[0006]步骤三、收集用户的问卷表型数据;
[0007]步骤四、结合标签数据和表型数据对用户输出符合用户自身状况的相关奶粉。
[0008]进一步优选,所述的步骤一的奶粉相关数据包含基因标签数据;用户问卷数据和奶粉原始数据。
[0009]所述的基因标签数据为使用天罡标签系统的基因标签数据;
[0010]所述的用户问卷数据为收集用户页面填写的问卷数据,存入mysql的数据;
[0011]所述的奶粉原始数据为使用python进行收集,整理上传到HDFS的数据。
[0012]进一步优选,所述的步骤二的详细流程为:对奶粉基础数据进行清洗,得到奶粉SKU数据以及奶粉详情数据,根据单一奶粉成分与同类型的其他奶粉进行成分对比计算,得出奶粉的营养成分在同类奶粉中成分占比高低,使用所有奶粉中去重得出的成分列表,对应用户符合成分的基因标签,取出用户与奶粉相关的基因标签,处理用户填写的问卷数据,得到用户当前的状况表型数据。
[0013]进一步优选,所述的步骤三的详细流程为:结合奶粉数据和基因标签数据,使用Spark SQL进行统计,结合用户基因标签和问卷现状表型标签以及用户的年龄,与奶粉成分标签数据、奶粉各项综合数据进行比对,补充用户相对缺失的成分,并计算契合度。
[0014]进一步优选,所述的步骤四的详细流程为:导出数据到搜索引擎:使用elasticSeach-hadoop插件,将用户标签数据和奶粉数据推送到ElasticSearch。
[0015]与现有技术相比,本专利技术的有益效果如下:1.拥有数量众多的基因标签数据,覆盖用户身体所需要的各种营养成分;
[0016]2.查询速度快,推荐奶粉完美契合用户自身情况;
[0017]3.标签数据的持续优化,精准,问卷的持续优化,更精准的定位用户目前的情况。
附图说明:
[0018]图1为本专利技术实施例的具体方法流程图。
具体实施方式
[0019]下面将结合本专利技术实施例及附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]实施例:本申请基因拥有60万用户的基因标签数据,以及1000+奶粉SKU数据。
[0021]一种基于基因标签的大数据奶粉推荐方法技术架构:使用HDFS用作数据存储、Hive用作元数据管理、Spark用于数据分析,Airflow用于流程调度、Redash用于提供数据查询、ElasticSearch用于数据检索、Python用于奶粉数据收集、Java用于后台开发、Vue.js用于前端开发、Mysql用于存储用户问卷数据。
[0022]参照图1所示,本实施例的方法如下所示:数据接入:基因标签数据:使用天罡标签系统的基因标签数据;用户问卷数据:收集用户页面填写的问卷数据,存入mysql,奶粉原始数据:使用python进行收集,整理上传到HDFS;
[0023]数据处理:对奶粉基础数据进行清洗,得到奶粉SKU数据以及奶粉详情数据,根据单一奶粉成分与同类型的其他奶粉进行成分对比计算,得出奶粉的营养成分在同类奶粉中成分占比高低。使用所有奶粉中去重得出的成分列表,对应用户符合成分的基因标签,取出用户与奶粉相关的基因标签。处理用户填写的问卷数据,得到用户当前的状况表型数据。
[0024]结合奶粉数据和基因标签数据:使用Spark SQL进行统计,结合用户基因标签和问卷现状表型标签以及用户的年龄,与奶粉成分标签数据、奶粉各项综合数据进行比对,补充用户相对缺失的成分,并计算契合度。
[0025]导出数据到搜索引擎:使用elasticSeach-hadoop插件,将用户标签数据和奶粉数据推送到ElasticSearch。
[0026]本实施例的具体代码如下:
[0027][0028][0029][0030]尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由所附权利要求及其等同物限定。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基因标签的大数据奶粉推荐方法,其特征在于:具体方法包含以下步骤:步骤一、收集奶粉相关数据;步骤二、结合用户自身与奶粉相关标签;步骤三、收集用户的问卷表型数据;步骤四、结合标签数据和表型数据对用户输出符合用户自身状况的相关奶粉。2.根据权利要求1所述的一种基于基因标签的大数据奶粉推荐方法,其特征在于:所述的步骤一的奶粉相关数据包含基因标签数据;用户问卷数据和奶粉原始数据;所述的基因标签数据为使用天罡标签系统的基因标签数据;所述的用户问卷数据为收集用户页面填写的问卷数据,存入mysql的数据;所述的奶粉原始数据为使用python进行收集,整理上传到HDFS的数据。3.根据权利要求1所述的一种基于基因标签的大数据奶粉推荐方法,其特征在于:所述的步骤二的详细流程为:对奶粉基础数据进行清洗,得到奶粉SKU数据以及奶粉详情数据,根据单一奶粉成分与...

【专利技术属性】
技术研发人员:吴健王彪王强柏鹤王古群
申请(专利权)人:上海解兮生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1