【技术实现步骤摘要】
一种基于基因标签的推荐系统的推荐方法
[0001]本专利技术涉及一种基于基因标签的推荐系统的推荐方法,属于基因算法方法领域。
技术介绍
[0002]基于基因的推荐系统需要足够多的基因位点数据、表型数据以及用户的行为数据的支持,并且还需要对产品和内容数据进行解析提炼以达到和基因相关联,目前市面上未见有此相关功能的系统及产品,大多是缺少基因位点数据,和缺少打通基因到用户到产品到内容的链路。
技术实现思路
[0003]针对上述问题,本专利技术要解决的技术问题是提供的一种基于基因标签的推荐系统的推荐方法。
[0004]本专利技术提供如下技术方案:一种基于基因标签的推荐系统的推荐方法包含以下步骤:步骤一、收集用户基因位点数据、表型数据和行为数据将数据进行清洗建模保存到hdfs;
[0005]步骤二、根据提供的规则将基因位点数据、表型数据、行为数据进行计算转换为可用的用户基因标签数据;
[0006]步骤三、收集产品和内容数据进行提炼,提取观点和成分内容,进行标签化和用户的基因标签进行相关联;
[0007]步骤四、将数据处理成适合的后端查询的结构推送到ElasticSearch,用于快速检索;
[0008]步骤五、通过特定的条件在基因标签上圈出指定人群,并进行推送相关内容以及产品。
[0009]进一步优选,所述步骤一中的基因位点数据收集过程为:使用Python和Shell边写到脚本从基因原始数据FTP上将基因原始数据下载简单处理后并上传到HDFS,然后使用Hive建立 ...
【技术保护点】
【技术特征摘要】
1.一种基于基因标签的推荐系统的推荐方法,其特征在于:具体方法包含以下步骤:步骤一、收集用户基因位点数据、表型数据和行为数据将数据进行清洗建模保存到hdfs;步骤二、根据提供的规则将基因位点数据、表型数据、行为数据进行计算转换为可用的用户基因标签数据;步骤三、收集产品和内容数据进行提炼,提取观点和成分内容,进行标签化和用户的基因标签进行相关联;步骤四、将数据处理成适合的后端查询的结构推送到ElasticSearch,用于快速检索;步骤五、通过特定的条件在基因标签上圈出指定人群,并进行推送相关内容以及产品。2.根据权利要求1所述的一种基于基因标签的推荐系统的推荐方法,其特征在于:所述步骤一中的基因位点数据收集过程为:使用Python和Shell边写到脚本从基因原始数据FTP上将基因原始数据下载简单处理后并上传到HDFS,然后使用Hive建立ods外部表映射HDFS目录;所述的步骤一中表型数据收集过程为:使用Sqoop将收集的表型数据同步到HDFS并建立Hive ods表;所述步骤一中的行...
【专利技术属性】
技术研发人员:吴健,王彪,王强,陈伦,柏鹤,王古群,石安森,
申请(专利权)人:上海解兮生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。