【技术实现步骤摘要】
基于智能标签的业务分析系统及方法
[0001]本专利技术涉及标签系统,具体地,涉及基于智能标签的业务分析系统及方法。
技术介绍
[0002]推荐系统是利用电子商务网站或者手机App向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。
[0003]推荐系统的目的是联系用户的兴趣和物品,这种联系方式需要依赖不同的媒介。其中一种流行的方法是通过一些特征联系用户和物品,给用户推荐那些具有用户喜欢的特征的物品,这里的特征有不同的表现形式,比如可以表现为物品的属性集合,也可以表现为隐语义向量。我们把这种重要的特征表现形式成为——标签。
[0004]现有的标签推荐系统中,标签的维护和使用分离的。
[0005]标签的维护包括:增加、修改、删除等。一般由业务人提出,由开发人员通过后台开发完成。开发人员通常使用一些基于统计的方法和基于人工智能的方法,运行数据,让后将更新的结果输入到系统。
[0006] ...
【技术保护点】
【技术特征摘要】
1.一种基于智能标签的业务分析系统,其特征在于,包括:模块M1:从外部数据库、大数据平台或数据服务获取原始文本数据,并对原始文本数据进行预处理,获得预处理后的原始文本数据;模块M2:对预处理后的原始文本数据进行ETL处理,得到ETL处理后的数据,并将ETL处理后的数据存储至Hadoop分布式文件系统;模块M3:将ETL处理后的数据通过领域知识库查询所需的实体和字段信息;模块M4:使用领域知识库中所查询的实体信息,根据预设标签,判断是否符合预设匹配规则,当匹配时,则对ETL处理后的数据进行标签;模块M5:使用混合后端和分表方案存储标签数据,通过标签元数据和查询引擎对外提供查询功能。2.根据权利要求1所述的基于智能标签的业务分析系统,其特征在于,所述模块M1包括:模块M1.1:通过消息队列、Socket、HTTP请求、SQL查询和/或RPC请求的形式从外部数据库、大数据平台和/或数据服务获取原始文本数据;模块M1.2:对获取的原始文本数据进行包括清洗、过滤和/或转换预处理,获得预处理后的原始文本数据。3.根据权利要求2所述的基于智能标签的业务分析系统,其特征在于,所述模块M1.2包括对获取的原始文本数据中时间、记录ID和用户ID进行预处理;除时间、记录ID和用户ID外的原始文本数据,根据需要选择原始文本数据进行预处理。4.根据权利要求1所述的基于智能标签的业务分析系统,其特征在于,所述模块M3包括:根据ETL处理后的数据通过领域知识库进行查询,并将查询后的结果和领域知识库中的相关信息进行关联,得到所需的实体和字段信息。5.根据权利要求1所述的基于智能标签的业务分析系统,其特征在于,所述模块M5包括:使用混合后端和分表方案存储标签数据,通过分表的方式存储标签,相同类型的标签分配在同一个表中,通过标签元数据和查询引擎对外提供相应查询。6.一种基于智...
【专利技术属性】
技术研发人员:朱晓峰,蔡晓华,杨光辉,
申请(专利权)人:上海天旦网络科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。