【技术实现步骤摘要】
基于显隐性潜在因子模型的电视产品精准推荐方法及系统
本专利技术涉及推荐
,特别涉及基于显隐性潜在因子模型的电视产品精准推荐方法及系统。
技术介绍
随着互联网的快速发展,信息呈现爆炸增长的趋势,每天都有无数的信息涌入千家万户。此形势下的“三网融合”为传统广播电视媒介的发展带来了机遇,广播电视运营商可以从每个用户的历史信息和实时互动信息来获取有用的信息,但从大量信息中找到用户感兴趣的信息是非常困难的。为了解决这一问题,推荐系统通过分析用户的相关数据,包括个人社会属性、浏览日志等,来挖掘用户的喜爱偏好,从而为用户提供个性化的服务。推荐系统的主要作用有:分析用户行为、筛选有用信息、生成个性化推荐等。基于用户行为分析而得到的推荐系统在各种销售、娱乐、生活平台都大放异彩,对人们的生活模式和质量有很大的影响和提高。如亚马逊、淘宝、网易云音乐、爱奇艺等主流应用,都有着推荐系统的支撑。在传统电视媒体和网络电视领域上,推荐系统发挥着不可替代的作用。在线视频网站公司Netflix在2006年开办的NetflixPrize比赛更是吸引了无数团队投入到推荐系统的研究中,对推荐系统的发展有着非凡的意义。而现如今,推荐系统的性能更是直接关系到公司运营的利益,所以尽管推荐系统已经取得了不俗的进展,并已经广泛应用于各信息化公司和人们的生活之中,但对于推荐系统的准确度却也在不断提出更高的要求。推荐系统中最为关键的就是推荐算法,目前,按照推荐方法可以分为两类:基于内容的推荐算法和协同过滤算法。基于内容的推荐算法是直接分析产品内容,并根据目标用户过去的喜好推荐相似内容的产品,这种推荐算法简 ...
【技术保护点】
1.一种基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,包括以下步骤:步骤1:电视产品正题名通过正则表达式进行处理,综合考虑多种反爬虫机制,设计爬虫策略,对所需的外部数据进行爬取;步骤2:根据电视产品和用户人群的不同特征,分别建立针对电视产品和用户人群的分类模型,通过所述分类模型实现对电视产品信息和用户信息的自动标签标注,得到标注标签后的电视产品信息和标注标签后的用户信息;步骤3:依据标注标签后的电视产品信息和标注标签后的用户信息及爬取的外部数据得出显性潜在因子,所述显性潜在因子包括电视产品显性潜在因子和用户显性潜在因子,通过显性潜在因子得出隐性潜在因子,基于显性潜在因子及隐性潜在因子构建显隐性潜在因子模型;步骤4:基于构建的显隐性潜在因子模型进行电视产品的推荐。
【技术特征摘要】
1.一种基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,包括以下步骤:步骤1:电视产品正题名通过正则表达式进行处理,综合考虑多种反爬虫机制,设计爬虫策略,对所需的外部数据进行爬取;步骤2:根据电视产品和用户人群的不同特征,分别建立针对电视产品和用户人群的分类模型,通过所述分类模型实现对电视产品信息和用户信息的自动标签标注,得到标注标签后的电视产品信息和标注标签后的用户信息;步骤3:依据标注标签后的电视产品信息和标注标签后的用户信息及爬取的外部数据得出显性潜在因子,所述显性潜在因子包括电视产品显性潜在因子和用户显性潜在因子,通过显性潜在因子得出隐性潜在因子,基于显性潜在因子及隐性潜在因子构建显隐性潜在因子模型;步骤4:基于构建的显隐性潜在因子模型进行电视产品的推荐。2.根据权利要求1所述的基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,所述步骤1包括:步骤1.1:设计反爬虫机制,所述反爬虫机制包括采用模拟Ajax请求的方式,主动发起异步请求获取所需数据;步骤1.2:根据反爬虫机制设计网络爬虫算法,对网页数据进行爬取:采取所述反爬虫机制不断发起Http请求,然后接收Http回应,解析得到的HTML文件,如果是确定的结构,直接匹配得到标签中的数据;如果结构为非确定的,则对整个DOM树进行遍历搜索,获取标签中的数据。3.根据权利要求1所述的基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,所述步骤2包括:步骤2.1:根据电视产品的不同特征建立针对电视产品的分类模型:步骤2.1.1:根据电视产品的不同特征为电视产品设立不同等级的标签,所述不同等级的标签包括一级标签,所述一级标签包括基本特征和适用人群;步骤2.1.2:对于一级标签为基本特征的数据项,采用关键字和关键短语作为划分类别的输入数据源,采用支持向量机的方法对电视产品进行分类;步骤2.1.3:对于一级标签为适用人群的数据项,采用随机森林算法对电视产品进行分类;步骤2.1.4:通过步骤2.1.1至步骤2.1.3完成对电视产品的分类模型的构建,通过电视产品的分类模型对电视产品信息进行自动标签标注,得到标注标签后的电视产品信息;步骤2.2:根据用户人群的不同特征建立针对用户人群的分类模型:步骤2.2.1:根据用户人群的不同特征为用户人群设立不同等级的标签,所述不同等级的标签包括一级标签,所述一级标签包括用户人群基本特征和收视偏好;步骤2.2.2:对于一级标签为用户人群基本特征的数据项,采用随机森林算法对用户人群进行分类;步骤2.2.3:对于一级标签是收视偏好的数据项,建立将不同特征参数转化成输入格式,并且根据实际情况建立不同因素的评价体系,描述不同因素对用户节目偏好的贡献率,采用随机森林算法对用户人群进行分类;步骤2.2.4:通过步骤2.2.1至步骤2.2.3完成对用户人群的分类模型的构建,通过用户人群的分类模型对用户信息进行自动标签标注,得到标注标签后的用户信息。4.根据权利要求1所述的基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,所述用户信息包括用户收视信息及用户基本信息。5.根据权利要求4所述的基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,所述将不同特征参数转化成输入格式包括:通过计算用户收视信息样本中的各项的数据值,进行求均值方差计算,建立转换输入格式公式:其中,v1表示观看次数参量,μ1和ρ1分别表示该用户观看电视产品次数最多的观看次数和该电...
【专利技术属性】
技术研发人员:奚琪,桂智杰,李创,项永明,杨萍,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。