一种基于关联分析算法的旅行推荐方法和系统技术方案

技术编号:24251675 阅读:46 留言:0更新日期:2020-05-22 23:38
本申请实施例提供一种基于关联分析算法的旅行推荐方法和系统。该方法包括:通过命名实体识别,抽取出旅行网页中的文本信息,构建旅行文本信息集,并通过情感分析对旅行文本信息集进行喜好置信度计算;抽取出旅行网页中的图片信息,去除与旅行无关的噪音图片,构建旅行图片集,对图片中的地标、品牌和菜品进行识别,得到每张图片的标签集合,建立图片的标签集合与旅行文本信息集的映射关系;根据旅行时空关系,由映射关系中各分类信息形成关联规则树中的事件链,识别出旅行频繁项集;旅行时空关系包括时间关系和地理位置关系;提取出旅行频繁项集中符合用户要求的旅行文本信息,形成推荐攻略。本申请通过关联分析算法提高了旅行推荐的用户体验。

A travel recommendation method and system based on association analysis algorithm

【技术实现步骤摘要】
一种基于关联分析算法的旅行推荐方法和系统
本申请涉及智能处理技术及旅行推荐领域,尤其涉及一种基于关联分析算法的旅行推荐方法和系统。
技术介绍
现在的旅行推荐过程中,往往是固定化的套路模式,例如,一条旅行线路都是去固定几个城市、逛固定的商店、吃固定的饭馆,并没有对旅行者的个性进行推荐。而且,旅行者进行旅行规划的时候,一般具有从众心理,大家常去的“网红”店、热门地标都一定要“打卡”。进一步地说,为了方便旅行者自己制作旅行攻略的麻烦,旅行者一般希望根据自己的需求和大众评价,自动生成图文并茂的旅行攻略。因此,亟须一种高效、准确的方法和设备能够解决这些问题。
技术实现思路
有鉴于此,本申请的目的在于提出一种基于关联分析算法的旅行推荐方法和系统,提高旅行推荐的效率,解决目前旅行推荐过程中,无法准确识别用户的兴趣点,并自动生成旅行推荐攻略的技术问题。基于上述目的,本申请提出了一种基于关联分析算法的旅行推荐方法,包括:通过命名实体识别,抽取出旅行网页中的文本信息,构建旅行文本信息集,并通过情感分析对所述旅行文本信息集本文档来自技高网...

【技术保护点】
1.一种基于关联分析算法的旅行推荐方法,其特征在于,包括:/n通过命名实体识别,抽取出旅行网页中的文本信息,构建旅行文本信息集,并通过情感分析对所述旅行文本信息集进行喜好置信度计算;所述旅行文本信息集分类为作者基本信息、食宿信息、轨迹信息和商品信息;/n抽取出旅行网页中的图片信息,去除与旅行无关的噪音图片,构建旅行图片集,对所述图片中的地标、品牌和菜品进行识别,得到每张图片的标签集合,建立所述图片的标签集合与所述旅行文本信息集的映射关系;/n根据旅行时空关系,由所述映射关系中各分类信息形成关联规则树中的事件链,识别出旅行频繁项集;所述旅行时空关系包括时间关系和地理位置关系;/n提取出所述旅行频...

【技术特征摘要】
1.一种基于关联分析算法的旅行推荐方法,其特征在于,包括:
通过命名实体识别,抽取出旅行网页中的文本信息,构建旅行文本信息集,并通过情感分析对所述旅行文本信息集进行喜好置信度计算;所述旅行文本信息集分类为作者基本信息、食宿信息、轨迹信息和商品信息;
抽取出旅行网页中的图片信息,去除与旅行无关的噪音图片,构建旅行图片集,对所述图片中的地标、品牌和菜品进行识别,得到每张图片的标签集合,建立所述图片的标签集合与所述旅行文本信息集的映射关系;
根据旅行时空关系,由所述映射关系中各分类信息形成关联规则树中的事件链,识别出旅行频繁项集;所述旅行时空关系包括时间关系和地理位置关系;
提取出所述旅行频繁项集中符合用户要求的旅行文本信息,得到推荐结果,并按照所述旅行文本信息集的标签分类,嵌入所述旅行图片集中的图片,形成推荐攻略。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
按照用户的选择条件,预测用户的兴趣点,并根据所述兴趣点对所述推荐结果进行增加、删除和排序,生成新的推荐攻略。


3.根据权利要求1所述的方法,其特征在于,通过命名实体识别,抽取出旅行网页中的文本信息,构建旅行文本信息集,并通过情感分析对所述旅行文本信息集进行喜好置信度计算,包括:
对所述旅行网页进行分块预处理,根据网页视觉特征抽取出网页核心内容分块;
抽取所述网页核心内容分块中的地标、品牌、菜品和对应的情感特征词,形成旅行文本信息集;
通过情感分析计算所述旅行文本信息集进行喜好置信度,并按照地标、品牌和菜品分别进行排序。


4.根据权利要求1所述的方法,其特征在于,抽取出旅行网页中的图片信息,去除与旅行无关的噪音图片,构建旅行图片集,对所述图片中的地标、品牌和菜品进行识别,得到每张图片的标签集合,建立所述图片的标签集合与所述旅行文本信息集的映射关系,包括:
对所述旅行网页进行分块预处理,根据网页视觉特征抽取出网页核心内容分块;
识别出所述网页核心内容分块中图片的焦点内容,对所述焦点内容进行地标、品牌和菜品识别,得到每张图片的标签集合;
将所述标签集合中的每个元素与所述文本信息集中的每个元素进行语义比对,在比对结果超过指定阈值的情况下,建立映射关系。


5.根据权利要求1所述的方法,其特征在于,根据旅行时空关系,由所述映射关系中各分类信息形成关联规则树中的事件链,识别出旅行频繁项集,包括:
按照时间序列关系,将所述分类信息填充至所述事...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:重庆特斯联智慧科技股份有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1