【技术实现步骤摘要】
景点数据库建立方法及装置
本专利技术涉及景点数据整理
,具体而言,涉及一种景点数据库建立方法及装置。
技术介绍
随着旅游业的不断发展,景点推荐技术也得到了巨大的提升,但就目前而言,景点推荐技术采用的景点数据整理技术使得景点推荐过程中能够向游客提供的景点描述信息非常稀疏,绝大部分的景点仅有很少的图片描述和/或文字描述,且不同景点在图片描述和/或文字描述上非常相似,不能有效地体现出各景点本身的特点,使得游客难以区分各景点之间的差异,增加了游客对景点的选取难度。
技术实现思路
为了克服现有技术中的上述不足,本专利技术的目的在于提供一种景点数据库建立方法及装置。所述景点数据库建立方法通过对各景点的图片特征及文本特征进行融合的方式,改善景点描述信息稀疏问题,提高各景点在描述上的辨识度,有效地体现出各景点本身的特点,便于游客对各景点进行区分与选取。就景点数据库建立方法而言,本专利技术较佳的实施例提供一种景点数据库建立方法。所述方法包括:获取目标旅游网站上各景点对应的景点信息,其中,所述景点信息包括该景点的文本信息、图片信息及点评信息;对各景点对应的文本信息进行分析,从所述文 ...
【技术保护点】
一种景点数据库建立方法,其特征在于,所述方法包括:获取目标旅游网站上各景点对应的景点信息,其中,所述景点信息包括该景点的文本信息、图片信息及点评信息;对各景点对应的文本信息进行分析,从所述文本信息中提取出用于对各景点进行聚类的主题,并将各景点划分到对应主题下;分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征;对各景点对应的点评信息进行分析,为各景点设置对应的标签,其中,所述点评信息包括点评时间、点评数目及点评评分;建立各景点对应的主题、融合特征及标签之间的联系,并对所述联系进行存储,以形成景点数据库。
【技术特征摘要】
1.一种景点数据库建立方法,其特征在于,所述方法包括:获取目标旅游网站上各景点对应的景点信息,其中,所述景点信息包括该景点的文本信息、图片信息及点评信息;对各景点对应的文本信息进行分析,从所述文本信息中提取出用于对各景点进行聚类的主题,并将各景点划分到对应主题下;分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征;对各景点对应的点评信息进行分析,为各景点设置对应的标签,其中,所述点评信息包括点评时间、点评数目及点评评分;建立各景点对应的主题、融合特征及标签之间的联系,并对所述联系进行存储,以形成景点数据库。2.根据权利要求1所述的方法,其特征在于,所述获取目标旅游网站上各景点对应的景点信息的步骤包括:根据目标旅游网站对应的链接地址,对目标旅游网站进行访问,并对目标旅游网站对应网页上的页面内容进行采集;对采集到的页面内容进行解析,并从所述页面内容中提取出与各景点对应的景点信息。3.根据权利要求1所述的方法,其特征在于,所述对各景点对应的文本信息进行分析,从所述文本信息中提取出用于对各景点进行聚类的主题,并将各景点划分到对应主题下的步骤包括:通过隐含狄利克雷分布主题概率模型对各景点的文本信息进行分析,从所述文本信息中提取出相应的主题及与所述主题对应的关键词;根据各景点的文本信息中所述关键词的出现频率,对各景点在不同主题下的聚类概率进行计算,并选取各景点对应的概率最大的主题作为该景点所属的主题,以将各景点划分到对应主题下。4.根据权利要求1所述的方法,其特征在于,所述分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征的步骤包括:分别从各景点的文本信息及图片信息中提取出对应的文本特征向量及图片特征向量;分别对所述文本特征向量及所述图片特征向量进行聚类,并对聚类后的文本特征向量及图片特征向量进行归一化处理,得到各景点对应的文本特征及图片特征。5.根据权利要求1所述的方法,其特征在于,所述将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征的步骤包括:将每个景点对应的文本特征及图片特...
【专利技术属性】
技术研发人员:杨阳,段雅倩,王鑫泽,
申请(专利权)人:成都澳海川科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。