基于百度百科知识图谱的旅游资源文化特色评分算法制造技术

技术编号:23315196 阅读:14 留言:0更新日期:2020-02-11 17:50
本发明专利技术公开了基于百度百科知识图谱的旅游资源文化特色评分算法,涉及旅游资源评价技术领域,解决了现有的旅游资源评分和旅游资源推荐系统中对文化特色的评分机制非常匮乏的问题,其技术方案要点是:获取旅游资源的文本宣传素材,对文本宣传素材进行分词处理,并保留名词词性词条,然后获得旅游资源的词向量;定义旅游资源文化特色评分指标,构建旅游景区景点文化评分表;根据景区景点关键词在知识图谱中的检索结果,结合文化评分表,对景区的文化特色进行评分。本发明专利技术首次提出旅游资源文化特色评分指标,评分算法的定义,对现有旅游资源评分体系是一个创新的补充,能够对旅游资源提供更全面的评价,也能为旅游资源推荐系统提供更完善的信息。

Evaluation algorithm of cultural characteristics of tourism resources based on Baidu Encyclopedia knowledge map

【技术实现步骤摘要】
基于百度百科知识图谱的旅游资源文化特色评分算法
本专利技术涉及旅游资源评价
,更具体地说,它涉及基于百度百科知识图谱的旅游资源文化特色评分算法。
技术介绍
文化是旅游的灵魂。一个景区、景点的文化内涵,可以提升旅游资源的魅力。以旅游的方式宣传文化,以文化魅力带动旅游,是我国发展旅游业的重要策略。目前针对旅游资源文化特色的评分几乎没有相关研究。关于旅游资源评分的研究大多聚焦于旅游资源服务质量、配套设施的评价,旅游资源推荐系统也多数从游客的兴趣和历史旅游足迹来评价一个景区景点。现有的旅游资源评分系统,主要从在线旅游网站(OTA)上抽取旅游资源的游客评价信息,如对酒店的评价,对旅游线路、活动的评价等信息。对评价信息进行处理,如将评价信息“很好”,“满意”等文字字样,离散化为数量(如-1表示差,0表示一般,1表示好,2表示很好等),获得评价等级,将大量的评价等级数据做成训练数据集,用数据挖掘方法(分类、聚类等)计算游客对某个旅游资源的总体评价水平。智旅游资源评价的研究特点为:一般是针对旅游资源的某一具体特性,如地质、服务来进行,旅游资源的具体特性数据特征不同,评价算法也各不相同。现有的旅游资源推荐系统,这类系统通过明确(提问),或挖掘用户的在线活动日志,了解用户需求。推荐系统一般根据旅游的目的地、路线及相应的旅游花销,设置相应打分项目的权重,通过用户显示操作或者系统计算,在用户和评分项之间生成一个二维表,根据评分情况向用户提供相应的推荐信息。现有的推荐系统更关注的是游客的旅游偏好,对用户的年龄、收入、旅游时间和旅游历史数据赋予更大的权重。而对一个旅游资源的文化特色则没有相应的考虑和处理。无论是旅游资源评分系统,还是旅游资源推荐系统,其中涉及到的评分项对于文化特色的评分机制非常匮乏。一个旅游资源的文化特色跟旅游资源的类型、特色有重要关系,而最容易获取旅游资源类型、特色的来源就是旅游资源的文字宣传素材,对景区景点来说,就是导游词。因此,如何设计一种基于百度百科知识图谱的旅游资源文化特色评分算法是我们目前迫切需要解决的问题,有助于帮助游客了解一个旅游资源的文化内涵和特色,对个性化旅游资源推荐系统有重要的参考价值,也有助于帮助旅游资源管理者了解文化对于旅游资源宣传和营销的重要性,为如何提升旅游资源的文化特色提供决策依据。
技术实现思路
本专利技术的目的是提供基于百度百科知识图谱的旅游资源文化特色评分算法,具有对文字宣传素材涉及到的知识类型给予文化识别,能够对旅游资源的文化特色进行比较客观的评价,以便能够为旅游资源的推送提供更细粒度的评价指标,也能够为游客了解一个旅游资源的文化特色提供更科学的参考意见的效果。本专利技术的上述技术目的是通过以下技术方案得以实现的:基于百度百科知识图谱的旅游资源文化特色评分算法,包括以下步骤:S1:文本处理,获取旅游资源的文本宣传素材,利用自然语言理解技术对文本宣传素材进行分词处理,并保留名词词性词条,然后获得旅游资源的词向量V(V1,V2,...,VS);S2:得分表构建,约定文化特色评分因素与相应知识类型之间的对应关系和得分分值,并建立相应的文化特色得分表;S3:知识类型检索,利用数据库和检索技术,在百度百科知识图谱中逐个检索旅游资源的词向量,并获得相应名词的知识类型;S4:特色评分,根据文化特色得分表、旅游资源在知识图谱中所涉及的知识个数和对应类型对相应旅游资源的文化特色进行评分,计算得到相应旅游资源的得分情况。本专利技术进一步设置为:在步骤S2中,所述得分表构建的具体步骤为:S21:定义旅游资源的特色文化知识类型集合为向量C(c1,c2,...,cm),由词条类型转换为文化评分词条类型算法,其中,ci为百度百科中与文化相关的词条类型;S22:定义旅游资源的特色文化评价指标集为向量B(b1,b2,...,bn),其中,bi代表第i种特色文化;S23:选取百度百科知识分类m类进行评分,则旅游资源特色文化得分权重表Wmn定义m行n列的矩阵为:其中,表示ci类词条在bi个特色文化评分项的得分,权重为0表示知识类型与文化特色无关联,不计分;权重为1表示知识类型与文化特色有关联,计1分。本专利技术进一步设置为:在步骤S4中,所述特色评分的具体步骤为:在百度百科中逐个检索Vi(1≤i≤s),若Vi在百度百科中存在,则读取的词条分类ci,根据ci读取W第i行数据,并为旅游资源的n个特色文化指标加分。综上所述,本专利技术具有以下有益效果:约定旅游资源文化特色评价指标集和与文化相关的知识类型集;根据上述两个集合定义基于知识类型的旅游资源文化特色评分矩阵;利用百度百科知识图谱,获取文本词条的类型;在旅游资源文化特色评分矩阵中检索文化特色得分项,计算旅游资源得分情况。对文字宣传素材涉及到的知识类型给予文化识别,能够对旅游资源的文化特色进行比较客观的评价,以便能够为旅游资源的推送提供更细粒度的评价指标,也能够为游客了解一个旅游资源的文化特色提供更科学的参考意见。同时,对现有的旅游资源评分体系是一个创新的补充,能够对旅游资源提供更全面的评价,为旅游资源推荐系统提供更完善的信息。附图说明图1是本专利技术实施例中的流程图。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。实施例:基于百度百科知识图谱的旅游资源文化特色评分算法,如图1所示,包括以下步骤:步骤一,文本处理。获取旅游资源的文本宣传素材,利用自然语言理解技术对文本宣传素材进行分词处理,并保留名词词性词条,然后获得旅游资源的词向量V(V1,V2,...,VS)。步骤二,得分表构建。约定文化特色评分因素与相应知识类型之间的对应关系和得分分值,并建立相应的文化特色得分表。(1)定义旅游资源的特色文化知识类型集合为向量C(c1,c2,...,cm),由词条类型转换为文化评分词条类型算法,其中,ci为百度百科中与文化相关的词条类型。词条类型包括但不限于“社会”、“历史”、“宗教”、“人物”、“民俗”、“生活”、“食品”、“景区”、“景点”等。(2)定义旅游资源的特色文化评价指标集为向量B(b1,b2,...,bn),其中,bi代表第i种特色文化。特色文化包括但不限于民俗文化、历史文化、宗教文化、饮食文化、社会综合文化等。(3)选取百度百科知识分类m类进行评分,则旅游资源特色文化得分权重表Wmn定义m行n列的矩阵为:其中,表示ci类词条在bi个特色文化评分项的得分,权重为0表示知识类型与文化特色无关联,不计分;权重为1表示知识类型与文化特色有关联,计1分。步骤三,知识类型检索,利用数据库和检索技术,在百度百科知识图谱中逐个检索旅游资源的词向量,并获得相应名词的知识类型。步骤四,特色评分,根据文化特色得分表、旅游资源在知识图谱中所涉及的知识个数和对应类型对相应旅本文档来自技高网
...

【技术保护点】
1.基于百度百科知识图谱的旅游资源文化特色评分算法,其特征是,包括以下步骤:/nS1:文本处理,获取旅游资源的文本宣传素材,利用自然语言理解技术对文本宣传素材进行分词处理,并保留名词词性词条,然后获得旅游资源的词向量V(V

【技术特征摘要】
1.基于百度百科知识图谱的旅游资源文化特色评分算法,其特征是,包括以下步骤:
S1:文本处理,获取旅游资源的文本宣传素材,利用自然语言理解技术对文本宣传素材进行分词处理,并保留名词词性词条,然后获得旅游资源的词向量V(V1,V2,...,VS);
S2:得分表构建,约定文化特色评分因素与相应知识类型之间的对应关系和得分分值,并建立相应的文化特色得分表;
S3:知识类型检索,利用数据库和检索技术,在百度百科知识图谱中逐个检索旅游资源的词向量,并获得相应名词的知识类型;
S4:特色评分,根据文化特色得分表、旅游资源在知识图谱中所涉及的知识个数和对应类型对相应旅游资源的文化特色进行评分,计算得到相应旅游资源的得分情况。


2.根据权利要求1所述的基于百度百科知识图谱的旅游资源文化特色评分算法,其特征是,在步骤S2中,所述得分表构建的具体步骤为:
S21:定义旅游资源的特色...

【专利技术属性】
技术研发人员:覃晓元昌安何国对乔少杰褚徐涛
申请(专利权)人:南宁师范大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1