【技术实现步骤摘要】
基于众包的中文旅游领域知识服务平台知识库更新方法
本专利技术属于计算机知识工程领域,具体涉及一种基于众包的中文旅游领域知识服务平台知识库更新方法,该方法融合了群智感知、知识表示与推理、信息检索与抽取、自然语言处理、知识图谱等多种学科,通过群智感知技术中众包(Crowdsourcing)的方法完成知识库的自动、及时更新,从而实现更精准、高效地为用户提供旅游知识服务。
技术介绍
在物联网、移动互联网和大数据发展背景下,群体感知与群智协同是近年发展起来的一种新的“以人为中心”的大规模感知和计算模式,成为当前学术和产业界共同关注的热点,也是国家“新一代人工智能发展规划”的重要内容。它通过群体的参与性和协作性完成复杂的感知和计算任务,在智慧城市、环境监测、智能交通、公共安全等领域具有重要的应用前景。而众包技术正是群智感知发展的基础,其在实例匹配、信息检索等领域都有很多经典的应用。Hike是一种解决大规模知识库间实例匹配的众包方法,其通过定义实例对之间的偏序关系,根据构建的偏序结构和已知问题答案来推断未知问题答案,再基于假设定义实例对和 ...
【技术保护点】
1.一种基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,包括步骤:/n通过旅游实体名称构建出旅游实体库;/n通过与结构化中文百科类数据集进行实体匹配抽取出旅游知识,构建出旅游知识库;/n在旅游知识库的基础上搭建中文旅游领域知识服务平台;所述中文旅游领域知识服务平台的搭建方法包括旅游实体知识图谱的可视化方法以及旅游实体知识卡片展示中的实体链接方法;所述的旅游实体知识卡片包括Infobox属性和实体百科标签;/n通过众包的方法统计出不同用户在中文旅游领域知识服务平台上的旅游实体搜索记录定时获取新的旅游实体;再通过抽取出的新的旅游知识来更新旅游知识库。/n
【技术特征摘要】
1.一种基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,包括步骤:
通过旅游实体名称构建出旅游实体库;
通过与结构化中文百科类数据集进行实体匹配抽取出旅游知识,构建出旅游知识库;
在旅游知识库的基础上搭建中文旅游领域知识服务平台;所述中文旅游领域知识服务平台的搭建方法包括旅游实体知识图谱的可视化方法以及旅游实体知识卡片展示中的实体链接方法;所述的旅游实体知识卡片包括Infobox属性和实体百科标签;
通过众包的方法统计出不同用户在中文旅游领域知识服务平台上的旅游实体搜索记录定时获取新的旅游实体;再通过抽取出的新的旅游知识来更新旅游知识库。
2.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:采用网页爬取方法从现有的旅游网站上爬取旅游实体名称来构建出旅游实体库;
所述的旅游实体名称包括全国34个省、直辖市、自治区、特别行政区的旅游景点。
3.根据权利要求1或2所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,旅游实体库的具体构建方法为:使用Python编程语言编写网页爬虫程序,通过程序模拟浏览器请求站点的行为,把站点返回的HTML代码爬到本地,进而提取所需要的旅游实体名称数据,将旅游实体名称数据存储到本地设备中来构建出旅游实体库。
4.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:所述的结构化中文百科类数据集从互联网中获取三元组Dump数据组成,Dump数据包括CN-DBpedia、Zhishi.me提供的数据,将获取得到的数据集存储到本地设备;当进行实体匹配时编写Python脚本将旅游实体库与三元组Dump数据进行匹配抽取出旅游...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。