当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于自然语言处理的空间查询主题的归类方法及装置制造方法及图纸

技术编号:20221771 阅读:35 留言:0更新日期:2019-01-28 20:16
本发明专利技术提供了一种基于自然语言处理的空间查询主题的归类方法及装置,其中的方法包括:通过将用户输入的自然语言分割为隔断词的集合,然后对集合内的词依次进行特征匹配与语义序列重新排列。再根据主题训练的结果查找与输入的自然语言最相邻的样本,并返回主题,以此达到对自然语言的空间查询主题归类。实现提高主题提取准确性的技术效果。

【技术实现步骤摘要】
一种基于自然语言处理的空间查询主题的归类方法及装置
本专利技术涉及自然语言
,具体涉及一种基于自然语言处理的空间查询主题的归类方法及装置。
技术介绍
随着新一代信息技术产业的飞速发展,个人智能助手已经成为提高生活品质的流行应用。根据用户的输入,个人智能助手可以通过自然语言理解和自动化信息处理来完成操作指令。自然语言是人工智能的分支学科,自然语言处理是使用机器处理人类语言的理论和技术,将语言做为计算对象来研究相应的算法。目的是让人类可以用自然语言形式与计算机系统进行人机交互,从而更便捷、有效地进行信息管理。从90年代末到21世纪初,人们逐渐认识到,仅用基于规则的方法或仅用基于统计的方法都是无法成功进行自然语言处理的。随后基于实例和基于规则的语料库技术应运而生。现有自然语言处理技术,主要包括基于规则的方法和基于概率的方法两大类型,又细分为基于贝叶斯原理方法、基于隐马尔科夫模型方法、话语分析方法、神经网络方法等等。但随着人们对信息服务需求的日益增加,自然语言的语义理解仍存在主题提取困难与主题歧义等诸多问题。随着自然语言理解技术的不断发展,自然空间查询语言的研究也有了一定的进展,取得了本文档来自技高网...

【技术保护点】
1.一种基于自然语言处理的空间查询主题的归类方法,其特征在于,包括:步骤S1:基于预设隔断词将待处理的自然语言分割为词的集合;步骤S2:将所述词的集合中的词语与预先构建的概念性词汇库进行特征匹配,获得与预设结构对应的词序列;步骤S3:在主题训练结果集中,查找与所述待处理的自然语言最相邻的样本,其中,所述主题训练结果集由预先搜集的自然语言样例,通过所述词序列训练后获得,所述样本中包含文本和查询主题,返回所述样本中包含的查询主题,并将所述查询主题作为归类结果。

【技术特征摘要】
1.一种基于自然语言处理的空间查询主题的归类方法,其特征在于,包括:步骤S1:基于预设隔断词将待处理的自然语言分割为词的集合;步骤S2:将所述词的集合中的词语与预先构建的概念性词汇库进行特征匹配,获得与预设结构对应的词序列;步骤S3:在主题训练结果集中,查找与所述待处理的自然语言最相邻的样本,其中,所述主题训练结果集由预先搜集的自然语言样例,通过所述词序列训练后获得,所述样本中包含文本和查询主题,返回所述样本中包含的查询主题,并将所述查询主题作为归类结果。2.如权利要求1所述的方法,其特征在于,所述预设隔断词包括:行为动词、介词、主语、特征词和疑问词。3.如权利要求1所述的方法,其特征在于,所述预先构建的概念性词汇库包括兴趣点、业务属性、业务属性评价、空间关系、行为动词、时间、人物、地点疑问、评价疑问、业务疑问。4.如权利要求1所述的方法,其特征在于,所述预设结构为“主题-动词-兴趣点-动词-物品”,步骤S2具体包括:步骤S2.1:将所述词的集合中的词语与预先构建的概念性词汇库进行特征匹配,获得特征词;步骤S2.2:将所述特征词转换为“主题-动词-兴趣点-动词-物品”结构的词序列。5.如权利要求4所述的方法,其特征在于,主题训练结果集由预先搜集的自然语言样例,通过所述词序列训练后获得,具体为:获得包含主题信息的训练样本;创建所述训练样本的ElaticSearch索引和映射,其中,所述映射包括[第一文本,主题,ID,行],...

【专利技术属性】
技术研发人员:呙维赵雨慧李铭朱欣焰
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1