当前位置: 首页 > 专利查询>陈翔宇专利>正文

基于人工智能的物联网实体搜索方法及系统技术方案

技术编号:15299691 阅读:52 留言:0更新日期:2017-05-12 01:52
本发明专利技术公开一种用于对物联网中实体进行搜索的方法及系统。所述方法包括:对用户的查询语句处理并生成没有歧义的中间语言;通过知识图谱将上述中间语言解析为系统内查询语句;通过自学习或人工训练的方式构建知识树的方法;通过服务器和传感网对系统内查询语句进行分布式查询的方法与协议。所述系统包括:对用户查询进行解析和结果反馈的搜索服务系统;维护知识图谱并提供解析的人工智能系统;根据系统内查询语句对实体进行检索的服务器集群和传感网系统。通过上述方法和系统可以实现用户使用自然语言搜索物联网中的实体;知识图谱的抽象性与发散性使得搜索目标可以是任何可描述的客观实体或者虚拟对象;本系统所描述的传感网系统和协议将搜索任务逐级拆分并委派,使之具有高并发和强兼容性的特点。

Entity searching method and system for Internet of things based on Artificial Intelligence

The invention discloses a method and a system for searching entities in an Internet of things. The method includes: the user's query processing and generating interlingua no ambiguity; through knowledge map the interlingua system for analytical queries; method of constructing knowledge tree through self-learning or artificial training mode; and the method of distributed query protocol through the server and sensor network system to query. The system includes a search service system analysis and result feedback of user query; maintenance of knowledge map and artificial intelligence system analysis; according to the retrieval server cluster and sensor network system of entity query system. By the above method and system the user can use natural language search in IOT entity; abstract knowledge map and the divergence of the search target may be any description of the objective entity or virtual object; sensor network system and protocol of the system described the search task step by step and split assignment, which has characteristics of high concurrent and strong compatibility.

【技术实现步骤摘要】

本专利技术涉及信息技术和人工智能领域,更具体地说,本专利技术涉及基于人工智能的物联网实体搜索方法及系统
技术介绍
物联网是在互联网基础上的延伸和扩展的网络,是新一代信息技术的重要组成部分。物联网的核心和基础仍然是互联网,但是通过传感器网络将用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。这使得物联网通过智能感知、识别技术与通用计算等通信感知技术,广泛应用于网络的融合中。当大量生活中的实体,如家电、公共设施等在接入物联网后,将会产生海量的实体信息。传统的搜索技术,即基于关键词的搜索技术很难做到对实体的精确高效搜索,因此,基于物联网的实体搜索技术应运而生。实体搜索的技术组成主要包括实体属性的提取和消歧、实体信息分类、实体关系挖掘。这些技术的基础就是需要前期花大量的时间和精力来建立的实体信息数据库。即便是建立后,随着系统的复杂化,实体信息数据库也需要不断更新。随着物联网规模的扩大,搜索引擎系统的负荷也会越来越大。传统搜索引擎中所使用的倒排表、网页快照等技术依赖对已知网页的不断抓取与分析,很难对网络上的变化做出实时响应,然而物联网中的信息几乎是一直变化的,因此更需要高并发的实时查询技术。以上两点是目前物联网实体搜索技术面临的主要难题。
技术实现思路
有鉴于此,本专利技术提供了一种物联网实体搜索方法及系统,使用知识图谱与自学习等人工智能技术解决了实体信息数据库建立与维护难题,并且通过一种新的传感网系统解决了高并发实时查询难题。为实现上述目的,本专利技术提供如下技术方案。一种物联网实体搜索方法,包括:处理用户的查询语句并与知识图谱中的概念进行映射的方法;通过知识图谱对查询语句进行语义分析并生成系统内查询语句的方法;构造、拓展、更新知识图谱的方法;对传感网系统进行分布式查询的方法与协议。通过知识图谱对查询语句进行语义分析并生成系统内查询语句的过程包括:分词:即将语言划分为独立的词汇;成分分析:确定词汇在语句中的成分,如主语、谓语或者宾语;成分补全:将语句中省略的成分填充完整;代词替换:将语句中的代词替换成对应的实体;语序重排:将倒装句、问句、从句等句式进行排序和拆分;消歧:通过概率分析等手段,将有歧义的词汇转换为无歧义词汇或者限定其表达的含义;迭代:重复以上步骤,直到解析结果达到预期精度;以上过程的顺序并不固定,且并非每步都必须执行,根据用户输入的语句有选择地进行,其中使用到的一些逻辑规则存储于知识图谱中。通过知识图谱对查询语句进行语义分析并生成系统内查询语句的过程包括:实体映射,将语句中的词语映射为实体;非实体映射,将语句中的词语映射为非实体;关系映射,分析实体与非实体之间的关系;语境分析,根据语句中词语的组合、顺序等特征判断语句所描述内容的环境;语义分析,解析语句想要表达的意思,即希望系统完成什么操作;以上过程的顺序并不固定,且并非每步都必须执行,根据中间语言有选择地进行。构造、拓展、更新知识图谱的方法包括:通过向导对人工智能系统进行样本训练;直接向知识图谱添加内容;通过对互联网、物联网等媒体上的信息进行聚类分析;通过对知识图谱中已有的内容进行逻辑推导获得新的内容或者挖掘出潜在的内容。知识图谱包括:实体的定义:实体包含名称等属性,对属性的约束,可以对实体进行的动作,实体可以发出的动作等;关系:包括关系描述,关系建立的条件和断开的条件,判断实体间是否存在关系的方法等,这种关系可以是多个实体间和非实体间的;非实体的定义:非实体指一些不具有实体特性的概念,非实体可以包含描述信息,适用范围,应用方法等。分布式查询的过程包括:传感网网关将系统内查询语句转发给传感网系统的顶层实体节点;顶层实体节点生成子查询语句并发放给下一层实体节点;各层实体节点检查自身是否符合查询条件;非底层实体节点将子节点返回的结果进行归并和排序;各层实体节点将结果返回给上一层实体节点。分布式查询协议包括:头文件:查询任务的状态代码(正常,错误),报文类型(请求、响应、控制),发起人,协议版本号,正文的格式(如JSON或XML)、编码(如GBK或UTF8),是否加密、压缩等;正文:请求报文包括查询语句,对查询的非功能性需求;响应报文正文包括查询结果集,包括结果数量,查询时间,完成时间,符合条件的实体列表等信息;控制报文正文包括对查询连接的控制命令(如建立、断开、挂起或流量控制)和连接状态信息;查询协议不规定查询的具体实现方式。一种物联网实体搜索系统,该系统分为三层,包括:搜索应用层:响应用户的搜索请求,调用知识图谱解析查询语句并可视化呈现查询结果;逻辑处理层:用于存储维护知识图谱和对知识图谱进行更新;实体搜索层:用于执行具体查询任务,并对结果进行归并、筛选、排序和分页操作。搜索应用层包括:生成没有歧义的中间语言的实体映射模块;将上述中间语言解析为系统内查询语句的语义分析模块;将查询任务分配给服务器集群并将查询结果显示的结果显示模块。逻辑处理层包括:用于存储维护知识图谱的知识图谱系统和用于对知识图谱进行构造、拓展、更新的人工智能系统。实体搜索层包括:对结果进行处理的服务器集群和执行查询任务的传感网系统。服务器集群的功能包括:服务器集群负责将用户输入的查询语句转化为系统内查询任务并发送给传感网系统,然后对传感网系统返回的查询结果进行归并、筛选、排序和分页,最后返回给应用层的结果显示模块。传感网系统的结构包括:传感网系统由两大类节点组成,实体节点和传感器节点,实体节点用于表示一个实体,所有对此实体的操作都是基于该节点,传感器节点用于获取实体的属性信息并保存下来。传感网系统采用树形拓扑结构,纯传感器节点必须是叶子节点,实体节点可以读取其下的传感器节点的属性信息,并且可以把查询语句下发给子实体。传感网络并不明确规定各节点的功能实现方式,只要提供能够执行查询语句并返回结果的接口即可。查询任务实质上被节点分摊。经由上述技术方案可知,本系统采用基于知识图谱的人工智能系统实现查询语句的语义化分析,并通过传感网节点实现了分布式查询,实现了语义化的高拓展性、高并发物联网实体搜索。附图说明在说明书的结尾部分中具体指出并明确要求保护了被视为本专利技术的主体。当结合附图阅读时,通过参考以下详细描述,可以最佳地理解本专利技术的组织和操作方法以及本专利技术的目的、特性和优点,这些附图是:图1是根据本专利技术的实施例公开的一种实体搜索系统架构示意图;图2是根据本专利技术的实施例公开的处理用户的查询语句并生成没有歧义的中间语言的方法的流程图;图3是根据本专利技术的实施例公开的通过知识图谱将上述中间语言解析为系统内查询语句的方法的流程图;图4是具体应用本专利技术的实施例公开的一种物联网实体搜索系统搜索界面示意图;图5是根据本专利技术的实施例公开的一种知识图谱的结构图;图6是根据本专利技术的实施例公开的构造、拓展、更新知识图谱的方法的示意图;图7是根据本专利技术的实施例公开的一种服务器和传感网系统的结构图;图8是根据本专利技术的实施例公开的一种节点通讯协议示意图;图9是根据本专利技术的实施例公开的一种分布式传感网系统实体搜索方法的流程图。为使例示简单和清晰,附图中示出的元素不一定按比例绘制。例如,为了清晰起见,某些元素的大小可能相对于其它元素而有所增大。此外,如果适当,标号可以在附图之间重复以指示对应或类似的特性。具体实施方式下本文档来自技高网...
基于人工智能的物联网实体搜索方法及系统

【技术保护点】
一种用于物联网实体搜索的方法,其内容包括:处理用户的查询语句并与知识图谱中的概念进行映射的方法;通过知识图谱对查询语句进行语义分析并生成系统内查询语句的方法;构造、拓展、更新知识图谱的方法;对传感网系统进行分布式查询的方法与协议。

【技术特征摘要】
1.一种用于物联网实体搜索的方法,其内容包括:处理用户的查询语句并与知识图谱中的概念进行映射的方法;通过知识图谱对查询语句进行语义分析并生成系统内查询语句的方法;构造、拓展、更新知识图谱的方法;对传感网系统进行分布式查询的方法与协议。2.如权利要求1中所述的方法,其特征在于,处理用户的查询语句并与知识图谱中的概念进行映射的方法,包括:分词:即将语言划分为独立的词汇;成分分析:确定词汇在语句中的成分,如主语、谓语或者宾语;成分补全:将语句中省略的成分填充完整;代词替换:将语句中的代词替换成对应的实体;语序重排:将倒装句、问句、从句等句式进行排序和拆分;消歧:通过概率分析等手段,将有歧义的词汇转换为无歧义词汇或者限定其表达的含义;迭代:重复以上步骤,直到解析结果达到预期精度;以上过程的顺序并不固定,且并非每步都必须执行,根据用户输入的语句有选择地进行,其中使用到的一些逻辑规则存储于知识图谱中。3.如权利要求1中所述的方法,其特征在于,方法生成的中间语言和用户所要表达的含义之间是对应的关系,即每句中间语言只能表达一种含义。4.如权利要求1中所述的方法,其特征在于,知识图谱,包括:实体的定义:实体包含名称等属性,对属性的约束,可以对实体进行的动作,实体可以发出的动作等;关系:包括关系描述,关系建立的条件和断开的条件,判断实体间是否存在关系的方法等,这种关系可以是多个实体间和非实体间的;非实体的定义:非实体指一些不具有实体特性的概念,非实体可以包含描述信息,适用范围,应用方法等。5.如权利要求1中所述的方法,其特征在于,通过知识图谱对查询语句进行语义分析并生成系统内查询语句的方法,包括:实体映射,将语句中的词语映射为实体;非实体映射,将语句中的词语映射为非实体;关系映射,分析实体与非实体之间的关系;语境分析,根据语句中词语的组合、顺序等特征判断语句所描述内容的环境;语义分析,解析语句想要表达的意思,即希望系统完成什么操作;以上过程的顺序并不固定,且并非每步都必须执行,根据中间语言有选择地进行。6.如权利要求1中所述的方法,其特征在于,构造、拓展、更新知识图谱的方法,包括:通过向导对人工智能系统进行样本训练;直接向知识图谱添加内容;通过对互联网、物联网等媒体上的信息进行聚类分析;通过对知识图谱中已有的内容进行逻辑推导获得新的内容或者挖掘出潜在的内容。7.如权利要求1中所述的方法,其特征在于,分布式查询方法,包括:传感网网关将系统内查询语句转发给传感...

【专利技术属性】
技术研发人员:陈翔宇
申请(专利权)人:陈翔宇
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1