一种用于智能机器人的反数据爬虫的数据处理方法及装置制造方法及图纸

技术编号:15519446 阅读:311 留言:0更新日期:2017-06-04 09:17
一种用于智能机器人的反数据爬虫的数据处理方法及装置,其中,该方法用于智能机器人服务器端的数据库访问,包括:验证信息生成步骤,在满足预设语义验证条件时,结合预设语义验证库生成语义验证信息并输出;语义验证步骤,获取用户针对语义验证信息所输入的多模态反馈信息,并判断多模态反馈信息与语义验证信息的验证答案是否匹配,如果匹配,则进入正常交互流程。该方法通过进行语义验证来判断数据库的访问请求是否是由数据爬虫发起的,由于数据爬虫并不具有语义理解能力,因此数据爬虫也就无法通过上述语义验证过程,这样也就有效保护了服务器端的数据库中的数据,从而达到了反数据爬虫的目的。

【技术实现步骤摘要】
一种用于智能机器人的反数据爬虫的数据处理方法及装置
本专利技术涉及机器人
,具体地说,涉及一种用于智能机器人的反数据爬虫的数据处理方法及装置
技术介绍
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。对于人机交互系统来说,其所使用的数据库是整个系统的关键,这就使得一些公司会采用数据爬虫来获取竞争对手的数据库内容。因此,如何确保自身数据库的内容无法被竞争对手所获取成为亟需解决的技术问题。
技术实现思路
为解决上述问题,本专利技术提供了一种用于智能机器人的反数据爬虫的数据处理方法,所述方法用于智能机器人服务器端的数据库访问,其包括:验证信息生成步骤,在满足预设语义验证条件时,结合预设语义验证库生成语义验证信息并输出;语义验证步骤,获取用户针对所述语义验证信息所输入的多模态反馈信息,并判断所述多模态反馈信息与所述语义验证信息的验证答案是否匹配,如果匹配,则进入正常交互流程。根据本专利技术的一个实施例,在所述验证信息生成步骤中,间隔预设时长来生成所述语义验证信息并输出。根据本专利技术的一个实施例,所述方法还包括:用户评分步骤,根据语义验证结果对所述用户进行评分,得到所述用户的信用评分;验证条件调整步骤,根据所述用户的信用评分来调整所述预设时长的长度。根据本专利技术的一个实施例,在所述预设语义验证库中,每个语义验证信息仅对应一个验证答案。根据本专利技术的一个实施例,所述智能机器人服务器端的数据库包括以下所列项中的任一项或几项:对话数据库、图片数据库和情感数据库。本专利技术还提供了一种用于智能机器人的反数据爬虫的数据处理装置,所述装置用于智能机器人服务器端的数据库访问,其包括:验证信息生成模块,其用于在满足预设语义验证条件时,结合预设语义验证库生成语义验证信息并输出;语义验证模块,其用于获取用户针对所述语义验证信息所输入的多模态反馈信息,并判断所述多模态反馈信息与所述语义验证信息的验证答案是否匹配,如果匹配,则进入正常交互流程。根据本专利技术的一个实施例,所述验证信息生成模块配置为间隔预设时长来生成所述语义验证信息并输出。根据本专利技术的一个实施例,所述装置还包括:用户评分模块,其用于根据语义验证结果对所述用户进行评分,得到所述用户的信用评分;验证条件调整模块,其用于根据所述用户的信用评分来调整所述预设时长的长度。根据本专利技术的一个实施例,在所述预设语义验证库中,每个语义验证信息仅对应一个验证答案。根据本专利技术的一个实施例,所述智能机器人服务器端的数据库包括以下所列项中的任一项或几项:对话数据库、图片数据库和情感数据库。本专利技术所提供的用于智能机器人的反数据爬虫的数据处理方法通过进行语义验证来判断数据库的访问请求是否是由数据爬虫发起的,由于数据爬虫并不具有语义理解能力,因此数据爬虫也就无法通过上述语义验证过程,这样也就有效保护了服务器端的数据库中的数据,从而达到了反数据爬虫的目的。此外,本专利技术所提供的方法还会利用语义验证结果来调节用户的信用评分,并利用用户的信用评分来对语义验证的频率进行调节。语义验证频率的调节能够进一步防止数据爬虫对数据库进行数据爬取从而保证数据库的安全性。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:图1是根据本专利技术一个实施例的用于智能机器人的反数据爬虫的数据处理方法的实现流程示意图;图2是根据本专利技术另一个实施例的用于智能机器人的反数据爬虫的数据处理方法的实现流程示意图;图3是根据本专利技术一个实施例的用于智能机器人的反数据爬虫的数据处理装置的结构示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本专利技术实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本专利技术可以不用这里的具体细节或者所描述的特定方式来实施。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。网络爬虫(又被称为网页蜘蛛、网络机器人或是网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本,已被广泛应用于互联网领域。搜索引擎能够使用网络爬虫抓取Web网页、文档甚至图片、音频、视频等资源,通过相应的索引技术组织这些信息,提供给搜索用户进行查询。为了与用户之间能够进行有效、顺畅以及个性化的人机交互,人机交互系统通常会使用数据库(知识库)来存储数据并通过检索、组合知识数据来生成输出数据。因此,对于人机交互系统来说,数据库中所存储的数据是十分重要的。而一些人机交互系统的提供商为了获取竞争对手的数据库内容,往往会采用数据爬虫来爬取竞争对手的数据库中的数据。针对上述问题,本专利技术提供了一种新的用于智能机器人的反数据爬虫的数据处理方法,该方法用于智能机器人服务器端的数据库访问。通过对数据爬虫进行分析,发现数据爬虫并不具备语义理解能力,因此本专利技术所提供的方法采用语义验证的方式来防止数据爬虫来爬取智能机器人服务器端的数据库中的相关数据。需要指出的是,本专利技术所提及的智能机器人服务器端的数据库既可以指对话数据库,也可以指图片数据库,还可以指情感数据库等其他数据库,抑或是上述两种或多种数据库的组合等,本专利技术不限于此。为了更加清楚地阐述本专利技术所提供的用于智能机器人的反数据爬虫的数据处理方法的实现原理、实现流程以及优点,以下分别结合不同的实施例来对该数据处理方法作进一步地说明。实施例一:图1示出了本实施例所提供的用于智能机器人的反数据爬虫的数据处理方法的实现流程示意图。如图1所示,本实施例所提供的数据处理方法首先在步骤S101中在满足预设语义验证条件时,结合预设语义验证库生成语义验证信息并输出。具体地,本实施例中,该方法在步骤S101中间隔预设时长来结合预设语义验证库生成语义验证信息并输出,即如果距离前一次生成并输出语义验证信息的时长达到预设时长,那么该方法也就会判定此时满足预设语义验证条件。需要指出的是,在本专利技术的不同实施例中,根据实际需要,上述预设时长可以配置为不同的合理值,本专利技术不限于此。本实施例中,如果判定当前满足预设语义验证条件,该方法会在步骤S101中结合预设语义验证库来生成并输出相应的语义验证信息。优选地,本实施例中,上述预设语义验证库中包含有词条包,各个词条包中均包含有验证问题和验证答案,该方法会在步骤S10本文档来自技高网...
一种用于智能机器人的反数据爬虫的数据处理方法及装置

【技术保护点】
一种用于智能机器人的反数据爬虫的数据处理方法,其特征在于,所述方法用于智能机器人服务器端的数据库访问,包括:验证信息生成步骤,在满足预设语义验证条件时,结合预设语义验证库生成语义验证信息并输出;语义验证步骤,获取用户针对所述语义验证信息所输入的多模态反馈信息,并判断所述多模态反馈信息与所述语义验证信息的验证答案是否匹配,如果匹配,则进入正常交互流程。

【技术特征摘要】
1.一种用于智能机器人的反数据爬虫的数据处理方法,其特征在于,所述方法用于智能机器人服务器端的数据库访问,包括:验证信息生成步骤,在满足预设语义验证条件时,结合预设语义验证库生成语义验证信息并输出;语义验证步骤,获取用户针对所述语义验证信息所输入的多模态反馈信息,并判断所述多模态反馈信息与所述语义验证信息的验证答案是否匹配,如果匹配,则进入正常交互流程。2.如权利要求1所述的方法,其特征在于,在所述验证信息生成步骤中,间隔预设时长来生成所述语义验证信息并输出。3.如权利要求2所述的方法,其特征在于,所述方法还包括:用户评分步骤,根据语义验证结果对所述用户进行评分,得到所述用户的信用评分;验证条件调整步骤,根据所述用户的信用评分来调整所述预设时长的长度。4.如权利要求1~3中任一项所述的方法,其特征在于,在所述预设语义验证库中,每个语义验证信息仅对应一个验证答案。5.如权利要求1~4中任一项所述的方法,其特征在于,所述智能机器人服务器端的数据库包括以下所列项中的任一项或几项:对话数据库、图片数据库和情感数据库。6.一种用于...

【专利技术属性】
技术研发人员:魏鹏
申请(专利权)人:北京光年无限科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1