网络信息的处理方法和抽象语法树的建立方法及其装置制造方法及图纸

技术编号：9462799 阅读：83 留言：0更新日期：2013-12-19 00:02

本申请提供了一种网络信息的处理方法和抽象语法树的建立方法及其装置，其中，网络信息的处理方法包括：按照抽象语法树中的节点所描述的特征信息加载待检测网络信息中对应的字段信息，其中，抽象语法树中的各节点用于描述违规商品信息的特征信息；根据所加载的字段信息判断抽象语法树中的节点所对应的语句是否成立；若成立，则判断待检测网络信息为违规商品信息。本申请中的技术方案，解决了现有技术中对电子交易平台中发布的违规商品的处理效率较低的问题，提高了违规商品处理的效率。

全部详细技术资料下载

【技术实现步骤摘要】
网络信息的处理方法和抽象语法树的建立方法及其装置
本申请涉及互联网
，特别地涉及一种网络信息的处理方法和装置、以及抽象语法树的建立方法和装置。
技术介绍
电子商务网站作为一个商品交易平台（也可以称为：电子交易平台），每天有许多的卖家发布商品。一些信誉不好的卖家出于自身利益会利用这一平台违规发布一些商品。例如，欺骗消费者的广告商品、夸大宣传效果的商品、骗取网站搜索流量的商品、商品分类摆放不正确的商品等。为此，电子商务网站的管理人员一方面需要能够及时地阻止这些违规商品的发布，这要求从违规商品被发布到被检测的时间应当尽可能地短；另一方面需要对已经发布到网站的所有商品进行扫描，从中检测出违规商品，以便进行相应的处理。目前对于电子商务网站收到的商品信息的检测，主要有“规则引擎+搜索引擎”的方式和基于数据库的信息检索方式，以下分别介绍这两种方式。规则引擎是基于规则的专家系统的一部分，其核心是推理机，通过模式匹配器，推导事实与规则的匹配程度，当事实与规则匹配时，将规则装入规则优先级表中；之后，从规则优先级表中进行规则匹配，在匹配到的所有规则中选取优先级最高的规则（或者采用其他规则选择算法来选择规则），并执行相应的运作。典型的规则引擎包括Drools等，并有一些基于Drools的用于排查违规商品的业务系统。规则引擎适合于以流过滤的方式匹配目标数据，当遇到海量商品时，可以采用正向扫描的方式，逐一处理目标商品。规则引擎可用于实时排查违规商品，搜索引擎可用于全量排查违规商品。但这种“规则引擎+搜索引擎”的方式存在如下缺点：由于规则引擎和搜索引擎两者相对独立，因此两者的匹配...
网络信息的处理方法和抽象语法树的建立方法及其装置

【技术保护点】
一种抽象语法树的建立方法，其特征在于，包括：获取用于描述违规商品信息的特征信息；将所述特征信息编译成脚本信息，其中，所述脚本信息中各语句之间的逻辑关系与所述特征信息中各特征之间的逻辑关系相对应；按照所述脚本信息中各语句之间的逻辑关系建立与所述特征信息对应的抽象语法树，其中，所述抽象语法树中的每个节点与一个或多个语句相对应，各个节点之间的连接关系与所述各语句之间的逻辑关系相对应。

【技术特征摘要】
1.一种抽象语法树的建立方法，其特征在于，包括：获取用于描述违规商品信息的特征信息；将所述特征信息编译成脚本信息，其中，所述脚本信息中各语句之间的逻辑关系与所述特征信息中各特征之间的逻辑关系相对应；按照所述脚本信息中各语句之间的逻辑关系建立与所述特征信息对应的抽象语法树，其中，所述抽象语法树中的每个节点与一个或多个语句相对应，各个节点之间的连接关系与所述各语句之间的逻辑关系相对应；其中，在按照所述脚本信息中各语句之间的逻辑关系建立与所述特征信息对应的抽象语法树之后，还包括：按照所述抽象语法树中的节点所描述的特征信息加载待检测网络信息中对应的字段信息；根据所加载的字段信息判断所述抽象语法树中的节点所对应的语句是否成立；若成立，则判断所述待检测网络信息为违规商品信息。2.根据权利要求1所述的方法，其特征在于，在将所述特征信息编译成脚本信息之后，以及在按照所述脚本信息中各语句之间的逻辑关系建立与所述特征信息对应的抽象语法树之前，所述方法还包括：将编译得到的脚本信息以xml文件的形式存放到服务器中；在需要建立所述抽象语法树时，读取以xml文件的形式存储的脚本信息，并从所述xml文件中解析得到所述脚本信息。3.根据权利要求1所述的方法，其特征在于，根据所加载的字段信息判断所述抽象语法树中的节点所对应的语句是否成立的步骤包括：判断所述加载的字段信息是否满足所述节点所对应的语句中描述的判断条件；若满足，则判断出所述抽象语法树中的节点所对应的语句成立；若不满足，则判断出所述抽象语法树中的节点所对应的语句不成立。4.一种网络信息的处理方法，其特征在于，包括：按照抽象语法树中的节点所描述的特征信息加载待检测网络信息中对应的字段信息，其中，所述抽象语法树中的各节点用于描述违规商品信息的特征信息；根据所加载的字段信息判断所述抽象语法树中的节点所对应的语句是否成立；若成立，则判断所述待检测网络信息为违规商品信息；其中，在按照抽象语法树中的节点所描述的特征信息加载待检测网络信息中对应的字段信息之前，还包括：获取用于描述违规商品信息的特征信息；将所述特征信息编译成脚本信息，其中，所述脚本信息中各语句之间的逻辑关系与所述特征信息中各特征之间的逻辑关系相对应；按照所述脚本信息中各语句之间的逻辑关系建立与所述特征信息对应的抽象语法树，其中，所述抽象语法树中的每个节点与一个或多个语句相对应，各个节点之间的连接关系与所述各语句之间的逻辑关系相对应。5.根据权利要求4所述的方法，其特征在于，在将所述特征信息...

【专利技术属性】
技术研发人员：丰莎，陈国成，刘抚狄，蒋萌，王男，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人