一种违规在线商品检测方法技术

技术编号：7759200 阅读：227 留言：0更新日期：2012-09-14 01:15

一种违规在线商品检测方法，包括以下步骤：(1)通过网络爬虫对待检测在线商品所在页面的信息进行爬取；(2)通过分析待检测在线商品所在的电子商务网站的DOM树结构，找到包含网页中多个结构相似的信息块的最小深度的节点为临界节点，形成相关联信息点进行抽取的规则并建立模板，从爬虫获取的网页信息中提取商品属性信息数据；(3)建立语义字典，对提取的商品属性信息通过基于字符匹配的方法进行分词；(4)采用人工建立违规语义库，通过函数IllegalList将违规语义库中的词汇，和经过分词的商品属性信息相关内容词语字段进行识别判断，根据函数返回结果，判定违规在线商品的违规类别。本发明专利技术简化计算、及时性良好、适合多变的页面模式。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机网络技木，尤其是ー种违规在线商品检测方法。
技术介绍
近年来电子商务飞速发展，网络购物颠覆了传统的购物方式。互联网用户可以通过网络获取更广大的购物空间，突破地域的限制，可以随时购买自己想要的东西，没有营业时间的限制；可以按照自己需要的类别进行挑选，比对不同的价格，实现真正的自主购物；虽然看不到实物，选择的过程中可以參照已购者的评价和专家的建议，不用和商家进行接触，避免了讨价还价的环节中可能出现的摩擦和精神消耗，而且支付也异常快捷，可以避免现实中钱财被盗的现象，足不出户便可买到自己所需要的商品，网络购物可谓是省时省力。网上购物因为方便快捷逐渐成为大家喜爱的ー种购物方式，但是面对网络这样ー种虚拟的环境，不免也存在一些信息的可信度问题。比如说商品的真伪，商品的描述故意夸大其功能，商品信息的描述隐含了非法内容等，商家经营权限的自主扩大，这些都严重扰乱了电子商务的次序，对消费者的合法权益造成伤害，对电子エ商部门的监管带来了挑战。现存的违规在线商品的智能判断方法，主要是利用元搜索引擎抽取商品的信息，返回的信息来自多个搜索引擎，需要做排重和重新排序处理后作为自己的捜索结果返回，筛选工作复杂而且信息处理是在信息抓取完成后进行，不具有即时性，对商品信息的抽取时采用正则表达式匹配进行抽取，不适合多变的页面模式。
技术实现思路
为了克服已有违规在线商品检测方法的计算复杂、不具有即时性、不适合多变的页面模式的不足，本专利技术提供ー种简化计算、具有即时性、适合多变的页面模式的违规在线商品检测方法。本专利技术解决其技术问题所采用的技术方案是ー种违规在线商品检测方法...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：张兰兰，田宁，谭磊，刘崟，
申请(专利权)人：浙江盘石信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人