一种互联网行为标注引擎及对应该引擎的行为标注方法技术

技术编号:8765584 阅读:372 留言:0更新日期:2013-06-07 22:54
本发明专利技术公开了一种互联网行为标注引擎及对应该引擎的行为标注方法,属于用户互联网行为数据的收集和分析技术领域。所述的标注引擎包括分类体系、分词库、语义分析、爬取程序、规则库、知识库、规则解析器、自学习程序8个模块。所述的互联网行为标注方法提出:用户行为=行为主体+行为标识+行为状态,的基本逻辑结构。本发明专利技术提高了分类的效率和准确度,细化了互联网用户行为数据的描述粒度,完整识别一次用户行为的动作、对象和环境条件,完整还原了互联网用户行为。按照IUBML规则输出的用户行为数据直接提供基于用户行为和需求理解的精确广告服务,满足企业客户的市场营销需求。

【技术实现步骤摘要】

【技术保护点】
一种互联网行为标注引擎,包括分类体系模块、语义分析模块、爬取程序模块、规则库模块、知识库模块、规则解析器模块、自学习程序模块,其中:所述分类体系模块依据HTTP日志标记规则对规则库模块和知识库模块中的数据进行分类,其中所述HTTP日志标记规则定义的基本逻辑结构为:用户行为=行为主体+行为标识+行为状态;所述语义分析模块用于根据分类体系模块中定义好的分类项,识别出待处理文本隶属的分类类别;所述爬取程序模块用于获取用户访问过的、待分类的互联网URL资源数据,并将这些数据保存到知识库模块中;所述规则库模块含有互联网URL资源分类规则数据,用于分词库模块中文本分类之外的识别;所述知识库模块用于存储互联...

【技术特征摘要】

【专利技术属性】
技术研发人员:唐波李骄阳张祺薛忠军高福强褚秀良庞岩
申请(专利权)人:北京宽连十方数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1