【技术实现步骤摘要】
【技术保护点】
一种互联网行为标注引擎,包括分类体系模块、语义分析模块、爬取程序模块、规则库模块、知识库模块、规则解析器模块、自学习程序模块,其中:所述分类体系模块依据HTTP日志标记规则对规则库模块和知识库模块中的数据进行分类,其中所述HTTP日志标记规则定义的基本逻辑结构为:用户行为=行为主体+行为标识+行为状态;所述语义分析模块用于根据分类体系模块中定义好的分类项,识别出待处理文本隶属的分类类别;所述爬取程序模块用于获取用户访问过的、待分类的互联网URL资源数据,并将这些数据保存到知识库模块中;所述规则库模块含有互联网URL资源分类规则数据,用于分词库模块中文本分类之外的识别;所述知 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:唐波,李骄阳,张祺,薛忠军,高福强,褚秀良,庞岩,
申请(专利权)人:北京宽连十方数字技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。