【技术实现步骤摘要】
本专利技术涉及互联网信息处理领域,具体地说,是涉及一种基于规则的信息相关性判定方法。
技术介绍
随着互联网和移动通信的普及与发展,使得现实生活中的信息资源迅速增加。于此同时,也充斥着各种无价值信息,比如:广告信息、垃圾信息等。而每个用户真正感兴趣的信息非常有限,仅仅是其中的沧海一粟。因此,采用一些技术手段对这些信息进行相关性判定,保证用户得到其期望的信息。传统的文本与规则的相关性,根据自然语言文本中规则词之间特定位置关系来进行匹配判定,大致可分为同句判定、同字段判定和同文本判定等几种类型。虽然考虑了规则词之间的位置关系,但没有考虑到规则的类型及文本类型的区别,尤其是微博类的短文本,更加口语化、句子划分不够规整,不能保证句子分化的准确性,因此影响了文本相关性的判定精度。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术存在的问题和不足,提供一种新的基于规则的信息相关性判定方法,该方法达到了提高规则与信息相关性判定的准确性的效果。本专利技术所要解决的技术问题是通过以下的技术方案来实现的。本专利技术是一种基于规则的信息相关性判定方法,其特点:首先判断信息Info的标题Title
与规则Rule的相关性RT;当标题Title与规则Rule不相关,继续判断信息Info的正文Content与规则Rule的相关性RC。优选的具体步骤如下:A、判断标题Title与规则Rule的相关性RT。A1、判断标题Title中是否包含规则Rule中的全部的规则词,规则词集合Rule={w1、w2、w3、……wN
【技术保护点】
一种基于规则的信息相关性判定方法,其特征在于:其步骤如下:A、判断标题Title与规则Rule的相关性RT;RT为真,则表示规则Rule与信息Info相关,判断结束;否则执行步骤B;B、判断正文Content与规则Rule的相关性RC。
【技术特征摘要】
1.一种基于规则的信息相关性判定方法,其特征在于:其步骤如下:A、判断标题Title与规则Rule的相关性RT;RT为真,则表示规则Rule与信息Info相关,判断结束;否则执行步骤B;B、判断正文Content与规则Ru...
【专利技术属性】
技术研发人员:姜剑,仲兆满,陈宗华,
申请(专利权)人:江苏金鸽网络科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。