一种基于规则的信息相关性判定方法技术

技术编号:13681843 阅读:77 留言:0更新日期:2016-09-08 12:52
本发明专利技术公开了一种基于规则的信息相关性判定方法,首先判断规则与信息的标题的相关性。当规则与标题相关,规则与信息相关,判断结束;否则继续判断规则与信息正文的相关性。根据规则的核心词、规则类型及正文类型,划分正文句子,获取最短距离句子集,判断规则与最短距离句子集的相关性,得到规则与正文的相关性。再根据规则与正文的相关性,获得规则与信息的相关性。本发明专利技术通过判定信息的类型,规则中的关键词,规则的类型,并基于条件的最短距离句子,进行相关性判定,得到判定结果。通过对规则及信息的分析,可以提高规则在信息中的匹配准确度,提高了信息相关性判定能力,具有很强的实用性。

【技术实现步骤摘要】

本专利技术涉及互联网信息处理领域,具体地说,是涉及一种基于规则的信息相关性判定方法
技术介绍
随着互联网和移动通信的普及与发展,使得现实生活中的信息资源迅速增加。于此同时,也充斥着各种无价值信息,比如:广告信息、垃圾信息等。而每个用户真正感兴趣的信息非常有限,仅仅是其中的沧海一粟。因此,采用一些技术手段对这些信息进行相关性判定,保证用户得到其期望的信息。传统的文本与规则的相关性,根据自然语言文本中规则词之间特定位置关系来进行匹配判定,大致可分为同句判定、同字段判定和同文本判定等几种类型。虽然考虑了规则词之间的位置关系,但没有考虑到规则的类型及文本类型的区别,尤其是微博类的短文本,更加口语化、句子划分不够规整,不能保证句子分化的准确性,因此影响了文本相关性的判定精度。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术存在的问题和不足,提供一种新的基于规则的信息相关性判定方法,该方法达到了提高规则与信息相关性判定的准确性的效果。本专利技术所要解决的技术问题是通过以下的技术方案来实现的。本专利技术是一种基于规则的信息相关性判定方法,其特点:首先判断信息Info的标题Title
与规则Rule的相关性RT;当标题Title与规则Rule不相关,继续判断信息Info的正文Content与规则Rule的相关性RC。优选的具体步骤如下:A、判断标题Title与规则Rule的相关性RT。A1、判断标题Title中是否包含规则Rule中的全部的规则词,规则词集合Rule={w1、w2、w3、……wN

【技术保护点】
一种基于规则的信息相关性判定方法,其特征在于:其步骤如下:A、判断标题Title与规则Rule的相关性RT;RT为真,则表示规则Rule与信息Info相关,判断结束;否则执行步骤B;B、判断正文Content与规则Rule的相关性RC。

【技术特征摘要】
1.一种基于规则的信息相关性判定方法,其特征在于:其步骤如下:A、判断标题Title与规则Rule的相关性RT;RT为真,则表示规则Rule与信息Info相关,判断结束;否则执行步骤B;B、判断正文Content与规则Ru...

【专利技术属性】
技术研发人员:姜剑仲兆满陈宗华
申请(专利权)人:江苏金鸽网络科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1