当前位置: 首页 > 专利查询>吴雨潞专利>正文

一种信息检索系统技术方案

技术编号:18553729 阅读:38 留言:0更新日期:2018-07-28 10:49
一种信息检索系统,其特征在于:由匹配特征、目标信息集和信息选择项集组成,所述匹配特征主要由引录、摘要、关键词组成;所述目标信息集主要由互联网汇集的文库、公开刊物组成;其用户通过公式得到检索结果。本系统通过匹配特征,由公式计算得出目标信息,或再经计算结果对比得出更加贴近更加贴合实际的目标信息,使得目标信息得出更加客观,更加准确,系统运行结果更迅速。

【技术实现步骤摘要】
一种信息检索系统
本专利技术涉及一种信息检索系统。
技术介绍
随着信息技术的发展,互联网信息每天都在呈比例增长,如何在庞大的信息海洋中寻找到自己想要得到的信息,是目前信息技术都在发展的方向。目前很多信息在百度查询之后,可以得到很多的结果,但在众多的结果里面,我们还需要对其进行人工的分辨,如果是在一个具有一定规则的系统里面,数据库的增加有序,对于检索的结果的准确率会有很大的提高,但是还不够精准。很多时候,数据的处理大都是加权算法,加权算法能提升数据选择的准确性。但是很多时候通过两种不两只的加权方法得到的数据结果会有不同,针对信息结果的本体而言,实质的内容有些偏差过大,如增加选择时的匹配特征,对信息分类越清楚,而检索结构越严谨,导致检索结果大起大落,加一个特征或减一个特征,两者检索结果都会让用户很失落。
技术实现思路
本专利技术的目的就是了为解决现有信息系统的不足而提供了一种更加高效的信息检索系统。本专利技术所要解决问题的技术方案如下:一种信息检索系统,其特征在于:由匹配特征、目标信息集和信息选择项集组成,所述匹配特征主要由引录、摘要、关键词组成;所述目标信息集主要由互联网汇集的文库、公开刊物组成;其用户检索结果的公式为:所述匹配特征由用户通过用户交互界面进行选择,再通过反馈程序从匹配特征数据库内提取。目标信息集内设有过滤特征,在匹配特征时可直接将关联的目标信息剔除。根据用户选择匹配特征得出形式相同内容不同时,继续按匹配特征分情况计算,取结果最大值对应的目标信息。根据用户选择匹配特征得出形式相同内容相近时,继续按匹配特征分情况计算,取结果最大值对应的目标信息。本专利技术的有益效果如下:本系统通过匹配特征,由公式计算得出目标信息,或再经计算结果对比得出更加贴近更加贴合实际的目标信息,使得目标信息得出更加客观,更加准确,系统运行结果更迅速。具体实施方式:一种信息检索系统,其特征在于:由匹配特征、目标信息集和信息选择项集组成,所述匹配特征主要由引录、摘要、关键词组成;所述目标信息集主要由互联网汇集的文库、公开刊物组成;其用户检索结果的公式为:所述匹配特征由用户通过用户交互界面进行选择,再通过反馈程序从匹配特征数据库内提取。目标信息集内设有过滤特征,在匹配特征时可直接将关联的目标信息剔除。根据用户选择匹配特征得出形式相同内容不同时,继续按匹配特征分情况计算,取结果最大值对应的目标信息。根据用户选择匹配特征得出形式相同内容相近时,继续按匹配特征分情况计算,取结果最大值对应的目标信息。本专利技术的实现原理如下:信息选择项集:A=[a,b,c,d,e,f,g,h,j],f,g为引录、h,j为关键词。目标信息集:B=[a:1,b:1,c:0,d:0]——a为过滤特征;C=[m:1,a:1,d:1,e:1]——m为过滤特征;D=[非e:1,c:0.5,d:.5]——非e为过滤特征;E=[a:1,b:1,c:1,非k:1]——非k为过滤特征;F=[a:1,b:1,c:0]或[a:1,c:1,f:0.5,g:0.5,h:0.5,x:1,y:0]——形式相同内容不同;G=[G1,G2],G1=[a:1,b:1,f:0.5,h:0.5],G2=[a:1,d:1,e:1,f:0.5]——形式相同内容相近;在本专利技术的系统中,过滤特征的定义为一种辅助验证,如年份是否符合。可以使系统在公式中选择时更加具有客观性。通过系统公式计算如下:目标信息B:匹配特征有(a,b,c,d),则匹配特征个数=4,匹配特征总权重=1+1+0+0=2,信息选择项集数=1+1+1+1+1+2/2+2/2=7,目标信息集总权重=1+1+0+0=2。则目标信息B的概率=2/2*4/7=0.57。目标信息C:m为过滤特征,信息选择项集中没有m,故目标信息C不参与计算。目标信息D:信息选择项集中有e,而信息选择项集中为非e,故目标信息D不参与计算。目标信息E:目标信息集中有非k,信息选择项集中没有k,则默认信息选择项集中有非k,此时信息选择项集为[a,b,c,d,e,f,g,h,j,非k],则匹配特征为(a,b,c,非k),匹配特征个数=4,匹配特征总权重=1+1+1+1=4,信息选择项集个数=1+1+1+1+1+2/2+2/2+1=8,目标信息集总权重=1+1+1+1=4,则目标信息E的概率=4/4*4/8=0.5。目标信息F:形式相同内容不同,此处举例的情况两种匹配特征都包含或部分包含在信息选择项集中,但也有一个包含一或多个不包含的情况。此时目标信息F要分两种情况计算。情况一,匹配特征有(a,b,c),匹配特征个数=3,匹配特征总权重=1+1+0=2,信息选择项集个数=1+1+1+1+1+2/2+2/2=7,目标信息集总权重=1+1+0=2,则目标信息F的概率=2/2*3/7=0.43。情况二,没有过滤特征,所以此方参与计算,比如包括引录、关键词,故强调引录、关键词相同个数计算规则:信息选择项集只要有相同引录特征,只要引录特征个数≥1,那么引录特征个数=1个,只要关键词相同个数≥1个,则关键词相同个数=1个,匹配引录、关键词的个数根据信息选择项集确定,若匹配特征只有1个引录,信息选择项集有两个,则匹配症引录个数=1/2=0.5个,摘要、关键词同理。此时,匹配特征有(a,c,f,g,h),匹配特征个数=1+1+(1+1)/(1+1)+1/(1+1)=3.5,匹配特征总权重=1+1+0.5+0.5+0.5=3.5,信息选择项集个数=1+1+1+1+1+2/2+2/2=7,目标信息集总权重=1+1+0.5+0.5+0.5+1+0=4.5,则目标信息F的概率=3.5/4.5*3.5/7=0.39。最后比较情况一与情况二的大小,并取最大值,0.43>0.39,目标信息F的概率为0.43。在信息系统中,提取F为检索结果。目标信息G:形式相同内容相近,将目标信息当做两个及以上的独立的目标信息计算概率,取最大值,最终指向概率最大的子项,这也是与形式相同内容不同的不同点。G1的匹配特征有(a,b,f,h),匹配特征个数=1+1+1/2+1/2=3,匹配特征总权重=1+1+0.5+0.5=3,信息选择项集个数=1+1+1+1+1+2/2+2/2=7,目标信息集总权重=1+1+0.5+0.5=3,概率=3/3*3/7=0.43。G2的匹配特征有(a,b,e,f),匹配特征个数=1+1+1+1/2=3.5,匹配特征总权重=1+1+1+0.5=3.5,信息选择项集个数=1+1+1+1+1+2/2+2/2=7,目标信息集总权重=1+1+1+0.5=3.5,概率=3.5/3.5*3.5/7=0.5。比较G1与G2的概率,取最大值,0.5>0.43,故处方G的概率为0.5。在信息系统中,提取G2为检索结果。本文档来自技高网...

【技术保护点】
1.一种信息检索系统,其特征在于:由匹配特征、目标信息集和信息选择项集组成,所述匹配特征主要由引录、摘要、关键词组成;所述目标信息集主要由互联网汇集的文库、公开刊物组成;其用户检索结果的公式为:

【技术特征摘要】
1.一种信息检索系统,其特征在于:由匹配特征、目标信息集和信息选择项集组成,所述匹配特征主要由引录、摘要、关键词组成;所述目标信息集主要由互联网汇集的文库、公开刊物组成;其用户检索结果的公式为:2.根据权利要求1所述的一种信息检索系统,其特征在于:所述匹配特征由用户通过用户交互界面进行选择,再通过反馈程序从匹配特征数据库内提取。3.根据权利要求1所述的一种信息检索系统,其特...

【专利技术属性】
技术研发人员:吴雨潞
申请(专利权)人:吴雨潞
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1