展示对象关系的方法和系统技术方案

技术编号:6867336 阅读:216 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种展示对象关系的方法,包括以下步骤:A.从互联网信息中获取对象及采集对象共现频次;B.根据所述共现频次计算预定日期对象两两出现的总频次,再根据总频次计算对象关系密切度并得出待展示对象;C.根据待展示对象从互联网信息中获取预定日期内的待展示对象关系关联词;D.根据所述待展示对象及待展示对象关系关联词进行输出展示。此外,还涉及一种展示对象关系的系统。上述展示对象关系的方法及系统,采用计算预定日期内的对象关系密切度且定时更新对象关系,且获取预定日期内的对象关系关联词,能够及时的更新对象关系及对象关系关联词,这样能够较及时的展示对象之间的关系,体现了对象关系的时效性。

【技术实现步骤摘要】
展示对象关系的方法和系统
本专利技术涉及计算机
,尤其涉及一种展示对象关系的方法及系统。
技术介绍
在计算机
,各种互联网信息中包含有对象之间的关系,如人物关系等。传统搜索互联网信息并展示人物之间关系的方法中,第一种方法把特定人物相关的所有人都呈现出来,例如,搜索栏键入“姚明”的名字,立刻显示一张二维的效果图,是一张姚明的关系图,在姚明名字的周围出现各种颜色、距离不同的姓名,点击连接两个名字之间的白线,图上显示出这些名字同姚明的关系队友、对手、女友、接班人、经纪人。第二种方法采用一个轮辐式的信息分支来呈现人物之间的关系,像船舵上有无数个触角,每一个触角都是一个相关信息,点击一个触角时,延伸出另一条隐藏的轮辐式的信息分支。第三种方法 通过特定模式匹配,或者人工编辑,将人物之间的静态关联关系(如父子、爱人、师徒等关系)提取出来。这三种展现方式都是展示的人物间的静态关系,不会因为时间变化而变化。
技术实现思路
基于此,有必要提供一种展示对象关系的方法,能够较及时的展示对象之间的关系。一种展示对象关系的方法,包括以下步骤A.从互联网信息中获取对象及采集对象共现频次;B.根据所述共现频次计算预定日期对象两两出现的总频次,再根据总频次计算对象关系密切度并得出待展示对象;C.根据待展示对象从互联网信息中获取预定日期内的待展示对象关系关联词;D.根据所述待展示对象及待展示对象关系关联词进行输出展示。优选地,所述步骤B中对象关系密切度的计算公式为R(A,B) = ^F(rt,B,D\r^其中,R(A,B)为任意对象 A、B 的关系密ο a[Dis tance{CurrentDay,0)\μ切度,F(A,B,D)为日期D的对象A、B两两出现的总频次,α和β为可调整的参数,Distan ce (CurrentDay, D)表示日期D与当前日期的时间距离。优选地,步骤C包括Cl.选取待展示对象关系的候选关联词;C2.计算待展示对象关系的候选关联词的权重;C3.计算待展示对象关系的候选关联词的时效权重得出预定日期内的待展示对象关系关联词。优选地,步骤C2中计算待展示对象关系的候选关联词的权重的公式为F(w,d) = log(length(w))*P(TF(w)*IDF(w))*H(w)*Title(w)其中,F(w,d)表示关联词w的权重值,d表示日期;Iength(W)是关联词的长度,TF(w)是关联词w在互联网信息中的词频,IDF(W)是指词w的逆文档频率;函数P是一个分段函数;H(W)是规则权重;Title (w)是指关联词w出现在互联网信息的标题时增加的权重,默认值为1。优选地,所述展示对象关系的方法还包括步骤E 在获取待展示对象后,判断所述待展示对象是否为重名对象,若是,对重名对象进行处理。优选地,步骤E进一步包括以下步骤El.建立重名对象列表信息;E2.根据互联网历史信息构建类别信息层次树;E3.根据构建的类别信息层次树对重名对象进行处理。优选地,步骤E2包括E21.获取互联网历史信息且从所述互联网历史信息中提取类别信息,并对类别信息进行预处理,得到类别信息串集合;E22.解析所述类别信息串集合中类别信息串,计算得出所述类别信息串中任意类别父子关系的概率;E23.根据所述类别信息串及任意类别父子关系的概率初始化类别信息层次树,选取根类别集合;E24.递归任一类别扩展到根类别的路径,得到该类别到根类别经过的路径中所有上下两层类别父子关系的概率乘值,计算该类别为根类别的子类的概率为该类别到根类别经过的所有路径中所述概率乘值的总和。优选地,步骤E3包括E30.判断所述待展示对象是否存在于重名对象列表信息中,若是,执行步骤E31, 否则结束;E31.提取待展示对象所在互联网信息的类别信息串;E32.判断所述类别信息串是否存在,若是,则执行步骤E33,若否,则执行步骤 E34 ;E33.根据所述类别信息层次树,获取所述类别信息串中各类别作为根类别的子类的概率,取所述概率最大的根类别作为输出结果;E34.检索互联网信息中重名对象的可区分信息,并判断是否可区分,若是,执行步骤E35,否则结束;E35.输出对应的待展示对象。优选地,步骤D具体包括Dl.接收用户输入搜索对象;D2.根据搜索对象建立对象列表且获取待展示的对象及对象关系关联词;D3.根据获取的待展示对象及对象关系关联词对待展示对象位置进行初始化设置;D4.根据设定距离对初始化后的待展示对象位置进行渲染。此外,还有必要提供一种展示对象关系的系统,能够较及时的展示对象之间的关系。一种展示对象关系的系统,该系统包括信息采集模块,用于从互联网信息中获取对象及采集对象共现频次;处理模块,计算预定日期对象两两出现的总频次,再根据总频次计算对象关系密切度,并得出待展示对象;关联词获取模块,用于根据待展示对象从互联网信息中获取预定日期内的待展示对象关系关联词;输出展示模块,根据待展示对象及待展示对象关系关联词进行输出展示。优选地,所述处理模块计算所述对象关系密切度的公式为 rw , ^ ν-F(A,B,D)双(為=——TT^——^^7,其中,R(Aj)为对象Α、Β的关系密切度权ο a[Dis tance{CurrentDay,D)f重,F(A,B,D)为日期D的对象A、B两两出现的总频率,α和β为可调整的参数,Dis tan ce (CurrentDay, D)表示日期D与当前日期的时间距离。优选地,关联词获取模块进一步用于选取待展示对象关系的候选关联词,计算待展示对象关系的候选关联词权重及关联词时效权重得出预定日期内的待展示对象关系关联词。优选地,所述关联词获取模块计算对象关系的候选关联词的权重公式为F(w,d) = log(length(w))*P(TF(w)*IDF(w))*H(w)*Title(w)其中,F(w,d)表示关联词w的权重值,d表示日期;Iength(W)是关联词的长度, TF(w)是关联词w在互联网信息中的词频,IDF(W)是指词w的逆文档频率;函数P是一个分段函数;H(W)是规则权重;Title (w)是指关联词w出现在互联网信息的标题时增加的权重,默认值为1。优选地,所述系统还包括重名对象处理模块,所述重名对象处理模块用于在获取对象后,判断对象是否为重名对象并对重名对象进行处理。优选地,所述重名对象处理模块进一步用于建立重名对象列表信息,根据历史互联网历史信息构建类别信息层次树,根据构建的类别信息层次树对重名对象进行处理。优选地,所述重名对象处理模块进一步包括类别信息获取单元,从互联网历史信息中提取类别信息;预处理单元,对所述类别信息进行预处理,得到类别信息串集合;概率计算单元,解析类别信息串集合中类别信息串,计算得出所述类别信息串中任意类别父子关系的概率;类别信息层次树初始化单元,根据所述类别信息串及任意类别父子关系的概率初始化类别信息层次树,选取根类别集合;递归扩展单元,用于递归任一类别扩展到根类别的路径,得到该类别到根类别经过的路径中所有上下两层类别父子关系的概率乘值,计算该类别为根类别的子类的概率为该类别到根类别经过的所有路径中所述概率乘值的总和。优选地,所述重名对象处理模块进一步用于判断互联网信息中待展示对象在重名对象列表信息中,提本文档来自技高网...

【技术保护点】
1.一种展示对象关系的方法,包括以下步骤:A.从互联网信息中获取对象及采集对象共现频次;B.根据所述共现频次计算预定日期对象两两出现的总频次,再根据总频次计算对象关系密切度并得出待展示对象;C.根据待展示对象从互联网信息中获取预定日期内的待展示对象关系关联词;D.根据所述待展示对象及待展示对象关系关联词进行输出展示。

【技术特征摘要】

【专利技术属性】
技术研发人员:姜爱荣贾自艳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1