当前位置: 首页 > 专利查询>上海大学专利>正文

一种基于专家投票的文本相似网络构建方法技术

技术编号:8105750 阅读:229 留言:1更新日期:2012-12-21 04:32
本发明专利技术公开了一种基于专家投票的文本相似网络构建方法。该方法具体步骤如下:(1)输入领域文集;(2)文本表示与相似性度量;(3)使用专家投票法建立文本间的链接;(4)输出文本相似网络。该方法通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展;该方法简便易操作,效果好。

【技术实现步骤摘要】

本专利技术涉及一种文本相似网络构建方法,具体是涉及采用专家投票法确定任意两篇文本间是否建立链接的相似度阈值,然后根据该局部阈值建立文本的相似网络,是。
技术介绍
目前构建文本相似网络的普遍方法是全局阈值法。全局阈值法是通过人工或机器学习等方法设定的所有文本的相似度阈值,然后根据该全局阈值建立文本的相似网络的方法,但是这种全局阈值法存在以下不足 (I)全局阈值法不能够体现不同文本的不同链接特点。(2)全局阈值法不能够根据链接涉及的两个文本的相似度进行精确的控制。(3)全局阈值法不能够支持文本相似网络的动态扩展,当增加新的文本时,需要重新计算全局阈值。
技术实现思路
本专利技术的目的在于针对全局阈值法的不足,提供,该方法通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展。为了达到上述的目的,本专利技术的构思如下通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现不同文本间的不同链接特点,且支持相似网络的动态扩展;所述的局部阈值就是任意两个文本间是否建立链接的相似度阈值。根据上述的专利技术思想,本专利技术采用下述技术方案 ,其特征在于,其具体步骤如下 (1)输入领域文集; (2)文本表不与相似性度量; (3)使用专家投票法建立文本间的链接; 所述的专家投票法,其局部阈值IH十算式如下权利要求1.,其特征在于通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展;所述的局部阈值就是任意两篇文本间是否建立链接的相似度阈值;其具体步骤如下 (1)输入领域文集; (2)文本表不与相似性度量; (3)使用专家投票法建立文本间的链接; (4)输出文本相似网络。2.按权利要求I所述的基于专家投票的文本相似网络构建方法,其特征在于所述步骤(3)中的专家投票法,其局部阈值IH十算式如下全文摘要本专利技术公开了。该方法具体步骤如下(1)输入领域文集;(2)文本表示与相似性度量;(3)使用专家投票法建立文本间的链接;(4)输出文本相似网络。该方法通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展;该方法简便易操作,效果好。文档编号G06F17/27GK102831159SQ20121024386公开日2012年12月19日 申请日期2012年7月16日 优先权日2012年7月16日专利技术者陈雪, 吴超 申请人:上海大学本文档来自技高网...

【技术保护点】
一种基于专家投票的文本相似网络构建方法,其特征在于:通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展;所述的局部阈值就是任意两篇文本间是否建立链接的相似度阈值;其具体步骤如下:(1)输入领域文集;(2)文本表示与相似性度量;(3)使用专家投票法建立文本间的链接;(4)输出文本相似网络。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈雪吴超
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有1条评论
  • 来自[北京市联通] 2014年12月10日 05:19
    本相指本来面目原形语出朱子语类卷七六贞是常恁地便是他本相如此
    0
1