【技术实现步骤摘要】
本专利技术涉及一种文本相似网络构建方法,具体是涉及采用专家投票法确定任意两篇文本间是否建立链接的相似度阈值,然后根据该局部阈值建立文本的相似网络,是。
技术介绍
目前构建文本相似网络的普遍方法是全局阈值法。全局阈值法是通过人工或机器学习等方法设定的所有文本的相似度阈值,然后根据该全局阈值建立文本的相似网络的方法,但是这种全局阈值法存在以下不足 (I)全局阈值法不能够体现不同文本的不同链接特点。(2)全局阈值法不能够根据链接涉及的两个文本的相似度进行精确的控制。(3)全局阈值法不能够支持文本相似网络的动态扩展,当增加新的文本时,需要重新计算全局阈值。
技术实现思路
本专利技术的目的在于针对全局阈值法的不足,提供,该方法通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展。为了达到上述的目的,本专利技术的构思如下通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现不同文本间的不同链接特点,且支持相似网络的动态扩展;所述的局部阈值就是任意两个文本间是否建立链接的相似度阈值。根据上述的专利技术思想,本专利技术采用下述技术方案 ,其特征在于,其具体步骤如下 (1)输入领域文集; (2)文本表不与相似性度量; (3)使用专家投票法建立文本间的链接; 所述的专家投票法,其局部阈值IH十算式如下权利要求1.,其特征在于通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展;所述的局部阈值就是任意两篇文本间是否建立链接的相似度阈值;其 ...
【技术保护点】
一种基于专家投票的文本相似网络构建方法,其特征在于:通过专家投票法产生的局部阈值对文本间的链接进行精确的控制,体现了不同文本间的不同链接特点,且支持相似网络的动态扩展;所述的局部阈值就是任意两篇文本间是否建立链接的相似度阈值;其具体步骤如下:(1)输入领域文集;(2)文本表示与相似性度量;(3)使用专家投票法建立文本间的链接;(4)输出文本相似网络。
【技术特征摘要】