当前位置: 首页 > 专利查询>复旦大学专利>正文

多文档自动摘要的逐次主轴筛选法制造技术

技术编号:2839997 阅读:218 留言:0更新日期:2012-04-11 18:40
本发明专利技术属文本信息技术领域,具体涉及一种多文档自动摘要的逐次主轴筛选法。该方法是OR转轴法的改进,包括句子两两之间相似度的计算,求解主轴,抽去句子并去冗。本发明专利技术方法无需人工标注的训练数据,而且精度高,应用广泛。

【技术实现步骤摘要】

【技术保护点】
一种多文档自动摘要的逐次主轴筛选法,其特征在于具体步骤如下:    (1)将句子表示成空间向量,然后计算句子两两之间的相似度;    (2)求解主轴,先求出每句话的权重,对每句话进行加权,并重新计算每句话的权重,重复这样的过程,直到句子的权重不再变化为止;    (3)从没有成为文摘中的句子中抽出权重最大的一句加入文摘,并将剩下的句子去掉与摘出的句子冗余的信息;    重复步骤(1)-(3),直到得到的文摘符合用户要求的长度为止。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄萱菁赵林吴中勤刘菲
申请(专利权)人:复旦大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1