单文档摘要生成方法技术

技术编号:8765583 阅读:351 留言:0更新日期:2013-06-07 22:54
本发明专利技术公开了一种单文档摘要生成方法,包括步骤:对待摘要文档的段落进行聚类,每一个类别为一个语义块;计算语义块内两两句子的相似度,作为一个句子对另一个句子的打分,得分最高的句子为每个语义块中表述该部分核心内容的句子;根据核心句子的出现顺序,连接句子,生成摘要。本发明专利技术的方法将词的相似度和命名实体识别引入单文档摘要中,提高摘要的提取精度,同时利用了single-pass提高了的聚类的速度,能够准确的提取单文档摘要,对于新闻类型和公告类型的文档具有非常高的摘要准确率。

【技术实现步骤摘要】

【技术保护点】
一种单文档摘要生成方法,具体包括如下步骤:S1.对待摘要文档的段落进行聚类,每一个类别为一个语义块;S2.计算语义块内两两句子的相似度,作为一个句子对另一个句子的打分,得分最高的句子为每个语义块中表述该部分内容的核心句子;S3.根据核心句子的出现顺序,连接句子,生成摘要。

【技术特征摘要】

【专利技术属性】
技术研发人员:薛世帅郭成林彭春林刘红玉高云棋刘丹
申请(专利权)人:宁波成电泰克电子信息技术发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1