【技术实现步骤摘要】
本专利技术涉及网络信息处理领域,特别涉及一种商品相关网络信息之自动图文摘要方法及系统。
技术介绍
随着互联网和Web2.0的快速发展,互联网上的信息量每天都在以惊人的速度增长。越来越多的人喜欢在互联网上发表他们对人、事、物的意见,论坛、博客(Blog)、评论网站、微博等都给Web2.0时代的使用者提供了一个发布信息、表达观点的平台,于是互联网上产生了大量的含有个人主观色彩的评论信息。在购买商品前,例如购买3C产品或美妆产品,或到餐厅进行消费等,消费者往往习惯于在网络上搜寻商品的相关信息或评论。然而,网络信息数量繁多、质量好坏不一、完整度不一,不同来源的评论可能意见相左,想要获得较为可靠的评论之总结,就必须浏览与综合许多不同来源的意见。因此,如何自动综合分析网络上对特定商品的评论信息,如何快速提取出有参考价值的信息,以便减轻消费者阅读大量相关评论信息的工作量,并帮助消费者于短时间内判断及做出购买决策,已经成为自然语言处理领域中的一个研究热点。
技术实现思路
有鉴于此,有必要提出一种商品相关网络文章之自动图文摘要系统及方法,以解决上述问题。一种商品相关网络文章之自动图文摘要系统,安装并运行于一服务器中。该自动图文摘要系统包括一信息搜集模块,用于从互联网上搜集网络文章;一信息撷取模块,用于从该信息搜集模块搜集到的网络文章中筛选出与一特定主题的商品相关的网络文章及提取出相应的商品名称,并将该筛选出来的网络文章与相应的商品名称关联后一并存储在一特定主题商品数据库中;以及一影像摘要模块,用于从该特定主题商品数据库中分别获取与各个商品相关的所有网络文章中嵌入的图片,从与各 ...
【技术保护点】
一种商品相关网络文章之自动图文摘要系统,安装并运行于一服务器中,其改良在于:该自动图文摘要系统包括:一信息搜集模块,用于从互联网上搜集网络文章;一信息撷取模块,用于从该信息搜集模块搜集到的网络文章中筛选出与一特定主题的商品相关的网络文章及提取出相应的商品名称,并将该筛选出来的网络文章与相应的商品名称关联后一并存储在一特定主题商品数据库中;以及一影像摘要模块,用于从该特定主题商品数据库中分别获取与各个商品相关的所有网络文章中嵌入的图片,从与各个商品相关的图片中分别筛选出各个商品的代表图片,并将各个商品的代表图片存储于该特定主题商品数据库中。
【技术特征摘要】
1.一种商品相关网络文章之自动图文摘要系统,安装并运行于一服务器中,其改良在于:该自动图文摘要系统包括:一信息搜集模块,用于从互联网上搜集网络文章;一信息撷取模块,用于从该信息搜集模块搜集到的网络文章中筛选出与一特定主题的商品相关的网络文章及提取出相应的商品名称,并将该筛选出来的网络文章与相应的商品名称关联后一并存储在一特定主题商品数据库中;以及一影像摘要模块,用于从该特定主题商品数据库中分别获取与各个商品相关的所有网络文章中嵌入的图片,从与各个商品相关的图片中分别筛选出各个商品的代表图片,并将各个商品的代表图片存储于该特定主题商品数据库中。2.如权利要求1所述的自动图文摘要系统,其特征在于:该信息撷取模块通过下述方式筛选出与一特定主题的商品相关的网络文章及提取出相应的商品名称,并将该筛选出来的网络文章与相应的商品名称关联后一并存储在该特定主题商品数据库中:判断该搜集到的网络文章是否与该特定主题的商品相关;以及以结构化样式规则从与该特定主题的商品相关的网络文章中提取出商品名称,并将该网络文章与相应的商品名称关联后一并存储在该特定主题商品数据库中;或从与该特定主题的商品相关的网络文章的非结构化信息中提取出商品名称,并将该网络文章与相应的商品名称关联后一并存储在该特定主题商品数据库中。3.如权利要求2所述的自动图文摘要系统,其特征在于:该影像摘要模块通过下述方式从与各个商品相关的图片中分别筛选出各个商品的代表图片:针对每一商品,根据预设条件对与该商品相关的所有图片做预过滤;从经过滤后的每一图片中分别撷取影像特征;将从各张图片中撷取出的影像特征提供给一照片选择器,利用该照片选择器给每一张图片评分,并将该评分作为选择代表图片的依据;以及筛选出综合评分最高的图片作为对应的商品的代表图片。4.如权利要求2所述的自动图文摘要系统,其特征在于:该自动图文摘要系统还包括一文字摘要模块,用于从该特定主题商品数据库中分别获取与各个商品相关的所有网络文章中包含的评论信息,根据各个商品的属性特征对与各个商品相关的评论信息分别进行自动摘要及分别生成各个商品的评论摘要信息,并将各个商品的评论摘要信息存储于该特定主题商品数据库中。5.如权利要求4所述的自动图文摘要系统,其特征在于:该文字摘要模块通过下述方式从该特定主题商品数据库中分别获取与各个商品相关的网络文章中的评论信息,根据各个商品的属性特征对与各个商品相关的评论信息分别进行自动摘要:针对每一商品,设定商品的若干个属性类别,对该商品的所有相关评论信息中的每一个句子进行属性分类及相应的情感分类;确定每一属性类别对应的情感分类结果;以及对于每一个属性类别,从归属为该属性类别且情感分类与该情感分类结果相符的所有句子中挑选出现次数最多的特征词与意见词,并利用自然语言生成技术将特征词组合意见词来产生评论摘要。6.如权利要求4所述的自动图文摘要系统,其特征在于:该自动图文摘要系统还包括一查询模块,用于根据从该互联网中接收到的一目标商品的搜寻关键词,从该特定主题商品数据库中搜寻该目标商品的影像摘要信息及评论摘要信息。7.一种商品相关网络文章之自动图文摘要方法,应用于...
【专利技术属性】
技术研发人员:骆宏毅,王智敏,张怡君,胡敏君,
申请(专利权)人:富泰华工业深圳有限公司,鸿海精密工业股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。