物品摘要自动生成方法、系统、设备及可读存储介质技术方案

技术编号:23149247 阅读:120 留言:0更新日期:2020-01-18 13:32
本发明专利技术公开了一种物品摘要自动生成方法、系统、设备及可读存储介质,所述物品摘要自动生成方法包括:构建一物品类目的属性列表,所述属性列表包括所述物品类目下所有物品的属性及每个属性相应的属性值;爬取包含至少一个所述属性值的所有语句构成语料库;接收输入的所述物品类目下的一目标物品的关键词;从所述属性列表中获取与所述关键词相关联的目标属性值;从所述语料库中获取与所述目标属性值相匹配的匹配语句;根据所述匹配语句生成所述目标物品的摘要。本发明专利技术能够根据输入物品的关键词自动撰写物品的摘要,使得撰写质量得以把控,并且缩短撰写时间,提高写作效率,降低写作成本。

Automatic generation method, system, equipment and readable storage medium of article summary

【技术实现步骤摘要】
物品摘要自动生成方法、系统、设备及可读存储介质
本专利技术属于信息处理
,尤其涉及一种物品摘要自动生成方法、系统、设备及可读存储介质。
技术介绍
通常互联网网站会设定一些专栏或频道向用户展示或推荐产品,如发现好货、会买专辑等。为了吸引用户,对于产品会添加标题、图片以及文字描述,本专利技术将这一文字描述称为摘要。现阶段,摘要通常是由人工撰写完成的,由于人工撰写的水平参差不齐,所以撰写质量难以把控,需要专门的人员进行审核,另外,人工撰写耗时长,成本高。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中人工撰写产品信息时撰写质量难以把控、耗时较长、成本较高的缺陷,提供一种物品摘要自动生成方法、系统、设备及可读存储介质。本专利技术是通过下述技术方案来解决上述技术问题:一种物品摘要自动生成方法,所述物品摘要自动生成方法包括:构建一物品类目的属性列表,所述属性列表包括所述物品类目下所有物品的属性及每个属性相应的属性值;爬取包含至少一个所述属性值的所有语句构成语料库;接收输入的所述物品类目下的一目标物品的关键词;从所述属性列表中获取与所述关键词相关联的目标属性值;从所述语料库中获取与所述目标属性值相匹配的匹配语句;根据所述匹配语句生成所述目标物品的摘要。较佳地,所述从所述语料库中获取与所述目标属性值相匹配的匹配语句的步骤具体包括:从所述语料库中获取包含所述目标属性值的语句作为候选语句;对每个候选语句进行打分得到所述每个候选语句的得分;根据所述属性列表检测每个候选语句包含的属性的个数;根据属性个数大小将所述候选语句进行降序排列;根据得分大小将属性个数相同的候选语句进行降序排列;从排序后的候选语句中选取排序靠前的若干候选语句作为所述匹配语句;所述根据所述匹配语句生成所述目标物品的摘要的步骤具体包括:依次选取所述匹配语句组合形成所述摘要,直至所述摘要的字数达到预设字数。较佳地,所述从排序后的候选语句中选取排序靠前的若干候选语句作为所述匹配语句的步骤具体包括:从排序后的候选语句中选取排序第一的语句作为第一匹配语句;所述匹配语句包括所述第一匹配语句;从排序后的候选语句中依次选取下一排序的语句与所述第一匹配语句进行相似度计算,直至所述相似度小于预设相似度;将第一个与所述第一匹配语句相似度小于预设相似度的语句作为第二匹配语句,然后继续选取下一匹配语句;所述匹配语句包括所述第二匹配语句。较佳地,所述对每个候选语句进行打分得到所述每个候选语句的得分的步骤具体包括:预设一语句模板库,所述语句模板库中存储有多个语句模板;计算所述每个候选语句与所述语句模板的相似度分值;基于NLP(自然语言处理)算法分别对所述每个候选语句的词法、句法结构和情感值进行计算得到第一分值、第二分值和第三分值;基于PPL(困惑度)算法对所述每个候选语句的语言困惑度进行计算得到第四分值;分别为所述相似度分值、所述第一分值、所述第二分值、所述第三分值和所述第四分值赋予对应的权重;将所述相似度分值、所述第一分值、所述第二分值、所述第三分值和所述第四分值加权求和得到所述每个候选语句的得分。较佳地,所述从所述语料库中获取包含所述目标属性值的语句作为候选语句的步骤之后,所述物品摘要自动生成方法还包括:基于CNN(卷积神经网络)算法对所述候选语句进行清洗;所述对每个候选语句进行打分得到所述每个候选语句的得分的步骤中,对清洗后的候选语句进行打分。较佳地,所述基于CNN算法对所述候选语句进行清洗的步骤具体包括:检测每个候选语句中是否包含相斥的属性值,若否,则滤除包含相斥属性值的候选语句。一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的物品摘要自动生成方法。一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的物品摘要自动生成方法的步骤。一种物品摘要自动生成系统,所述物品摘要自动生成系统包括属性列表构建模块、语句爬取模块、关键词接收模块、目标属性值获取模块、匹配语句获取模块和摘要生成模块;所述属性列表构建模块用于构建一物品类目的属性列表,所述属性列表包括所述物品类目下所有物品的属性及每个属性相应的属性值;所述语句爬取模块用于爬取包含至少一个所述属性值的所有语句构成语料库;所述关键词接收模块用于接收输入的所述物品类目下的一目标物品的关键词;所述目标属性值获取模块用于从所述属性列表中获取与所述关键词相关联的目标属性值;所述匹配语句获取模块用于从所述语料库中获取与所述目标属性值相匹配的匹配语句;所述摘要生成模块用于根据所述匹配语句生成所述目标物品的摘要。较佳地,所述匹配语句获取模块包括候选语句获取单元、打分单元、检测单元、排序单元和匹配语句选取单元;所述候选语句获取单元用于从所述语料库中获取包含所述目标属性值的语句作为候选语句;所述打分单元用于对每个候选语句进行打分得到所述每个候选语句的得分;所述检测单元用于根据所述属性列表检测每个候选语句包含的属性的个数;所述排序单元用于根据属性个数大小将所述候选语句进行降序排列,还用于根据得分大小将属性个数相同的候选语句进行降序排列;所述匹配语句选取单元用于从排序后的候选语句中选取排序靠前的若干候选语句作为所述匹配语句;所述摘要生成模块用于依次选取所述匹配语句组合形成所述摘要,直至所述摘要的字数达到预设字数。较佳地,所述匹配语句获取模块还包括相似度计算单元;所述匹配语句选取单元用于从排序后的候选语句中选取排序第一的语句作为第一匹配语句;所述匹配语句包括所述第一匹配语句;所述相似度计算单元用于从排序后的候选语句中依次选取下一排序的语句与所述第一匹配语句进行相似度计算,直至所述相似度小于预设相似度;所述匹配语句选取单元还用于将第一个与所述第一匹配语句相似度小于预设相似度的语句作为第二匹配语句,然后继续选取下一匹配语句;所述匹配语句包括所述第二匹配语句。较佳地,所述物品摘要自动生成系统还包括一语句模板库,所述语句模板库中存储有多个语句模板,所述匹配语句获取模块还包括分值计算单元;所述分值计算单元用于计算所述每个候选语句与所述语句模板的相似度分值,还用于基于NLP算法分别对所述每个候选语句的词法、句法结构和情感值进行计算得到第一分值、第二分值和第三分值,还用于基于PPL算法对所述每个候选语句的语言困惑度进行计算得到第四分值;所述权重赋予单元用于分别为所述相似度分值、所述第一分值、所述第二分值、所述第三分值和所述第四分值赋予对应的权重;所述打分单元用于将所述相似度分值、所述第一分值、所述第二分值、所述第三分值和所述第四分值加权求和得到所述每个候选本文档来自技高网...

【技术保护点】
1.一种物品摘要自动生成方法,其特征在于,所述物品摘要自动生成方法包括:/n构建一物品类目的属性列表,所述属性列表包括所述物品类目下所有物品的属性及每个属性相应的属性值;/n爬取包含至少一个所述属性值的所有语句构成语料库;/n接收输入的所述物品类目下的一目标物品的关键词;/n从所述属性列表中获取与所述关键词相关联的目标属性值;/n从所述语料库中获取与所述目标属性值相匹配的匹配语句;/n根据所述匹配语句生成所述目标物品的摘要。/n

【技术特征摘要】
1.一种物品摘要自动生成方法,其特征在于,所述物品摘要自动生成方法包括:
构建一物品类目的属性列表,所述属性列表包括所述物品类目下所有物品的属性及每个属性相应的属性值;
爬取包含至少一个所述属性值的所有语句构成语料库;
接收输入的所述物品类目下的一目标物品的关键词;
从所述属性列表中获取与所述关键词相关联的目标属性值;
从所述语料库中获取与所述目标属性值相匹配的匹配语句;
根据所述匹配语句生成所述目标物品的摘要。


2.如权利要求1所述的物品摘要自动生成方法,其特征在于,所述从所述语料库中获取与所述目标属性值相匹配的匹配语句的步骤具体包括:
从所述语料库中获取包含所述目标属性值的语句作为候选语句;
对每个候选语句进行打分得到所述每个候选语句的得分;
根据所述属性列表检测每个候选语句包含的属性的个数;
根据属性个数大小将所述候选语句进行降序排列;
根据得分大小将属性个数相同的候选语句进行降序排列;
从排序后的候选语句中选取排序靠前的若干候选语句作为所述匹配语句;
所述根据所述匹配语句生成所述目标物品的摘要的步骤具体包括:
依次选取所述匹配语句组合形成所述摘要,直至所述摘要的字数达到预设字数。


3.如权利要求2所述的物品摘要自动生成方法,其特征在于,所述从排序后的候选语句中选取排序靠前的若干候选语句作为所述匹配语句的步骤具体包括:
从排序后的候选语句中选取排序第一的语句作为第一匹配语句;所述匹配语句包括所述第一匹配语句;
从排序后的候选语句中依次选取下一排序的语句与所述第一匹配语句进行相似度计算,直至所述相似度小于预设相似度;
将第一个与所述第一匹配语句相似度小于预设相似度的语句作为第二匹配语句,然后继续选取下一匹配语句;所述匹配语句包括所述第二匹配语句。


4.如权利要求2所述的物品摘要自动生成方法,其特征在于,所述对每个候选语句进行打分得到所述每个候选语句的得分的步骤具体包括:
预设一语句模板库,所述语句模板库中存储有多个语句模板;
计算所述每个候选语句与所述语句模板的相似度分值;
基于NLP算法分别对所述每个候选语句的词法、句法结构和情感值进行计算得到第一分值、第二分值和第三分值;
基于PPL算法对所述每个候选语句的语言困惑度进行计算得到第四分值;
分别为所述相似度分值、所述第一分值、所述第二分值、所述第三分值和所述第四分值赋予对应的权重;
将所述相似度分值、所述第一分值、所述第二分值、所述第三分值和所述第四分值加权求和得到所述每个候选语句的得分。


5.如权利要求2所述的物品摘要自动生成方法,其特征在于,所述从所述语料库中获取包含所述目标属性值的语句作为候选语句的步骤之后,所述物品摘要自动生成方法还包括:
基于CNN算法对所述候选语句进行清洗;
所述对每个候选语句进行打分得到所述每个候选语句的得分的步骤中,对清洗后的候选语句进行打分。


6.如权利要求5所述的物品摘要自动生成方法,其特征在于,所述基于CNN算法对所述候选语句进行清洗的步骤具体包括:
检测每个候选语句中是否包含相斥的属性值,若否,则滤除包含相斥属性值的候选语句。


7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的物品摘要自动生成方法。


8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要...

【专利技术属性】
技术研发人员:简晓容佘志东张震涛江丹丹张亮解佃亮
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1