【技术实现步骤摘要】
用于生成信息的方法、装置、设备以及存储介质
本申请涉及计算机
,具体涉及知识图谱、自然语言处理领域,尤其涉及用于生成信息的方法、装置、设备以及存储介质。
技术介绍
随着互联网技术的发展,用户可以接触到海量的文本信息,如新闻资讯、期刊论文、网络日记、研究报告等。基于自动文本摘要技术从文本信息中提取文本摘要已成为用户快速获取文本信息的一个高效的解决方案。自动文本摘要在许多自然语言处理领域中有着非常重要的应用,如新闻标题生成、会议纪要、社交短文本的话题生成、智能客服任务等等。如何生成可读性强的摘要文本变成了炙手可热的研究课题。
技术实现思路
提供了一种用于生成信息的方法、装置、设备以及存储介质。根据第一方面,提供了一种用于生成信息的方法,包括:获取关于目标对象的描述信息;确定上述描述信息中包括的关键词;根据各关键词,确定相关信息;根据上述相关信息,生成上述目标对象的摘要信息。根据第二方面,提供了一种用于生成信息的装置,包括:信息获取单元,被配置成获取关于目标对象的描述信息;关键词确定单元,被配置成 ...
【技术保护点】
1.一种用于生成信息的方法,包括:/n获取关于目标对象的描述信息;/n确定所述描述信息中包括的关键词;/n根据各关键词,确定相关信息;/n根据所述相关信息,生成所述目标对象的摘要信息。/n
【技术特征摘要】
1.一种用于生成信息的方法,包括:
获取关于目标对象的描述信息;
确定所述描述信息中包括的关键词;
根据各关键词,确定相关信息;
根据所述相关信息,生成所述目标对象的摘要信息。
2.根据权利要求1所述的方法,其中,所述描述信息包括问题信息和答案信息,所述关键词包括问题信息中包括的第一关键词和答案信息中包括的第二关键词;以及
所述根据各关键词,确定相关信息,包括:
根据各所述第一关键词、各所述第二关键词,确定各所述第二关键词对应的至少一个分值;
根据所述至少一个分值,从各所述第二关键词中确定出目标关键词;
根据所述目标关键词,确定所述相关信息。
3.根据权利要求2所述的方法,其中,所述根据各所述第一关键词、各所述第二关键词,确定各所述第二关键词对应的至少一个分值,包括:
根据各所述第二关键词之间的相似度,确定各所述第二关键词对应的第一分值;
根据各所述第一关键词与各所述第二关键词之间的关联度,确定各所述第二关键词的第二分值;
根据各所述第二关键词的重要度,确定各所述第二关键词对应的第三分值。
4.根据权利要求3所述的方法,其中,所述根据所述至少一个分值,从各所述第二关键词中确定出目标关键词,包括:
根据所述至少一个分值以及预设的至少一个权重,确定各所述第二关键词的第四分值;
根据所述第四分值以及预设的分值阈值,从各所述第二关键词中确定出目标关键词。
5.根据权利要求1所述的方法,其中,所述确定所述描述信息中包括的关键词,包括:
对所述描述信息进行分词;
基于各分词,确定关键词。
6.根据权利要求5所述的方法,其中,所述基于各分词,确定关键词,包括:
确定各分词的词性;
将词性为名词的分词作为关键词。
7.根据权利要求5所述的方法,其中,所述基于各分词,确定关键词,包括:
对所述各分词进行同义词扩展;
根据所述各分词以及扩展得到的同义词,确定关键词。
8.根据权利要求5所述的方法,其中,所述基于各分词,确定关键词,包括:
根据各分词以及预先建立的知识图谱,确定关键词。
9.根据权利要求5所述的方法,其中,所述描述信息包括评论标签;以及
所述基于各分词,确定关键词,包括:
根据各分词以及所述评论标签,确定关键词。
10.一种用于生成信息的装置,包括:
信息获取单元,被配置成获取关于目标对象的描述信息;
关键词确定单元,被配置成确定所述描述信息中包括的关键词;
信息确定单元,被配置成根据各关键词,确定相关信息;
信息生成单元,被配置成根据所述相关信息,生成所...
【专利技术属性】
技术研发人员:杨天琦,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。