基于自然语言处理的信息生成方法和装置制造方法及图纸

技术编号:21799347 阅读:23 留言:0更新日期:2019-08-07 10:33
本申请实施例公开了信息生成方法和装置。该方法的一具体实施方式包括:获取用户对物品进行评价的原始评价语句;基于预设的情感词表,确定出原始评价语句中的情感词;确定出原始评价语句中的目的词;基于各目的词和情感词的关联关系,生成评价列表,其中,评价列表中关联存储有各目的词以及与各目的词关联的情感词。该实施方式有利于所生成的信息的准确性。

Information Generation Method and Device Based on Natural Language Processing

【技术实现步骤摘要】
基于自然语言处理的信息生成方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及基于自然语言处理的信息生成方法和装置。
技术介绍
信息获取,是指围绕一定目标,在一定范围内,通过一定的技术手段和方式方法获得信息的活动和过程。获取信息的途径不是单一的,是多种多样的。信息获取的准确性将对应用所获取的信息的操作产生相当的影响。例如,从用户对某一物品的原始评价语句中获取并生成的评价信息的准确程度,将影响到利用该评价信息进行的用户建模等的准确程度。
技术实现思路
本申请实施例提出了基于自然语言处理的信息生成方法和装置。第一方面,本申请实施例提供了一种基于自然语言处理的信息生成方法,该方法包括:获取用户对物品进行评价的原始评价语句;基于预设的情感词表,确定出原始评价语句中的情感词;确定出原始评价语句中的目的词;基于各目的词和情感词的关联关系,生成评价列表,其中,评价列表中关联存储有各目的词以及与各目的词关联的情感词。在一些实施例中,预设的情感词表包括多个预设的情感词以及与各预设的情感词相对应的情感倾向标识值;在基于预设的情感词表,确定出原始评价语句中的情感词之后,方法还包括:确定出原始评价语句中的各情感词的情感倾向标识值;以及生成评价键值对,其中,各评价键值对的键为各目的词,各评价键值对的值基于与该键值对的目的词关联的情感词的情感倾向标识值确定。在一些实施例中,在基于预设的情感词表,确定出原始评价语句中的情感词之前,方法还包括:生成原始评价语句的语法分析树,其中,语法分析树包括一个根节点、至少一个与原始评价语句所包含的分句一一对应的中间节点,各中间节点包括与该中间节点所对应的分句中的各分词一一对应的叶节点;基于各目的词和情感词的关联关系,生成评价列表,包括:响应于目的词和情感词属于同一个中间节点,确定该目的词和该情感词具有关联关系。在一些实施例中,基于各目的词和情感词的关联关系,生成评价列表,包括:若其中一个中间节点仅存在情感词不存在目的词,则确定与该中间节点相邻的中间节点中的目的词与该中间节点中的情感词具有关联关系。在一些实施例中,生成评价键值对包括:判断中间节点是否包含奇数个否定词,若是,则将该中间节点所包含的情感词的情感标识值取反,作为与该情感词关联的评价键值对的值。在一些实施例中,生成评价键值对,包括:判断同一中间节点下,是否同时存在情感词和程度词;若是,则基于预设的程度词与程度等级的关联关系,调整该情感词的情感倾向标识值。在一些实施例中,方法还包括:对于同一物品,合并与各原始评价语句对应的评价列表以生成物品评价列表;其中,物品评价列表中关联存储有各目的词和从各原始评价语句中确定出的与该目的词关联的情感词。在一些实施例中,方法还包括:获取针对同一物品的评价键值对;对具有相同键的键值对进行合并,生成至少一个合并键值对,其中,合并键值对的值为具有相同键的各键值对的值之和。在一些实施例中,方法还包括:按照合并键值对的值的绝对值降序排列的方式向终端呈现针对同一物品的各合并键值对。第二方面,本申请实施例还提供了一种基于自然语言处理的信息生成装置,包括:获取单元,配置用于获取用户对物品进行评价的原始评价语句;情感词确定单元,配置用于基于预设的情感词表,确定出原始评价语句中的情感词;目的词确定单元,配置用于确定出原始评价语句中的目的词;生成单元,配置用于基于各目的词和情感词的关联关系,生成评价列表,其中,评价列表中关联存储有各目的词以及与各目的词关联的情感词。在一些实施例中,预设的情感词表包括多个预设的情感词以及与各预设的情感词相对应的情感倾向标识值;装置还包括:确定单元,配置用于在基于预设的情感词表,确定出原始评价语句中的情感词之后,确定出原始评价语句中的各情感词的情感倾向标识值;以及生成单元还配置用于生成评价键值对,其中,各评价键值对的键为各目的词,各评价键值对的值基于与该键值对的目的词关联的情感词的情感倾向标识值确定。在一些实施例中,装置还包括:语法分析树生成单元,配置用于在情感词确定单元基于预设的情感词表,确定出原始评价语句中的情感词之前,生成原始评价语句的语法分析树,其中,语法分析树包括一个根节点、至少一个与原始评价语句所包含的分句一一对应的中间节点,各中间节点包括与该中间节点所对应的分句中的各分词一一对应的叶节点;生成单元进一步配置用于:响应于目的词和情感词属于同一个中间节点,确定该目的词和该情感词具有关联关系。在一些实施例中,生成单元进一步配置用于:若其中一个中间节点仅存在情感词不存在目的词,则确定与该中间节点相邻的中间节点中的目的词与该中间节点中的情感词具有关联关系。在一些实施例中,生成单元进一步配置用于:判断中间节点是否包含奇数个否定词,若是,则将该中间节点所包含的情感词的情感标识值取反,作为与该情感词关联的评价键值对的值。在一些实施例中,生成单元进一步配置用于:判断同一中间节点下,是否同时存在情感词和程度词;若是,则基于预设的程度词与程度等级的关联关系,调整该情感词的情感倾向标识值。在一些实施例中,生成单元进一步配置用于:对于同一物品,合并与各原始评价语句对应的评价列表以生成物品评价列表;其中,物品评价列表中关联存储有各目的词和从各原始评价语句中确定出的与该目的词关联的情感词。在一些实施例中,装置还包括:合并单元,配置用于获取针对同一物品的评价键值对;对具有相同键的键值对进行合并,生成至少一个合并键值对,其中,合并键值对的值为具有相同键的各键值对的值之和。在一些实施例中,装置还包括:呈现单元,配置用于按照合并键值对的值的绝对值降序排列的方式向终端呈现针对同一物品的各合并键值对。第三方面,本申请实施例还提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面任一的方法。第四方面,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面任一的方法。本申请实施例提供的基于自然语言处理的信息生成方法和装置,通过获取用户对物品进行评价的原始评价语句,并基于预设的情感词表,确定出原始评价语句中的情感词,再确定出原始评价语句中的目的词,最后基于各目的词和情感词的关联关系,生成评价列表,有利于所生成的信息的准确性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的信息生成方法的一个实施例的流程图;图3是根据本申请的信息生成方法的一个应用场景的示意图;图4是根据本申请的信息生成方法的又一个实施例的流程图;图5是语法分析树的一个示意图;图6是根据本申请的信息生成装置的一个实施例的结构示意图;图7是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合本文档来自技高网...

【技术保护点】
1.一种基于自然语言处理的信息生成方法,包括:获取用户对物品进行评价的原始评价语句;基于预设的情感词表,确定出所述原始评价语句中的情感词;确定出所述原始评价语句中的目的词;基于各目的词和情感词的关联关系,生成评价列表,其中,所述评价列表中关联存储有各目的词以及与各所述目的词关联的情感词。

【技术特征摘要】
1.一种基于自然语言处理的信息生成方法,包括:获取用户对物品进行评价的原始评价语句;基于预设的情感词表,确定出所述原始评价语句中的情感词;确定出所述原始评价语句中的目的词;基于各目的词和情感词的关联关系,生成评价列表,其中,所述评价列表中关联存储有各目的词以及与各所述目的词关联的情感词。2.根据权利要求1所述的方法,其中,所述预设的情感词表包括多个预设的情感词以及与各所述预设的情感词相对应的情感倾向标识值;在所述基于预设的情感词表,确定出所述原始评价语句中的情感词之后,所述方法还包括:确定出所述原始评价语句中的各情感词的情感倾向标识值;以及生成评价键值对,其中,各所述评价键值对的键为各目的词,各所述评价键值对的值基于与该键值对的目的词关联的情感词的情感倾向标识值确定。3.根据权利要求2所述的方法,其中,在所述基于预设的情感词表,确定出所述原始评价语句中的情感词之前,所述方法还包括:生成所述原始评价语句的语法分析树,其中,所述语法分析树包括一个根节点、至少一个与所述原始评价语句所包含的分句一一对应的中间节点,各所述中间节点包括与该中间节点所对应的分句中的各分词一一对应的叶节点;所述基于各目的词和情感词的关联关系,生成评价列表,包括:响应于目的词和情感词属于同一个中间节点,确定该目的词和该情感词具有所述关联关系。4.根据权利要求3所述的方法,其中,所述基于各目的词和情感词的关联关系,生成评价列表,包括:若其中一个中间节点仅存在情感词不存在目的词,则确定与该中间节点相邻的中间节点中的目的词与该中间节点中的情感词具有所述关联关系。5.根据权利要求3所述的方法,其中,所述生成评价键值对包括:判断中间节点是否包含奇数个否定词,若是,则将该中间节点所包含的情感词的情感标识值取反,作为与该情感词关联的评价键值对的值。6.根据权利要求3所述的方法,其中,所述生成评价键值对,包括:判断同一中间节点下,是否同时存在情感词和程度词;若是,则基于预设的程度词与程度等级的关联关系,调整该情感词的情感倾向标识值。7.根据权利要求2所述的方法,其中,所述方法还包括:对于同一物品,合并与各原始评价语句对应的评价列表以生成物品评价列表;其中,所述物品评价列表中关联存储有各目的词和从各原始评价语句中确定出的与该目的...

【专利技术属性】
技术研发人员:李雨霜罗超薛韬
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1