【技术实现步骤摘要】
用于输出信息的方法和装置
本申请实施例涉及计算机
,具体涉及自然语言处理
,尤其涉及用于输出信息的方法和装置。
技术介绍
情感评论观点挖掘的主要目的是抽取用户评论文本中的情感观点信息。对于给定的产品(包括商品和服务)的用户评论文本,自动分析评论关注的维度信息和评论观点,从而帮助商家进行产品分析,并辅助用户进行消费决策。
技术实现思路
本申请实施例提出了用于输出信息的方法和装置。第一方面,本申请实施例提供了一种用于输出信息的方法,包括:获取针对目标物品的待匹配的用户评论文本;获取预先挖掘出的、针对目标物品所属类别的物品的评论标签集合;在评论标签集合中选取与用户评论文本相匹配的评论标签;输出所选取出的评论标签。在一些实施例中,评论标签集合中的评论标签包括对象词和针对对象词所指示的对象的评价词;以及在评论标签集合中选取与用户评论文本相匹配的评论标签,包括:将用户评论文本切分成至少一个用户评论短句;针对评论标签集合中的每个评论标签,响应于确定出至少一个用户评论短句中存在包括该评论标签中的对象词和评价词的用户评论短句,选取该评论标签作为与用户评论文本相匹配的评论标签。在一些实施例中,评论标签集合中的评论标签与情感极性相对应,情感极性包括积极和消极;以及在评论标签集合中选取与用户评论文本相匹配的评论标签,包括:针对至少一个用户评论短句中的每个用户评论短句,将该用户评论短句输入到预先建立的第一情感极性预测模型中,得到该用户评论短句的情感极性,其中,第一情感极性预测模型用于表征评论文本与评论文本的情感极性之间的对应关系;针对评论标签集合中的每个评论标签,确定至少一 ...
【技术保护点】
一种用于输出信息的方法,包括:获取针对目标物品的待匹配的用户评论文本;获取预先挖掘出的、针对所述目标物品所属类别的物品的评论标签集合;在所述评论标签集合中选取与所述用户评论文本相匹配的评论标签;输出所选取出的评论标签。
【技术特征摘要】
1.一种用于输出信息的方法,包括:获取针对目标物品的待匹配的用户评论文本;获取预先挖掘出的、针对所述目标物品所属类别的物品的评论标签集合;在所述评论标签集合中选取与所述用户评论文本相匹配的评论标签;输出所选取出的评论标签。2.根据权利要求1所述的方法,其中,所述评论标签集合中的评论标签包括对象词和针对所述对象词所指示的对象的评价词;以及所述在所述评论标签集合中选取与所述用户评论文本相匹配的评论标签,包括:将所述用户评论文本切分成至少一个用户评论短句;针对所述评论标签集合中的每个评论标签,响应于确定出所述至少一个用户评论短句中存在包括该评论标签中的对象词和评价词的用户评论短句,选取该评论标签作为与所述用户评论文本相匹配的评论标签。3.根据权利要求2所述的方法,其中,所述评论标签集合中的评论标签与情感极性相对应,所述情感极性包括积极和消极;以及所述在所述评论标签集合中选取与所述用户评论文本相匹配的评论标签,包括:针对所述至少一个用户评论短句中的每个用户评论短句,将该用户评论短句输入到预先建立的第一情感极性预测模型中,得到该用户评论短句的情感极性,其中,所述第一情感极性预测模型用于表征评论文本与评论文本的情感极性之间的对应关系;针对所述评论标签集合中的每个评论标签,确定所述至少一个用户评论短句中存在的包括该评论标签中的对象词、而不包括该评论标签中的评价词的用户评论短句的情感极性与该评论标签的情感极性是否匹配,若匹配,则选取该评论标签作为与所述用户评论文本相匹配的评论标签。4.根据权利要求1-3之一所述的方法,其中,所述在所述评论标签集合中选取与所述用户评论文本相匹配的评论标签,包括:针对所述评论标签集合中的每个评论标签,基于神经网络的语义匹配技术,确定所述用户评论文本与该评论标签的语义相似度,响应于确定出所述语义相似度大于等于预设语义相似度阈值,选取该评论标签作为与所述用户评论文本相匹配的评论标签。5.根据权利要求1所述的方法,其中,所述评论标签集合中的评论标签包括对象词和针对所述对象词所指示的对象的评价词;以及所述评论标签集合是通过如下步骤挖掘得到的:获取在预设历史时间段内针对属于所述类别的物品的历史评论文本;将所述历史评论文本切分成至少一个候选短句;对所述至少一个候选短句中的每个候选短句进行分词,并确定分词所得到的每个词语的词性;对于所述每个候选短句,在对该候选短句进行分词所得到的词语集合中,选取词性为名词、且字数大于等于第一预设字数的词语作为对象词,选取词性为形容词、且字数大于等于第二预设字数的词语作为针对所选取出的对象词所指示的对象的评价词,并将选取出的对象词与选取出的评价词组合成候选评论标签,基于所述候选评论标签,生成评论标签集合。6.根据权利要求5所述的方法,其中,所述基于所述候选评论标签,生成评论标签集合,包括:对于所述每个候选短句,确定对该候选短句进行分词所得到的各个词语之间的依存关系,并生成用于表征所述依存关系的依存句法树;基于所述依存句法树,从所述候选评论标签中选取满足以下至少一个依存条件的评论标签,并基于所选取出的评论标签,生成评论标签集合:对象词与对象词的依存父节点之间存在预定义的主谓关系;评价词与评价词的依存父节点之间存在预定义的动宾关系。7.根据权利要求6所述的方法,其中,所述基于所选取出的评论标签,生成评论标签集合,包括:将所述选取出的评论标签输入预先建立的第二情感极性预测模型中,得到所述选取出的评论标签的情感极性,其中,所述第二情感极性预测模型用于表征评论标签与评论标签的情感极性之间的对应关系;对情感极性相同的评论标签进行聚类,确定每个簇中所包含的评论标签的数量,并将属于同一簇的评论标签进行合并,得到合并后的评论标签;按照评论标签所属簇中所包含的评论标签的数量由大到小的顺序选取预设数目个合并后的评论标签,生成评论标签集合。8.一种用于输出信息的装置,包括:第一获取单元,配置用于获取针对目标物品的待匹配的用户评论文本;第二获取单元,配置用于获取预先挖掘出的、针对所述目标物品所属类别的物品的评论标签集合;选取单元,配置用于在所述评论标签集...
【专利技术属性】
技术研发人员:刘昊,刘凯,何伯磊,肖欣延,吕亚娟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。