评价关系的生成方法及相关装置制造方法及图纸

技术编号:21060329 阅读:41 留言:0更新日期:2019-05-08 07:03
本发明专利技术公开了一种评价关系的生成方法及相关装置,该评价关系的生成方法,包括:将评价文本中的评价信息标注上对应的标签,得到标签序列;对于标签序列中每一个被标注为第一标签的评价信息,判断该评价信息在第一词序列中被标记为评价对象的概率是否大于阈值;其中,第一标签用于表明评价信息为无含义的词语;第一词序列包括:被标注为第一标签的评价信息、以及被标注为第一标签的评价信息在标签序列中的前后n个评价信息,n为自然数;若是,则调整相应评价信息对应的标签为第二标签;其中,第二标签用于表明评价信息为评价对象;依据标签间的搭配关系,建立调整标签后的标签序列中评价信息间的评价关系。

Generation Method and Related Devices of Evaluation Relations

【技术实现步骤摘要】
评价关系的生成方法及相关装置
本专利技术涉及信息处理
,尤其涉及一种评价关系的生成方法及相关装置。
技术介绍
随着互联网的快速发展,越来越多的人会在网上发表自身对人、事或者物的评价。网络上会出现大量含有个人观点的评价文本。因此,如何解析评价文件,构建出评价文件中评价信息间的评价关系,是信息处理领域的一个研究热点。目前,在得到评价关系的过程中,需要先抽取评价文本中的评价信息,并对其进行标注。主要采用序列标注算法,例如:HMM(隐马尔可夫模型,英文:HiddenMarkovModel)、CRF(条件随机场算法,英文:conditionalrandomfieldalgorithm)、RNN(多层反馈网络,英文:RecurrentNeuralNetwork)等。但是,受评价信息所使用的自然语言的语言表达的复杂性、序列标注算法中所采用的标注模型的训练数据标注质量问题以及训练特征不均衡等的影响,会导致评价文本中的属于评价对象的评价信息无法被完全抽取,影响评价关系的完整构建。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的评价关系的生成方法及相关本文档来自技高网...

【技术保护点】
1.一种评价关系的生成方法,其特征在于,包括:将评价文本中的评价信息标注上对应的标签,得到标签序列;对于所述标签序列中每一个被标注为第一标签的评价信息,判断该评价信息在第一词序列中被标记为评价对象的概率是否大于阈值;其中,所述第一标签用于表明评价信息为无含义的词语;所述第一词序列包括:所述被标注为第一标签的评价信息、以及所述被标注为第一标签的评价信息在所述标签序列中的前后n个评价信息,n为自然数;若是,则调整相应评价信息对应的标签为第二标签;其中,所述第二标签用于表明评价信息为评价对象;依据标签间的搭配关系,建立调整标签后的所述标签序列中评价信息间的评价关系。

【技术特征摘要】
1.一种评价关系的生成方法,其特征在于,包括:将评价文本中的评价信息标注上对应的标签,得到标签序列;对于所述标签序列中每一个被标注为第一标签的评价信息,判断该评价信息在第一词序列中被标记为评价对象的概率是否大于阈值;其中,所述第一标签用于表明评价信息为无含义的词语;所述第一词序列包括:所述被标注为第一标签的评价信息、以及所述被标注为第一标签的评价信息在所述标签序列中的前后n个评价信息,n为自然数;若是,则调整相应评价信息对应的标签为第二标签;其中,所述第二标签用于表明评价信息为评价对象;依据标签间的搭配关系,建立调整标签后的所述标签序列中评价信息间的评价关系。2.根据权利要求1所述的方法,其特征在于,所述将评价文本中的评价信息标注上对应的标签,得到标签序列,包括:对所述评价文本进行分词处理,得到所述评价文本包括的评价信息;识别所述评价信息的属性特征,确定所述评价信息的属性特征对应的标签;为所述评价文本包括的评价信息分别添加其属性特征对应的标签,得到所述标签序列。3.根据权利要求1或2所述的方法,其特征在于,还包括:对于所述标签序列中每一个被标注为所述第二标签的评价信息,判断该评价信息的第二词序列中是否存在概率大于阈值的情感词;其中,所述第二词序列包括:所述被标注为第二标签的评价信息、以及所述被标注为第二标签在所述标签序列中的前后n个评价信息,n为自然数;若是,则调整所述情感词对应标签为第三标签;其中,所述第三标签用于表明评价信息属于评价对象的情感词。4.根据权利要求1或2所述的方法,其特征在于,还包括:对于所述标签序列中每一个被标注为第四标签的评价信息,判断该评价信息的第三词序列中,是否存在概率大于阈值的属性词;其中,所述第四标签用于表明评价信息为情感词;所述第三词序列包括:所述被标注为第四标签的评价信息、以及所述被标注为第四标签的评价信息在所述标签序列中的前后n个评价信息,n为自然数;若是,则调整所述属性词对应的标签为所述第二标签,且调整所述第三词序列中被标注为所述第四标签的评价信息对应的标签为所述第三标签。5.根据权利要求1或2所述的方法,其特征在于,还包括:对于所述标签序列中的每一个被标注为所述第三标签或者所述第四标签评价信息,判断该评价信息的第四词序列中,是否存在概率大于阈值的修饰词语;其中,所述第四词序列包括所述被标注为所述第三标签或者所述第四标签的评价信息、以及所述被标注为所述第三标签或者所述第四标签的评价信息在所述标签序列中的前后n个评价信息,n为自然数;若是,则调整所述...

【专利技术属性】
技术研发人员:韩旭红
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1