标签信息确定方法、装置、服务器及存储介质制造方法及图纸

技术编号:28055421 阅读:34 留言:0更新日期:2021-04-14 13:24
本申请属于通信技术领域,具体而言,涉及一种标签信息确定方法、装置、服务器及存储介质。其中,一种标签信息确定方法,包括:获取评论文本对应的语句集合;获取所述语句集合中每个语句对应的类别信息,获取目标类别信息对应的至少一个语句的关键词信息;其中,所述目标类型信息为所述每个语句对应的类别信息中的任意一个;基于所述类别信息和所述至少一个语句的关键词信息,确定所述评论文本的标签信息。采用本申请可以在提高标签信息确定准确性的同时减少标签信息的标注成本。的同时减少标签信息的标注成本。的同时减少标签信息的标注成本。

【技术实现步骤摘要】
标签信息确定方法、装置、服务器及存储介质


[0001]本申请属于通信
,具体而言,涉及一种标签信息确定方法、装置、服务器及存储介质。

技术介绍

[0002]随着信息社会的不断发展,用户会使用标签信息对文本进行标注。标签信息用于表示文本的重点信息。例如用户获取到文本之后,根据文本所表达的意思,用户可以手动设置该文本的标签信息,以方便查看。用户设置文本的标签信息时,用户可以通过设置文本的格式设置文本的标签信息,或者直接将文本的其中一个语句设置为文本的标签信息。

技术实现思路

[0003]本申请实施例提供一种标签信息确定方法、装置、服务器及存储介质,可以在提高标签信息确定准确性的同时减少标签信息的标注成本。本申请实施例的技术方案如下:
[0004]第一方面,本申请实施例提供一种标签信息确定方法,所述方法包括:
[0005]获取评论文本对应的语句集合;
[0006]获取所述语句集合中每个语句对应的类别信息,获取目标类别信息对应的至少一个语句的关键词信息;其中,所述目标类型信息为所述每个语句对应的类别信息中的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标签信息确定方法,其特征在于,所述方法包括:获取评论文本对应的语句集合;获取所述语句集合中每个语句对应的类别信息,获取目标类别信息对应的至少一个语句的关键词信息;其中,所述目标类型信息为所述每个语句对应的类别信息中的任意一个;基于所述类别信息和所述至少一个语句的关键词信息,确定所述评论文本的标签信息。2.根据权利要求1所述的方法,其特征在于,所述获取目标类别信息对应的至少一个语句的关键词信息,包括:采用文本分类模型获取所述目标类别信息对应的至少一个语句;采用关键词提取算法对所述至少一个语句进行关键词提取,得到所述至少一个语句的关键词信息。3.根据权利要求2所述的方法,其特征在于,所述采用文本分类模型获取所述每个类别信息对应的至少一个语句之前,还包括:获取训练样本集合和验证样本集合;采用所述训练样本集合对原始文本分类模型进行训练,得到所述原始文本分类模型;采用所述验证样本集合对所述原始文本分类模型进行验证,得到所述文本分类模型。4.根据权利要求1所述的方法,其特征在于,所述基于所述类别信息和所述至少一个语句的关键词信息,确定所述评论文本的标签信息,包括:获取所述至少一个语句的关键词信息对应的向量;对所述向量进行聚类处理,获取每个类别信息对应的聚类中心;其中,一个类别信息对应至少一个聚类中心;基于所述至少一个聚类中心,确定所述评论文本的标签信息。5.根据权利要求4所述的方法,其特征在于,所述基于所述至少一个聚类中心,确定所述评论文本的标签信息,包括:获取目标聚类中心对应的关键词信息的词频;其中,所述目标聚类中心为所述至少一个聚类中心中任意一个;获取所述目标聚...

【专利技术属性】
技术研发人员:马文康李理包英泽
申请(专利权)人:北京大米科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1