对象分类方法及装置制造方法及图纸

技术编号:23161723 阅读:25 留言:0更新日期:2020-01-21 21:59
本申请的实施例提供了一种对象分类方法、装置、计算机可读介质及电子设备。该对象分类方法包括:获取与待分类对象相关联的文本数据,文本数据包括待分类对象的描述数据和搜索数据,搜索数据包括在搜索引擎中搜索待分类对象得到的语料数据;基于预设的主题模型,从所述文本数据中抽取得到文本数据的主题词;根据文本数据的主题词确定待分类对象的类别标签。本申请实施例的技术方案提高了待分类对象文本数据的全面性,增加了主题词提取的数据基础范围,基于人工智能中自然语言处理的文本处理技术,提高了主题词提取的准确度,最后根据主题词确定待分类对象的类别标签,实现对象分类,提高了对象分类的精确性和效率,使得对象分类更加智能化。

Object classification method and device

【技术实现步骤摘要】
对象分类方法及装置
本申请涉及计算机及通信
,具体而言,涉及一种对象分类方法、装置、计算机可读介质及电子设备。
技术介绍
在搜索终端应用产品的过程中,用户通过输入关键词搜索得到想要的产品。但是这种方式要求预先对每个产品打好标签,或者根据产品信息进行分类,以在用户搜索时推出与搜索词条对应的产品。传统的方式是采用人工对产品打标签的方式进行处理,但是在产品数量剧增、产品功能更加全面和多元化的情况下,这种方式成本较大且效率较低。尤其是在人工智能发展迅速的现在,传统的处理方式则显得更加精度低和效率较低,无法跟上同
中的其它相关技术的发展脚步。
技术实现思路
本申请的实施例提供了一种对象分类方法及装置,进而至少在一定程度上可以提高对象分类的精确性和效率。本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。根据本申请实施例的一个方面,提供了一种对象分类方法,包括:获取与待分类对象相关联的文本数据,所述文本数据包括所述待分类对象的描述数据和搜索数据,所述搜索数据包括在搜索引擎中搜索本文档来自技高网...

【技术保护点】
1.一种对象分类方法,其特征在于,包括:/n获取与待分类对象相关联的文本数据,所述文本数据包括所述待分类对象的描述数据和搜索数据,所述搜索数据包括在搜索引擎中搜索所述待分类对象得到的语料数据;/n基于预设的主题模型,从所述文本数据中抽取得到所述文本数据的主题词;/n根据所述文本数据的主题词确定所述待分类对象的类别标签。/n

【技术特征摘要】
1.一种对象分类方法,其特征在于,包括:
获取与待分类对象相关联的文本数据,所述文本数据包括所述待分类对象的描述数据和搜索数据,所述搜索数据包括在搜索引擎中搜索所述待分类对象得到的语料数据;
基于预设的主题模型,从所述文本数据中抽取得到所述文本数据的主题词;
根据所述文本数据的主题词确定所述待分类对象的类别标签。


2.如权利要求1所述对象分类方法,其特征在于,根据所述文本数据的主题词确定所述待分类对象的类别标签之后,还包括:
获取终端发送的搜索词条;
查找与所述搜索词条匹配的目标类别标签,以及所述目标类别标签对应的目标对象;
向所述终端返回所述目标对象的信息。


3.如权利要求1所述对象分类方法,其特征在于,所述获取与待分类对象相关联的文本数据,包括:
获取所述待分类对象相关联的描述数据;
根据预设的词向量模型从所述描述数据中提取出词向量数据,并将所述词向量数据添加至所述文本数据中。


4.如权利要求1所述对象分类方法,其特征在于,基于预设的主题模型,从所述文本数据中抽取得到所述文本数据的主题词,包括:
基于所述预设的主题模型从所述文本数据中抽取得到至少一个主题,并确定所述至少一个主题的概率分布,以及各个主题对应的词概率分布;
基于所述至少一个主题的概率分布和所述各个主题对应的词概率分布,计算所述文本数据对应的关键词概率分布;
根据所述文本数据对应的关键词概率分布,抽取得到所述文本数据的主题词。


5.如权利要求4所述对象分类方法,其特征在于,所述至少一个主题的概率分布为<pt1,···,pti,···,ptk>;
其中,pti=nti/n,pti表示所述文本数据t对应的第i个主题的概率;nti表示所述文本数据中与所述第i个主题对应的词语的数目,n表示所述文本数...

【专利技术属性】
技术研发人员:康战辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1