一种商品服务分类方法、装置及可读存储介质制造方法及图纸

技术编号:40772401 阅读:20 留言:0更新日期:2024-03-25 20:20
本发明专利技术提供一种商品服务分类方法、装置及可读存储介质,该方法包括:获取待分类的长文本;基于依存句法分析提取所述待分类的长文本的主体内容;将所述待分类的长文本和所述主体内容输入训练好的快速文本分类算法FastText模型进行预测,得到所述待分类的长文本对应的商品服务分类结果。该方法、装置及可读存储介质能够解决现有的文本分类方法不适用于商品服务分类,且存在分类预测准确率低的问题。

【技术实现步骤摘要】

本专利技术涉及互联网,尤其涉及一种商品服务分类方法、装置及可读存储介质


技术介绍

1、随着互联网技术的高速发展,网络中每天都会产生海量的数据,从杂乱的信息中获取有效信息已成为业界的研究热点。文本分类任务是自然语言处理(nlp)领域中最基础的任务之一,其不仅能有效的筛选信息,而且在信息检索、情感分类和自动文摘等方面有着重要的应用,随着人工智能行业的兴起,文本分类也有了更为广泛的应用,如人机通信,问答系统等。

2、近年来,机器学习算法在文本分类中的应用成为自然语言处理的研究热点。然而,现有的文本分类方法虽然取得了较为显著的应用效果,但应用于像商品服务分类这种长文本分类环境时仍存在不足,由于长文本相对于短文本可以提取更多的特征,但也有更多的冗余词语,这些词语多是对分类结果没有正向影响的无关词语,容易影响分类准确率,造成分类预测准确率过低的现象。


技术实现思路

1、本专利技术所要解决的技术问题是针对现有技术的上述不足,提供一种商品服务分类方法、装置及可读存储介质,用以解决现有的文本分类方法不适用于商品服本文档来自技高网...

【技术保护点】

1.一种商品服务分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述主体内容为三元组信息,所述三元组信息包括主语、谓语和宾语。

3.根据权利要求2所述的方法,其特征在于,所述基于依存句法分析提取所述待分类的长文本的主体内容,具体包括:

4.根据权利要求2所述的方法,其特征在于,所述将所述待分类的长文本和所述主体内容输入训练好的快速文本分类算法FastText模型进行预测,得到所述待分类的长文本对应的商品服务分类结果之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于依存句法分析提取所述长...

【技术特征摘要】

1.一种商品服务分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述主体内容为三元组信息,所述三元组信息包括主语、谓语和宾语。

3.根据权利要求2所述的方法,其特征在于,所述基于依存句法分析提取所述待分类的长文本的主体内容,具体包括:

4.根据权利要求2所述的方法,其特征在于,所述将所述待分类的长文本和所述主体内容输入训练好的快速文本分类算法fasttext模型进行预测,得到所述待分类的长文本对应的商品服务分类结果之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于依存句法分析提取所述长文本数据集中每一个长文本的主体内容,具体包括:

6.根据权利要求4所述的方法,其特征在于,所述基于依存句...

【专利技术属性】
技术研发人员:杨捷
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1