基于关键词进行消息的自动分类制造技术

技术编号:45036364 阅读:26 留言:0更新日期:2025-04-18 17:18
本公开内容公开了基于关键词进行消息的自动分类。向机器学习算法提供电子通信和关键词。从机器学习算法接收相似性度量。相似性度量指示电子通信与关键词之间的相似性。根据相似性度量对电子通信进行聚类。根据假正电子通信与第一簇中包括关键词的电子通信之间的距离之和以及假正电子通信与第一簇中不包括关键词的电子通信之间的距离之和,从第一簇中移除假正电子通信。根据假负电子通信与第一簇中包括关键词的电子通信之间的距离之和以及假负电子通信与第一簇中不包括关键词的电子通信之间的距离之和,将假负电子通信添加至第一簇。

【技术实现步骤摘要】

本文所描述的实施方式总体上涉及基于关键词进行消息的自动分类,并且在实施方式中,但是并非通过限制的方式,涉及使用机器学习算法基于关键词对消息进行自动分类。


技术介绍

1、典型的业务人员接收大量呈电子邮件、聊天和其他电子消息形式的消息。这些人中的大多数人没有时间将这些消息分类并组织到适当的类别、文件夹和/或文件中,诸如按照业务中各个项目来组织这些通信。可以使用常规的机器学习对这些消息进行分类,但是常规的机器学习技术需要为每个用户创建专用模型以理解哪些消息属于特定的项目或类别。该方法需要大量的数据、来自每个用户的监督学习以及大量的本地处理。出于这些原因,常规方法是不实用的。

2、目前,长短期记忆(lstm)和变换器(transformer)神经网络是用于对文档进行分类的主要方法。然而,类似地,这些方法需要一组原始句子及其标签作为训练数据。这些方法在对互联网文章进行分类时可能效果很好,因为有大量的数据来识别这些文章以及适当的标签。然而,准备特定于个体的分类器是不切实际的,因为准备单个分类器需要大量的训练数据和用于训练的处理资源。p>

本文档来自技高网...

【技术保护点】

1.一种计算机化过程,包括:

2.根据权利要求1所述的计算机化过程,其中,所述机器学习算法是未经训练的机器学习算法。

3.根据权利要求1所述的计算机化过程,其中,所述机器学习算法理解模糊语言。

4.根据权利要求1所述的计算机化过程,其中,所述机器学习算法包括基于变换器的双向编码器表示BERT模型。

5.根据权利要求1所述的计算机化过程,包括:将提供给所述机器学习算法的电子通信的一部分存储在第一向量中,以及将提供给所述机器学习算法的关键词存储在第二向量中。

6.根据权利要求1所述的计算机化过程,其中,所述电子通信包括电子邮件、聊天...

【技术特征摘要】

1.一种计算机化过程,包括:

2.根据权利要求1所述的计算机化过程,其中,所述机器学习算法是未经训练的机器学习算法。

3.根据权利要求1所述的计算机化过程,其中,所述机器学习算法理解模糊语言。

4.根据权利要求1所述的计算机化过程,其中,所述机器学习算法包括基于变换器的双向编码器表示bert模型。

5.根据权利要求1所述的计算机化过程,包括:将提供给所述机器学习算法的电子通信的一部分存储在第一向量中,以及将提供给所述机器学习算法的关键词存储在第二向量中。

6.根据权利要求1所述的计算机化过程,其中,所述电子通信包括电子邮件、聊天和文本中的一个或更多个。

7.一种非暂态机器可读介质,所述非暂态机器可读介质包括指令,所述指令在由处理器执行时执行过程,所述过程包括:

8.根据权利要求7所述的非暂态机器可读介质,其中,所述机器学习算法是未经训练的机器学习算法。

9.根据权利要求7所述的非暂态机器可读介质,其中,所述机器学习算法理解模糊语言。

10.根据权利要求7所述的非暂态机器可读介质,...

【专利技术属性】
技术研发人员:横山欧十郎隅博行吉山典利阿纳塔西奥斯·马尔卡斯
申请(专利权)人:联想新加坡私人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1