基于深度学习的邮件标签方法、系统、设备及存储介质技术方案

技术编号:27097235 阅读:19 留言:0更新日期:2021-01-25 18:36
本发明专利技术提供了基于深度学习的邮件标签方法、系统、设备及存储介质,该方法包括:建立邮件数据队列,采集第一类预设字段的数据消息;当邮件是否为匿名联系用户的预设业务,解析邮件文本内容,抓取第二类预设字段的内容,第二类预设字段至少包括邮件正文;对第二类预设字段的内容进行预处理;基于内容的语种,分别输入到基于不同语言的标签分类模型,获得邮件文本内容对应的标签;根据邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息,发送到预设的处理邮箱。本发明专利技术面对复杂的语义表达,能够有更高的准确率和召回率,便于及时干预酒店违规行为,达到及时保障客人权益和隐私。益和隐私。益和隐私。

【技术实现步骤摘要】
基于深度学习的邮件标签方法、系统、设备及存储介质


[0001]本专利技术涉及邮件标签分类领域,具体地说,涉及基于深度学习的邮件标签方法、系统、设备及存储介质。

技术介绍

[0002]目前酒店通过平台邮件联系客人的过程中,由于缺乏有效的违规监控,出现了大量满房取消、切客、索要客人手机号等酒店违规行为,不仅导致客人无法得到入住权益、隐私安全等保障,而且无故增加了公司的订单损失。现有的方法是通过关键词提取和T+1审核的方式,即业务方根据命中关键词抓取的结果,当天审核前一天的疑似违规邮件,进一步处罚酒店。关键词的方式相对而言比较简单,但遇到深层次语义表达的情况,效果就很差了。而且T+1审核也无法及时制止酒店的违规行为。
[0003]因此,本专利技术提供了一种基于深度学习的邮件标签方法、系统、设备及存储介质。

技术实现思路

[0004]针对现有技术中的问题,本专利技术的目的在于提供基于深度学习的邮件标签方法、系统、设备及存储介质,克服了现有技术的困难,面对复杂的语义表达,能够有更高的准确率和召回率,便于及时干预酒店违规行为,达到及时保障客人权益和隐私。
[0005]本专利技术的实施例提供一种基于深度学习的邮件标签方法,包括以下步骤:
[0006]S110、建立邮件数据队列,采集所述邮件数据队列中第一类预设字段的数据消息,所述第一类预设字段至少包括发件人邮箱、邮件主题;
[0007]S120、判断所述邮件是否为匿名联系用户的预设业务,若是,则执行步骤S130,若否,则结束;
>[0008]S130、解析邮件文本内容,抓取第二类预设字段的内容,所述第二类预设字段至少包括邮件正文;
[0009]S140、对所述第二类预设字段的内容进行预处理;
[0010]S150、基于所述第二类预设字段的内容的语种,分别输入到基于不同语言的经过训练的标签分类模型,获得所述邮件文本内容对应的至少一个标签;
[0011]S160、根据所述邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息;以及
[0012]S170、将所述邮件处理流程信息发送到预设的处理邮箱。
[0013]优选地,所述步骤S110中,所述第一类预设字段包括订单号、邮件ID、邮件下载地址、发件人邮箱、邮件主题。
[0014]优选地,所述步骤S120中,根据发件人邮箱、邮件主题判断是否是酒店匿名联系客人的业务。
[0015]优选地,所述步骤S130中,通过HTTP请求的方式,解析出邮件的文本内容,所述第二类预设字段包括收发件人信息、邮件主题、邮件正文、历史邮件对话信息。
[0016]优选地,所述步骤S140中,包括以下步骤:
[0017]S141、根据收发件人信息,定位当前邮件的文本内容,过滤掉历史邮件对话信息;
[0018]S142、根据所述邮件主题以及搜索所述邮件正文内容中预设邮件开头语的位置,定位邮件正文内容;
[0019]S143、当所述邮件语言是繁体中文,转换成简体中文;
[0020]S144、当所述邮件语言是中文,进行中文分词。
[0021]优选地,所述步骤S150中,所述标签分类模型为经过预训练的ALBERT模型,所述ALBERT模型输出的分类标签包括满房、切客、确认后涨价、索要手机号、支付。
[0022]优选地,所述步骤S160中,所述预设标签映射表中包括每个所述标签与至少一邮件处理流程信息的映射关系;
[0023]所述步骤S170中,包括处理信息自所述标签对应的邮件抓取的至少包括邮件ID、订单号、邮件发生时间、标签。
[0024]本专利技术的实施例还提供一种基于深度学习的邮件标签系统,用于实现上述的基于深度学习的邮件标签方法,所述基于深度学习的邮件标签系统包括:
[0025]数据队列模块,建立邮件数据队列,采集所述邮件数据队列中第一类预设字段的数据消息,所述第一类预设字段至少包括发件人邮箱、邮件主题;
[0026]匿名判断模块,判断所述邮件是否为匿名联系用户的预设业务,若是,则执行解析邮件模块,若否,则结束;
[0027]解析邮件模块,解析邮件文本内容,抓取第二类预设字段的内容,所述第二类预设字段至少包括邮件正文;
[0028]预处理模块,对所述第二类预设字段的内容进行预处理;
[0029]分类模型模块,基于所述第二类预设字段的内容的语种,分别输入到基于不同语言的经过训练的标签分类模型,获得所述邮件文本内容对应的至少一个标签;
[0030]映射关系模块,根据所述邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息;以及
[0031]邮件处理模块,将所述邮件处理流程信息发送到预设的处理邮箱。
[0032]本专利技术的实施例还提供一种基于深度学习的邮件标签设备,包括:
[0033]处理器;
[0034]存储器,其中存储有所述处理器的可执行指令;
[0035]其中,所述处理器配置为经由执行所述可执行指令来执行上述基于深度学习的邮件标签方法的步骤。
[0036]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于深度学习的邮件标签方法的步骤。
[0037]本专利技术的目的在于提供基于深度学习的邮件标签方法、系统、设备及存储介质,能够针对不同语言下的邮件场景,构建了基于深度学习的多分类模型。实际效果证明,面对复杂的语义表达,模型有更高的准确率和召回率。并且采用实时的架构,及时干预酒店违规行为,达到及时保障客人入住权益、维护客人隐私安全、减小公司订单损失等目的。
附图说明
[0038]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。
[0039]图1是本专利技术的基于深度学习的邮件标签方法的流程图。
[0040]图2是本专利技术的基于深度学习的邮件标签系统的模块示意图。
[0041]图3是本专利技术的基于深度学习的邮件标签设备的结构示意图。
[0042]图4是本专利技术一实施例的计算机可读存储介质的结构示意图。
具体实施方式
[0043]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本专利技术将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
[0044]图1是本专利技术的基于深度学习的邮件标签方法的流程图。如图1所示,本专利技术的实施例提供一种基于深度学习的邮件标签方法,包括以下步骤:
[0045]S110、建立邮件数据队列,采集邮件数据队列中第一类预设字段的数据消息,第一类预设字段至少包括发件人邮箱、邮件主题。
[0046]S120、判断邮件是否为匿名联系用户的预设业务,若是,则执行步骤S130,若否,则结束。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的邮件标签方法,其特征在于,包括以下步骤:S110、建立邮件数据队列,采集所述邮件数据队列中第一类预设字段的数据消息,所述第一类预设字段至少包括发件人邮箱、邮件主题;S120、判断所述邮件是否为匿名联系用户的预设业务,若是,则执行步骤S130,若否,则结束;S130、解析邮件文本内容,抓取第二类预设字段的内容,所述第二类预设字段至少包括邮件正文;S140、对所述第二类预设字段的内容进行预处理;S150、基于所述第二类预设字段的内容的语种,分别输入到基于不同语言的经过训练的标签分类模型,获得所述邮件文本内容对应的至少一个标签;S160、根据所述邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息;以及S170、将所述邮件处理流程信息发送到预设的处理邮箱。2.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S110中,所述第一类预设字段包括订单号、邮件ID、邮件下载地址、发件人邮箱、邮件主题。3.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S120中,根据发件人邮箱、邮件主题判断是否是酒店匿名联系客人的业务。4.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S130中,通过HTTP请求的方式,解析出邮件的文本内容,所述第二类预设字段包括收发件人信息、邮件主题、邮件正文、历史邮件对话信息。5.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S140中,包括以下步骤:S141、根据收发件人信息,定位当前邮件的文本内容,过滤掉历史邮件对话信息;S142、根据所述邮件主题以及搜索所述邮件正文内容中预设邮件开头语的位置,定位邮件正文内容;S143、当所述邮件语言是繁体中文,转换成简体中文;S144、当所述邮件语言是中文,进行中文分词。6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:王思博罗超胡泓李巍邹宇
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1