一种基于内容识别的智能邮件模板方法技术

技术编号：37970398 阅读：15 留言：0更新日期：2023-06-30 09:45

本发明专利技术公开了一种基于内容识别的智能邮件模板方法，涉及计算机应用技术领域。本发明专利技术包括如下步骤：采集Web页的HTML邮件的基础结构提取网页的文本内容，标注训练结果和特征训练结果建立对应的邮件特征模型；创建待输出邮件模板文件，以生成预设邮件模板文件；识别用户文本内容，输入邮件特征模型；邮件特征模型输出邮件模板文件；对邮件模板文件进行程序格式转换，以生成目标邮件模板。本发明专利技术通过采集Web页的HTML邮件训练邮件特征模型，创建待输出邮件模板文件，以生成预设邮件模板文件，识别用户文本内容后输入邮件特征模型生成目标邮件模板，提高邮件的生成效率和准确率。提高邮件的生成效率和准确率。提高邮件的生成效率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于内容识别的智能邮件模板方法

[0001]本专利技术属于计算机应用
，特别是涉及一种基于内容识别的智能邮件模板方法。

技术介绍

[0002]随着计算机应用业务场景多元化和精细化的发展，各个场景需要对大量的业务指标进行监控，对监控的关键指标以系统的方式解读并汇总，最后以邮件的方式将数据分析日报推送到邮件终端。
[0003]目前针对个性化邮件的发送，例如一个邮件中要包含图片、表格、标题等元素，且根据邮件呈现的需要，需调节图片的大小、亮度，表格的属性、边框和底纹的粗细、颜色，以及标题的字体、字号、字体颜色、行间距等，那么开发者需要开发不同的JAVA代码，最后将不同JAVA代码有序的拼接在一起，形成最终需要的邮件，以满足用户业务的需要，即传统邮件发送是依赖于Jmail拼接HTML邮件代码的方式来实现的。
[0004]由于Jmail拼接HTML邮件代码时，需开发不同的JAVA代码，导致代码冗余度高，代码非模块化难以管理，且当需要新增不同展示方式的邮件时，需要重新编写整套HTML代码，造成邮件的生成效率低下。

技术实现思路

[0005]本专利技术的目的在于提供一种基于内容识别的智能邮件模板方法，通过采集Web页的HTML邮件训练邮件特征模型，创建待输出邮件模板文件，以生成预设邮件模板文件，识别用户文本内容后输入邮件特征模型生成目标邮件模板，解决了现有的邮件的生成效率低、邮件生成不准确的问题。
[0006]为解决上述技术问题，本专利技术是通过以下技术方案实现的：
[000...

【技术保护点】

【技术特征摘要】
1.一种基于内容识别的智能邮件模板方法，其特征在于，包括如下步骤：步骤S1：采集Web页的HTML邮件的基础结构提取网页的文本内容；步骤S2：对提取的邮件信息进行预处理；步骤S3：将处理后的邮件信息通过深度学习算法进行标注训练识别；步骤S4：深度学习算法进行标注训练和特征训练，得到标注训练结果和特征训练结果；步骤S5：根据标注训练结果和特征训练结果建立对应的邮件特征模型；步骤S6：创建待输出邮件模板文件，以生成预设邮件模板文件；步骤S7：识别用户文本内容，输入邮件特征模型；步骤S8：邮件特征模型输出邮件模板文件；步骤S9：对邮件模板文件进行程序格式转换，以生成目标邮件模板。2.根据权利要求1所述的一种基于内容识别的智能邮件模板方法，其特征在于，所述步骤S2中，对邮件信息进行预处理包括如下步骤：步骤S21：对邮件信息进行收集和训练；步骤S22：对邮件文本进行离散化处理和邮件元素库建立；步骤S23：文本特征抽取和文本向量化表示；步骤S24：对文本相对应的字词、元素进行加权表示，并将文本以向量形式表示。3.根据权利要求2所述的一种基于内容识别的智能邮件模板方法，其特征在于，所述步骤S21中，对邮件信息进行收集和训练时，需要对邮件信息进行清洗；清理时采用统计值χ2的大小来进行筛选，具体表达式如下：式中，t为特征项，c为文本的类别，N为训练集中的文本总数，A表示包含特征项t的文本在类别c中出现的频数，B表示包含特征项t且不属于类别c的文本出现频数，C表示不包含特征项t的文本在类别c中出现的频数，D表示不包含特征项t且不属于类别c的文本出现频数。4.根据权利要求2所述的一种基于内容识别的智能邮件模板方法，其特征在于，所述步...

【专利技术属性】
技术研发人员：严峻，孟祥磊，侯颖，张威，
申请(专利权)人：武汉佰思特信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人