【技术实现步骤摘要】
一种基于深度学习的短信模板生成方法、系统及电子装置
[0001]本专利技术涉及计算机领域中的自然语言处理
,尤其涉及一种基于深度学习的短信模板生成方法、系统及电子装置。
技术介绍
[0002]当前对于文本摘要的技术从文本来源可以分为抽取式摘要和生成式摘要,其中抽取式摘要是通过对文章中的所有句子做权重标记,根据权重大小来提取部分句子作为文本摘要,主要算法有:
[0003](1)TextRank算法,TextRank算法模仿PageRank算法将文本分割的句子当作节点,构成一个隐马尔科夫链,计算句子之间相似度来获取文本TextRank值,最终选取TextRank得分排名前几的句子作为文章摘要。
[0004](2)文本分类方法是通过将原文章句子出现与否看作是一个二分类任务,例如训练时将句子做标签:其中,1为属于摘要,0为不属于摘要,而最后的文本摘要由标签为1的句子组成,例如使用无监督式抽取式摘要生成方法。
[0005]综上,抽取式摘要算法的核心是对原文中的词语或者词语做二分类,是选择或是不选择,用此方 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的短信模板生成方法,其特征在于,包括以下步骤:获取短信文本的待压缩短信文本,并对所述待压缩短信文本进行预处理;其中,所述待压缩短信文本为删除标注内容后的所述短信文本,所述标注内容为预先标注在所述短信文本中的内容;将预处理后的所述待压缩短信文本输入至训练好的Transformer模型中,以获取压缩短信文本;获取所述压缩短信文本的语句通顺概率矩阵以及词频概率矩阵;根据所述语句通顺概率矩阵以及所述词频概率矩阵从所述压缩短信文本中选取最佳压缩短信文本。2.根据权利要求1所述的一种基于深度学习的短信模板生成方法,其特征在于,获取所述语句通顺概率矩阵包括以下子步骤:在每一条所述压缩短信文本的文本前插入“[CLS]”标记;将添加了“[CLS]”标记的所述压缩短信文本输入至训练好的BERT分类模型中,以获取每一条所述压缩短信文本的语句通顺概率矩阵[P1(0),P1(1)],P1(0)表示语句通顺的概率,P1(1)表示语句不通顺的概率。3.根据权利要求1所述的一种基于深度学习的短信模板生成方法,其特征在于,获取所述词频概率矩阵包括以下子步骤:对所述压缩短信文本做分词处理;统计各个词汇在正类文本中的出现次数和在负类文本中的出现次数;其中,所述正类文本和所述负类文本由训练所述Transformer模型时获取;根据各个词汇在正类文本中的出现次数和各个词汇在负类文本中的出现次数获取所述压缩短信文本的词频概率矩阵[P2(0),P2(1)]:(1)]:其中,P2(0)表示所述压缩短信文本为所述正类文本的概率,P2(1)表示所述压缩短信文本为所述负类文本的概率,N1表示所述正类文本中的总词汇数,N2表示所述负类文本中的总词汇数,count1(w
n
)表示第n个词汇在所述正类文本中的出现次数,count2(w
n
)表示第n个词汇在所述负类文本中的出现次数。4.根据权利要求1
‑
3中任意一项所述的一种基于深度学习的短信模板生成方法,其特征在于,根据所述语句通顺概率矩阵以及所述词频概率矩阵从所述压缩短信文本中选取最佳压缩短信文本包括以下子步骤:获取所述压缩短信文本的评分:S=P1(0)
‑
P1(1)+P2(0)
‑
P2(1)其中,S表示评分,P1(0)表示语句通顺的概率,P1(1)表示语句不通顺的概率,P2(0)表示压缩短信文本为正类文本的概率,P2(1)表示压缩短信文本为负类文本的概率;选择评分最高的所述压缩短信文本作为所述最佳压缩短信文本。5.一种基于深度学习的短信模板生成系统,其特征在于,包括:
第一获取模块,获取短信文本的待压缩短信文本,并对所述待压缩短信文本进行预处理;其中,所述待压缩短信文本为删除标注内容后的所述短信文本,所述标注内容为预先...
【专利技术属性】
技术研发人员:易磊,杨嘉,赵金铃,应翔飞,
申请(专利权)人:四川新网银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。