【技术实现步骤摘要】
短链接生成方法、系统和电子设备
[0001]本申请涉及短链接的领域,且更为具体地,涉及一种短链接生成方法、系统和电子设备。
技术介绍
[0002]短链接是指通讯双方有数据交互时,就建立一个链接,数据发送完成后,则断开此链接,即每次链接只完成一项业务的发送。短链接具有不需要长期占用通道,且对于业务频率不高的场合能节省通道使用率的优点。并且现今实现技术语言Java,相关技术使用Nginx,SpringBoot,Redis,MySQL。采用自定义算法、缓存处理等方式保证短链接转换处理快速。
[0003]但是,在实际的应用过程中,通过手机Push、短信等方式发送URL链接过长会引起字符集转化、参数太长而占用网络资源,短信长度太长而导致分条发送等各种问题。并且现有的技术导致URL链接字符过多,这就会占用短信等内容长度。因此,如何实现同一套短链接系统支持不同APP唤起功能是需要考虑的问题。
[0004]因此,期望一种短链接生成方案。
技术实现思路
[0005]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种短链接生成方法、系统和电子设备,其采用语义理解模型来对短链接的文本进行语义理解以得到短链接的标签,并且本申请考虑到短链接的文本是基于长链接的文本通过生成算法自动生成的,因此在语义理解模型中,充分利用了长链接的文本信息和短链接的文本信息两者以在短链接的生成阶段中对于该短链接进行需要唤起的APP进行标注。这样,基于所述短连接的标注能够支持不同APP的唤起功能。
[0006]根据本 ...
【技术保护点】
【技术特征摘要】
1.一种短链接生成方法,其特征在于,包括:训练阶段,包括:获取训练数据集,所述训练数据集包括训练用长链接文本和对应于所述训练用长链接文本的真实短链接文本;将所述训练数据集中的训练用长链接文本输入语义理解模型以获得训练用特征向量序列,其中,所述训练用特征向量序列中的每个训练用特征向量对应于所述训练用长文本所对应的短链接文本的一个字符;将所述训练用特征向量序列通过解码器模型以将所述训练用特征向量序列解码为解码短链接文本;通过最小化所述解码短链接文本和所述训练集中的真实短连接文本之间的差异来训练所述语义理解模型和所述解码器模型;以及预测阶段,包括:获取待编码的长链接文本;将所述待编码的长链接文本输入经训练阶段训练完成的所述语义理解模型以获得特征向量序列;将所述特征向量序列通过经训练阶段训练完成的所述解码器模型以获得生成短连接文本;将所述特征向量序列通过转换器以获得由多个掩码转换值组成的分类特征向量,其中,所述转换器基于其内在的结构计算所述特征向量序列中每个特征向量的掩码转换值;以及将所述分类特征向量通过多标签分类器以对所述生成短链接文本进行类别标注,以获得具有类别标注的短链接文本。2.根据权利要求1所述的短链接生成方法,其中,将所述训练数据集中的训练用长链接文本输入语义理解模型以获得训练用特征向量序列,包括:使用所述语义理解模型的词嵌入层将所述训练用长连接文本中的每个词转化为词向量以获得词向量序列;以及使用所述语义理解模型的Bert模型对所述词向量序列进行处理以获得所述训练用特征向量序列。3.根据权利要求1所述的短链接生成方法,其中,通过最小化所述解码短链接文本和所述训练集中的真实短连接文本之间的差异来训练所述语义理解模型和所述解码器模型,包括:计算所述解码短链接文本和所述训练集中的真实短连接文本交叉熵损失函数值作为损失函数值;以及基于所述损失函数值来训练所述语义理解模型和所述解码器模型。4.根据权利要求3所述的短链接生成方法,其中,所述解码器模型为由多个全连接层组成的深度全连接神经网络模型。5.根据权利要求1所述的短链接生成方法,其中,将所述特征向量序列通过转换器以获得由多个掩码转换值组成的分类特征向量,包括:所述转换器以如下公式所述特征向量序列中每个特征向量的掩码转换值;
所述公式为:其中F
i
为每个特征向量,F
j
是特征向量序列中F
i
以外的特征向量,∑
j≠i
(
·
)表示对所有特征向量F
j
求和,表示F
i
与F
j
之间的距离,且α表示F
i
是否在预测编码过程被掩码。6.根据权利要求5所述的短链接生成方法,其中,如果F
i
在预测编码过程被掩码,则取...
【专利技术属性】
技术研发人员:张雪涛,
申请(专利权)人:深圳万顺叫车云信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。