【技术实现步骤摘要】
电子书的标签生成方法、装置及电子设备
[0001]本专利技术实施例涉及自然语言处理
,具体涉及一种电子书的标签生成方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着人们阅读方式的改变,电子书相对于传统书籍得到越来越广泛的使用。当用户通过电子书平台阅读电子书时,电子书平台一般会通过电子书的标签向用户推荐用户可能感兴趣的电子书。
[0003]电子书的标签由电子书平台生成,可以反映电子书的作品内容。对电子书平台来说,生成准确的标签可以实现电子书的精准推荐,提高电子书的阅读量。然而,在实现本专利技术实施例的过程中,专利技术人发现:相关技术一般通过人工智能模型自动为电子书生成标签,而电子书平台构造的人工智能模型表达能力较差,使得生成电子书标签的准确性较低。
技术实现思路
[0004]鉴于上述问题,本专利技术实施例提供了一种电子书的标签生成方法、装置、电子设备及计算机可读存储介质,用于解决现有技术中存在的电子书标签生成的准确性较低的问题。
[0005]根据本专利技术实施例的一个方 ...
【技术保护点】
【技术特征摘要】
1.一种电子书的标签生成方法,其特征在于,所述方法包括:获取目标电子书的当前更新内容,根据所述当前更新内容以及所述目标电子书的关联信息确定所述目标电子书的粗粒度信息特征;根据所述目标电子书的历史标签信息确定所述目标电子书的标签修正语义特征;根据完本状态的相似电子书的标签信息确定所述目标电子书的标签监督语义特征,其中,所述相似电子书为与所述目标电子书属于相同图书分类的电子书;将所述粗粒度信息特征、所述标签修正语义特征以及所述标签监督语义特征输入预训练的变分自编码器模型,以生成所述目标电子书的标签。2.根据权利要求1所述的方法,其特征在于,所述关联信息包括图书属性信息、作者属性信息、图书评论信息、图书简介及写作风格信息和历史更新内容;所述根据所述当前更新内容以及所述目标电子书的关联信息确定所述目标电子书的粗粒度信息特征包括:根据所述图书属性信息、作者属性信息、图书评论信息和图书简介及写作风格信息分别确定所述目标电子书的第一信息特征、第二信息特征、第三信息特征和第四信息特征;根据所述当前更新内容和所述历史更新内容确定所述目标电子书的第五信息特征;将所述第一信息特征、所述第二信息特征、所述第三信息特征、所述第四信息特征和所述第五信息特征进行融合,以确定所述目标电子书的粗粒度信息特征。3.根据权利要求2所述的方法,其特征在于,所述方法进一步包括:基于词频/逆文本频率指数获取所述图书评论信息的关键词信息;通过Embedding网络将所述关键词信息转化为所述第三信息特征。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述当前更新内容和所述历史更新内容确定所述目标电子书的第五信息特征包括:将所述当前更新内容和所述历史更新内容分别输入Transformer
‑
XL模型,以分别生成第一解码结果和第二解码结果;对所述第一解码结果和所述第二解码结果进行维度对齐;将维度对齐后的第一解码结果和第二解码结果融合为所述第五信息特征。5.根据权利要求4所述的方法,其特征在于,所述将所述当前更新内容和所述历史更新内容分别输入Transformer
‑
XL模型,以分别生成第一解码结果和第二解码结果包括:将所述当前更新内容和所述历史更新内容分别输入所述Transformer
‑
XL模型的编码器,以分别得到第一初始编码向量和第二初始编码向量;将所述当前更新内容和所述历史更新内容分别输入预设词性权重模型中,以分别得到第一权重向量和第二权重向量;将所述第一初始编码向量和所述第一权重向量的点积确定为第一编码结果,将所述第二初始编码向量和所述第二权重向量的点积确定为第二编码结果;分别将所述第一编码结果和所述第二编码结果输入...
【专利技术属性】
技术研发人员:骆世顺,吴志勇,史佳慧,斯凌,
申请(专利权)人:咪咕文化科技有限公司中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。