【技术实现步骤摘要】
一种基于深度学习的音乐评论生成方法
本专利技术涉及一种基于深度学习的音乐评论生成方法,属于信息
技术介绍
随着网络科技的发展,用户可以随时随地的欣赏到各种音乐。现有技术中,大量音乐的评论区只有少量评论甚至没有评论。通常情况下,为了吸引用户的参与和关注,可以采用人工手动撰写评论的方式,但这种人工手动的方式效率非常低。专利申请CN201710196125.X(申请名称:基于人工智能的评论生成方法及装置、设备与可读介质,申请日:2017.03.29,申请人:北京百度网讯科技有限公司)公开了一种基于人工智能的评论生成方法及装置、设备与可读介质。其所述方法包括:从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;分别获取目标分词的候选分词对应的对齐特征、语言特征以及上下文特征;根据目标分词的候选分词对应的对齐特征、语言特征以及上下文特征以及预先训练的可行性打分模型,预测评论语句中候选分词能够替换对应的目标分词的可行性分值;若可行性分值大于或者等于预设的可行性分数阈值,将评论语句中的目标分词替换为候选分词,生成主题对应的评论语句。该技术方案只是从语料库中选取目标语句中可替换的关键词,通过打分系统选出最好的候选词进行替换,使用的文本语义信息不充分,且没有很好地利用到文本的整体语义特征和上下文信息特征,同时,替换后的文本与原始文本相似度较高,最终生成的文本准确性和多样性也存在不足。因此,如何自动生成音乐的评论文本,并提高评论文本的准确度、多样性和流畅度,已经成为技术人员普遍关注的技术问题 ...
【技术保护点】
1.一种基于深度学习的音乐评论生成方法,其特征在于,包括有:/n步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;/n步骤二、基于Bert模型和Transformer模型,构建sequence to sequence文本摘要生成模型,sequence to sequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequence to sequence文本摘要生成模型,并获得对应的歌词摘要文本;/n步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;/n步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE ...
【技术特征摘要】
1.一种基于深度学习的音乐评论生成方法,其特征在于,包括有:
步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;
步骤二、基于Bert模型和Transformer模型,构建sequencetosequence文本摘要生成模型,sequencetosequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequencetosequence文本摘要生成模型,并获得对应的歌词摘要文本;
步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;
步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE复述生成模型,从而为待评论音乐生成新的评论文本。
2.根据权利要求1所述的方法,其特征在于,步骤一中,还对从网络上获取的音乐原始评论做正则匹配和短语替换的数据清洗操作,其中,短语替换是将音乐原始评论中的音乐名、歌手名的具体指代词用占位符替代,正则匹配是对音乐原始评论的文本信息进行增强,统一文本中的具体指代信息。
3.根据权利要求1所述的方法,其特征在于,步骤二进一步包括有:
步骤21、将音乐歌词文本分割成多句话,并将每句话再继续分割成多个词,分割得到的每句话或者每个词都是一个语义单元,然后将每个语义单元分别输入Bert模型,获得Bert模型输出的语义特征向量;
步骤22、计算每个分割词的位置特征向量:
其中,Zpos(i)是词i的位置特征向量,pos是词i在句子中的排序位置,d是向量维度;
步骤23、计算每个分割词的文本表示向量:Z(i)=Zpos(i)+Zword(i)+Zsen(i),其中,Z(i)是词i的文本表示向量,Zsen(i)是词i所属句子或窗口序列的语义特征向量,Zword(i)是词i的语义特征向量,当词i所属句子的长度超过句长阈值时,以词i为中心,从其所属句子中截取一个上下文窗口长度的窗口序列,Zsen(i)即是截取的窗口序列的语义特征向量;
步骤24、按分割词在音乐歌词文本中的排序位置,依次将每个分割词的文本表示向量输入Transformer模型,并获得Transformer模型输出的歌词摘要序列,从而获得歌词摘要文本。
...
【专利技术属性】
技术研发人员:黄璜,赵海秀,张少杰,王彦青,王为强,
申请(专利权)人:杭州东信北邮信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。