一种基于深度学习的音乐评论生成方法技术

技术编号:25522614 阅读:32 留言:0更新日期:2020-09-04 17:12
一种基于深度学习的音乐评论生成方法,包括:使用网络爬虫技术,获取音乐原始评论,构建音乐评论库;基于Bert模型和Transformer模型,构建文本摘要生成模型,将待评论音乐的歌词文本输入文本摘要生成模型,获得歌词摘要文本;判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则挑选出存在有音乐名或歌手名的原始评论,如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出相似度最高的原始评论;基于VAE模型构建复述生成模型,将挑选出的原始评论输入复述生成模型,生成新的评论文本。本发明专利技术属于信息技术领域,能自动生成音乐的评论文本,并提高文本准确度、多样性和流畅度。

【技术实现步骤摘要】
一种基于深度学习的音乐评论生成方法
本专利技术涉及一种基于深度学习的音乐评论生成方法,属于信息

技术介绍
随着网络科技的发展,用户可以随时随地的欣赏到各种音乐。现有技术中,大量音乐的评论区只有少量评论甚至没有评论。通常情况下,为了吸引用户的参与和关注,可以采用人工手动撰写评论的方式,但这种人工手动的方式效率非常低。专利申请CN201710196125.X(申请名称:基于人工智能的评论生成方法及装置、设备与可读介质,申请日:2017.03.29,申请人:北京百度网讯科技有限公司)公开了一种基于人工智能的评论生成方法及装置、设备与可读介质。其所述方法包括:从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;分别获取目标分词的候选分词对应的对齐特征、语言特征以及上下文特征;根据目标分词的候选分词对应的对齐特征、语言特征以及上下文特征以及预先训练的可行性打分模型,预测评论语句中候选分词能够替换对应的目标分词的可行性分值;若可行性分值大于或者等于预设的可行性分数阈值,将评论语句中的目标分词替换为候选分词,生成主题对应的评论语句。该技术方案只是从语料库中选取目标语句中可替换的关键词,通过打分系统选出最好的候选词进行替换,使用的文本语义信息不充分,且没有很好地利用到文本的整体语义特征和上下文信息特征,同时,替换后的文本与原始文本相似度较高,最终生成的文本准确性和多样性也存在不足。因此,如何自动生成音乐的评论文本,并提高评论文本的准确度、多样性和流畅度,已经成为技术人员普遍关注的技术问题
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于深度学习的音乐评论生成方法,能自动生成音乐的评论文本,并提高评论文本的准确度、多样性和流畅度。为了达到上述目的,本专利技术提供了一种基于深度学习的音乐评论生成方法,包括有:步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;步骤二、基于Bert模型和Transformer模型,构建sequencetosequence文本摘要生成模型,sequencetosequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequencetosequence文本摘要生成模型,并获得对应的歌词摘要文本;步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE复述生成模型,从而为待评论音乐生成新的评论文本。与现有技术相比,本专利技术的有益效果是:本专利技术针对生成评论需要与目标音乐主题相关的问题,通过生成歌词摘要的方式,一方面可以直接输出与目标音乐相关的新评论,另一方面作为之后相关度匹配的输入,剔除了与音乐主题无关的无义文本信息,并在生成摘要时,通过使用深度学习seq2seq模型,提升了系统的语义理解能力;本专利技术使用编码解码模型,可以进一步增强文本生成的准确度和流畅度,并通过使用VAE模型结合Bert网络和Transformer网络,对文本的语义理解能力和文本生成能力更强,最终生成的评论结果流畅性和多样性更高。附图说明图1是本专利技术一种基于深度学习的音乐评论生成方法的流程图。图2是图1步骤二的具体步骤流程图。图3是图1步骤三中计算待评论音乐的歌词摘要文本和音乐评论库中的每条音乐的原始评论的文本相似度的具体步骤流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步的详细描述。如图1所示,本专利技术一种基于深度学习的音乐评论生成方法,包括有:步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;步骤二、基于Bert模型和Transformer模型,构建sequencetosequence文本摘要生成模型,sequencetosequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequencetosequence文本摘要生成模型,并获得对应的歌词摘要文本;步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE复述生成模型,从而为待评论音乐生成新的评论文本。步骤一中,还可以进一步对从网络上获取的音乐原始评论做正则匹配和短语替换的数据清洗操作,其中,短语替换是将音乐原始评论中的音乐名、歌手名等具体指代词用占位符替代,例如“周杰伦”替代成“@@@周杰伦@@@”,正则匹配是对音乐原始评论的文本信息进行增强,例如将评论中的主要人名做统一,如“杰伦”统一成“周杰伦”,使得文本中的具体指代信息更为统一。如图2所示,步骤二可以进一步包括有:步骤21、将音乐歌词文本分割成多句话,并将每句话再继续分割成多个词,分割得到的每句话或者每个词都是一个语义单元(即词组),然后将每个语义单元分别输入Bert模型,获得Bert模型输出的语义特征向量;步骤22、计算每个分割词的位置特征向量:其中,Zpos(i)是词i的位置特征向量,pos是词i在句子中的排序位置,d是向量维度,d可以根据实际业务需要而设置,例如d为128;传统的RNN模型的序列结构对于序列的位置编码具有天然的优势,因为RNN的每一个时刻的状态输入都需要等待上一个时刻的状态输出完成。但是这种特性也导致了RNN不适合大规模的并行训练,模型处理速度较慢。Bert使用的是纯Attnention机制编码的,并在很大的网络数据上进行了预训练,比传统RNN在语义编码上的能力更强,但不保留序列的位置信息,因此本专利技术通过计算每个词的位置特征向量,可以有效保留序列的位置编码信息;步骤23、计算每个分割词的文本表示向量:Z(i)=Zpos(i)+Zword(i)+Zsen(i),其中,Z(i)是词i的文本表示向量,Zsen(i)是词i所属句子或窗口序列的语义特征向量,Zword(i)是词i的语义特征向量本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的音乐评论生成方法,其特征在于,包括有:/n步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;/n步骤二、基于Bert模型和Transformer模型,构建sequence to sequence文本摘要生成模型,sequence to sequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequence to sequence文本摘要生成模型,并获得对应的歌词摘要文本;/n步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;/n步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE复述生成模型,从而为待评论音乐生成新的评论文本。/n...

【技术特征摘要】
1.一种基于深度学习的音乐评论生成方法,其特征在于,包括有:
步骤一、使用网络爬虫技术,获取音乐原始评论,从而构建音乐评论库,所述音乐评论库用于保存网络上获取到的音乐的原始评论;
步骤二、基于Bert模型和Transformer模型,构建sequencetosequence文本摘要生成模型,sequencetosequence文本摘要生成模型的输入是音乐歌词文本,输出是歌词摘要文本,将待评论音乐的音乐歌词文本输入sequencetosequence文本摘要生成模型,并获得对应的歌词摘要文本;
步骤三、判断音乐评论库中所有音乐的原始评论中是否存在有待评论音乐的音乐名或歌手名,如果是,则从音乐评论库中挑选出存在有待评论音乐的音乐名或歌手名的原始评论,然后继续下一步;如果否,则计算待评论音乐的歌词摘要文本和音乐评论库中每条音乐的原始评论的文本相似度,并挑选出与待评论音乐的歌词摘要文本的相似度最高的原始评论,然后继续下一步;
步骤四、基于VAE模型,构建VAE复述生成模型,VAE复述生成模型的输入是评论文本,输出是生成的复述评论文本,将为待评论音乐挑选出的原始评论输入VAE复述生成模型,从而为待评论音乐生成新的评论文本。


2.根据权利要求1所述的方法,其特征在于,步骤一中,还对从网络上获取的音乐原始评论做正则匹配和短语替换的数据清洗操作,其中,短语替换是将音乐原始评论中的音乐名、歌手名的具体指代词用占位符替代,正则匹配是对音乐原始评论的文本信息进行增强,统一文本中的具体指代信息。


3.根据权利要求1所述的方法,其特征在于,步骤二进一步包括有:
步骤21、将音乐歌词文本分割成多句话,并将每句话再继续分割成多个词,分割得到的每句话或者每个词都是一个语义单元,然后将每个语义单元分别输入Bert模型,获得Bert模型输出的语义特征向量;
步骤22、计算每个分割词的位置特征向量:

其中,Zpos(i)是词i的位置特征向量,pos是词i在句子中的排序位置,d是向量维度;
步骤23、计算每个分割词的文本表示向量:Z(i)=Zpos(i)+Zword(i)+Zsen(i),其中,Z(i)是词i的文本表示向量,Zsen(i)是词i所属句子或窗口序列的语义特征向量,Zword(i)是词i的语义特征向量,当词i所属句子的长度超过句长阈值时,以词i为中心,从其所属句子中截取一个上下文窗口长度的窗口序列,Zsen(i)即是截取的窗口序列的语义特征向量;
步骤24、按分割词在音乐歌词文本中的排序位置,依次将每个分割词的文本表示向量输入Transformer模型,并获得Transformer模型输出的歌词摘要序列,从而获得歌词摘要文本。
...

【专利技术属性】
技术研发人员:黄璜赵海秀张少杰王彦青王为强
申请(专利权)人:杭州东信北邮信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1