一种基于mt5模型融合ner实体识别的评论生成方法技术

技术编号：37704385 阅读：10 留言：0更新日期：2023-06-01 23:52

本发明专利技术提供了一种基于mt5模型融合ner实体识别的评论生成方法，属于文本生成技术领域。通过对mt5模型结构进行修改，增加ner实体识别部分，利用输入的实体信息提高评论生成的质量，并且利用sep_token作为分隔符将每个片段生成的评论连接起来，生成完整的评论。本方法针对文章主题进行多条评论的生成，生成的评论具有更高的相关性和连贯性。本方法实现了ner实体识别和评论生成的整合，减少了模型的训练和生成时间，提高了模型的效率。提高了模型的效率。提高了模型的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于mt5模型融合ner实体识别的评论生成方法

[0001]本专利技术涉及一种基于mt5模型融合ner实体识别的评论生成方法，属于文本生成

技术介绍

[0002]新闻评论让用户表达自己对文章的观点和态度，通过鼓励用户浏览评论、相互交流，从而扩展新闻的内容和提高新闻客户端的用户参与度。现阶段主要采用传统seq2seq模型进行评论生成，但是评论生成质量一般。当前急需一种高质量的评论生成方法。

技术实现思路

[0003]本专利技术目的是提供了一种基于mt5模型融合ner实体识别的评论生成方法，实现对输入文本的分隔处理，使每条评论的输入信息更加明确清晰。
[0004]本专利技术为实现上述目的，通过以下技术方案实现：步骤1：数据预处理，将输入文本的新闻数据进行位置信息标注，得到序列x，同时将多条评论label数据进行实体信息提取标注得到，然后每条评论数据通过seq_token分隔符拼接，得到训练label数据 Y；步骤2：把序列转化为词向量和位置向量，其中，i表示每个字符的绝对位置，、的维度为模型的隐向量维度；将词向量和位置向量相加，得到输入序列；并将输入序列划分为测试集和训练集；步骤3：构建评论生成模型，所述评论生成模型包括编码和解码两部分，所述编码部分和解码部分均由9个Block组成，其中解码部分最后多了一层Linear；步骤4：将训练集输入序列输入评论生成模型进行训练，编码后续全连接层的输出和真实数据计算交叉熵损失得到实体识别部分的交叉熵损失;解码后续的输出通过和真实数据Y计算交熵损...

【技术保护点】

【技术特征摘要】
1.一种基于mt5模型融合ner实体识别的评论生成方法，其特征在于，包括以下步骤：步骤1：数据预处理，将输入文本的新闻数据进行位置信息标注，得到序列x，同时将多条评论label数据进行实体信息提取标注得到，然后每条评论数据通过seq_token分隔符拼接，得到训练label数据 Y；步骤2：把序列转化为词向量和位置向量，其中，i表示每个字符的绝对位置，、的维度为模型的隐向量维度；将词向量和位置向量相加，得到输入序列；并将输入序列划分为测试集和训练集；步骤3：构建评论生成模型，所述评论生成模型包括编码和解码两部分，所述编码部分和解码部分均由9个Block组成，其中解码部分最后多了一层Linear；步骤4：将训练集输入序列输入评论生成模型进行训练，编码后续全连接层的输出和真实数据计算交叉熵损失得到实体识别部分的交叉熵损失;解码后续的输出通过和真实数据Y计算交熵损失得到生成任务的交叉熵损失，然后两个损失加权求和作为最后的损失函数，通过adam优化器优化，得到评论生成模型；步骤5：将测试集输入训练好的评论生成模型，得到最终结果。2.根据权利要求1所述的基于mt5模型融合ner实体识别的评论生成方法，其特征在于，所述编码部分整合ner，对输入序列处理过程如下：训练集输入序列输入编码部分，得到输出隐状态h，再通过一个全连接层将隐状态h映射为NER的概率分布，具体公式如下：；式中，表示每个字符的实体概率分布、表示计算每个实体类别的概率、表示感知机网络、表示第个...

【专利技术属性】
技术研发人员：宋耀，魏传强，司君波，李喆，刘鹏，
申请(专利权)人：山东齐鲁壹点传媒有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人