线上控制食品风险的方法、服务器、终端及电子设备技术

技术编号:33306012 阅读:14 留言:0更新日期:2022-05-06 12:15
本申请实施例提供了一种线上控制食品风险的方法、服务器、终端及电子设备,涉及自然语言技术领域。该方法包括:获取评论文本以及关键词文本,关键词文本包括对应食品安全的各归因分析结果的关键词;将评论文本和关键词文本输入至预先训练的风险识别模型,获得风险识别模型输出的评论文本的食品安全的最高风险等级以及目标归因分析结果。本申请实施例,相比现有技术人工识别的方式不仅大幅提升了识别效率,并且能够准确识别出归因分析结果,为后续进一步对高风险食品安全事件快速预警、消费者食品安全投诉精准保障、餐饮服务提供者精准风险治理等奠定基础。风险治理等奠定基础。风险治理等奠定基础。

【技术实现步骤摘要】
线上控制食品风险的方法、服务器、终端及电子设备


[0001]本申请涉及自然语言处理
,具体而言,本申请涉及一种线上控制食品风险的方法、服务器、终端及电子设备。

技术介绍

[0002]随着餐饮行业的兴起,涉及食品安全的舆情越来越多,民众对于食品安全问题也越来越重视。
[0003]对于提供餐饮服务的互联网平台而言,其是餐饮行业的商家和顾客的侨联,因此有必要对顾客用餐后的评论进行反馈,及时发现用餐过程中可能出现的食品安全问题。
[0004]现有技术中往往需要互联网平台通过人工审核的方式确定评论中指出的食品安全问题,但由于人工审核的效率较低,即使是专业极好的人工审核时间也需要15

30秒,面对每日亿级数据而言无法满足时效要求。

技术实现思路

[0005]本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的线上控制食品风险的方法、装置、电子设备及存储介质。
[0006]第一方面,提供了一种线上控制食品风险的方法,该方法包括:
[0007]获取评论文本以及关键词文本,所述关键词文本包括对应食品安全的各归因分析结果的关键词;
[0008]将所述评论文本和关键词文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及目标归因分析结果;
[0009]其中,所述风险识别模型是以与餐饮相关的样本评论文本和关键词文本为训练样本,以所述样本评论文本的食品安全的最高风险等级和归因分析结果为训练标签训练而成。
[0010]在一个可能的实现方式中,风险识别模型包括定级模型;
[0011]所述将所述评论文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及归因分析结果,包括:
[0012]将所述评论文本以及对应的拼音文本输入至所述定级模型,获得所述定级模型输出的所述评论文本的食品安全的最高风险等级;
[0013]其中,所述定级模型是根据所述样本评论文本以及对应的拼音文本为训练样本,以样本评论文本的食品安全的最高风险等级为训练标签训练而成。
[0014]在一个可能的实现方式中,定级模型还用于输出CLS向量;其中,所述最高风险等级是根据所述CLS向量确定的。
[0015]在一个可能的实现方式中,风险识别模型还包括归因模型;
[0016]所述将所述评论文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及归因分析结果,包括:
[0017]将所述评论文本、所述CLS向量以及预设的关键词文本输入至所述归因模型,获得所述归因模型输出的所述评论文本的目标归因分析结果;
[0018]所述归因模型是根据所述样本评论文本、关键词文本以及所述定级模型输出的所述样本评论文本的CLS向量为训练样本,以样本评论文本的归因分析结果为训练标签训练而成。
[0019]在一个可能的实现方式中,定级模型包括输入层、预训练语言模型和分类层;
[0020]所述将所述评论文本以及对应的拼音文本输入至所述定级模型,获得所述定级模型输出的CLS向量以及所述评论文本的食品安全的最高风险等级,包括:
[0021]将所述评论文本和对应的拼音文本输入至所述输入层,获得所述输入层对所述评论文本进行字符级切分后输出的第一分词序列以及对所述拼音文本进行字符级切分后输出的第二分词序列;
[0022]将所述第一分词序列和第二分词序列输入至所述预训练语言模型,获得所述预训练语言模型输出的所述评论文本中各分词融合全文语义信息后的向量表示;
[0023]将所述向量表示输入至所述分类层,获得所述分类层通过池化、激活函数和全连接处理后输出的所述CLS向量以及所述评论文本的最高风险等级。
[0024]在一个可能的实现方式中,预训练语言模型为BERT模型,所述BERT模型包括第一嵌入层、第二嵌入层和transformer层;
[0025]所述将所述第一分词序列和第二分词序列输入至所述预训练语言模型,获得所述预训练语言模型输出的所述评论文本的向量表示,包括:
[0026]将所述第一分词序列输入至所述第一嵌入层,获得所述第一嵌入层输出的所述评论文本的word embedding词嵌入向量、segment embedding段嵌入向量和position embedding位置嵌入向量;
[0027]将所述第二分词序列输入至所述第二嵌入层,获得所述第二嵌入层输出的所述评论文本的拼音嵌入向量;
[0028]将所述word embedding词嵌入向量、segment embedding段嵌入向量和position embeddings位置嵌入向量以及拼音嵌入向量输入至所述transformer层,获得所述transformer层输出的所述向量表示。
[0029]在一个可能的实现方式中,所述将所述第二分词序列输入至所述第二嵌入层,获得所述第二嵌入层输出的所述评论文本的拼音嵌入向量,包括:
[0030]对于所述第二分词序列中的每个分词,从预设字典中确定对应的唯一标识,将所述唯一标识输入至BertModel类源码进行编译,获得所述拼音嵌入向量;
[0031]其中,所述预设字典中包括至少一个分词以及对应的唯一标识。
[0032]在一个可能的实现方式中,所述归因模型包括词向量层、第一注意力机制层、第二注意力机制层以及分类层;
[0033]所述将所述评论文本、所述CLS向量以及关键词文本输入至所述归因模型,获得所述归因模型输出的所述评论文本的食品安全的归因分析结果,包括:
[0034]将所述评论文本和关键词文本分别输入至词向量层,获得所述词向量层输出的所述评论文本的第一词向量和所述关键词文本的第二词向量;
[0035]将所述第一词向量和所述第二词向量输入至第一注意力机制层,获得所述评论文
本的第一注意力权重;
[0036]将所述CLS向量以及所述第二词向量输入至第二注意力机制层,获得所述评论文本的第二注意力权重;
[0037]将所述第一注意力权重和第二注意力权重输入至分类层,获得所述分类层输出的是所述评论文本的目标归因分析结果。
[0038]第二方面,提供一种线上控制食品风险的方法,包括:
[0039]展示评论编辑界面,所述评论编辑界面中展示待发布的评论文本;
[0040]响应于针对所述评论文本的评论发布操作,展示发布后的所述评论文本,以及所述评论文本的食品安全的最高风险等级以及目标归因分析结果。
[0041]在一个可能的实现方式中,展示发布后的所述评论文本,以及所述评论文本的食品安全的最高风险等级以及目标归因分析结果,之前还包括:
[0042]将所述评论文本和预设的关键词文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及目标归因分析结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种线上控制食品风险的方法,其特征在于,包括:获取评论文本以及关键词文本,所述关键词文本包括对应食品安全的各归因分析结果的关键词;将所述评论文本和关键词文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及目标归因分析结果;其中,所述风险识别模型是以与餐饮相关的样本评论文本和关键词文本为训练样本,以所述样本评论文本的食品安全的最高风险等级和归因分析结果为训练标签训练而成。2.根据权利要求1所述的线上控制食品风险的方法,其特征在于,所述风险识别模型包括定级模型;所述将所述评论文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及归因分析结果,包括:将所述评论文本以及对应的拼音文本输入至所述定级模型,获得所述定级模型输出的所述评论文本的食品安全的最高风险等级;其中,所述定级模型是根据所述样本评论文本以及对应的拼音文本为训练样本,以样本评论文本的食品安全的最高风险等级为训练标签训练而成。3.根据权利要求2所述的线上控制食品风险的方法,其特征在于,所述定级模型还输出CLS向量;其中,所述最高风险等级是根据所述CLS向量确定的。4.根据权利要求3所述的线上控制食品风险的方法,其特征在于,所述风险识别模型还包括归因模型;所述将所述评论文本输入至预先训练的风险识别模型,获得所述风险识别模型输出的所述评论文本的食品安全的最高风险等级以及目标归因分析结果,包括:将所述评论文本、所述CLS向量以及预设的关键词文本输入至所述归因模型,获得所述归因模型输出的所述评论文本的目标归因分析结果;所述归因模型是根据所述样本评论文本、关键词文本以及所述定级模型输出的所述样本评论文本的CLS向量为训练样本,以样本评论文本的归因分析结果为训练标签训练而成。5.根据权利要求4所述的线上控制食品风险的方法,其特征在于,所述定级模型包括输入层、预训练语言模型和分类层;所述将所述评论文本以及对应的拼音文本输入至所述定级模型,获得所述定级模型输出的CLS向量以及所述评论文本的食品安全的最...

【专利技术属性】
技术研发人员:张未央付磊汪安辉
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1