【技术实现步骤摘要】
本专利技术涉及食品安全评论信息,具体为一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法。
技术介绍
1、食品安全指食品无毒、无害,符合应当有的营养要求,对人体健康不造成任何急性、亚急性或者慢性危害,根据倍诺食品安全定义,食品安全是“食物中有毒、有害物质对人体健康影响的公共卫生问题”,食品安全也是一门专门探讨在食品加工、存储、销售等过程中确保食品卫生及食用安全,降低疾病隐患,防范食物中毒的一个跨学科领域,所以食品安全很重要。
2、在现有技术中,随着社交媒体和在线评论的广泛使用,食品安全问题的检测和跟踪变得越来越重要,食品安全问题的监测对于公共健康至关重要,随着社交媒体和在线评论的广泛使用,虽然能够检测和分析这些评论,但是无法通过评论信息的关键词与信息融合,不能有效地提取食品安全问题,进而无法迅速采取必要的措施,为此提出一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法来解决上述问题。
技术实现思路
1、针对现有技术的不足,本专利技术提供了一种采用关键词进
...【技术保护点】
1.一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,所述步骤1)中的餐饮评论分类文本数据的来源为社交媒体、新闻网站和博客等,所述步骤1)中使用BERT_WWM对文本进行编码,由于BERT_WWM模型对输入序列的长度有限制,需要将所有句子调整为相同的长度,对长度大于max_len的句子进行切割,对小于max_len的句子填充[PAD]来达到相同的长度,所述BERT_WWM模型是中文自然语言处理中常用的预训练模型之一,
...【技术特征摘要】
1.一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,所述步骤1)中的餐饮评论分类文本数据的来源为社交媒体、新闻网站和博客等,所述步骤1)中使用bert_wwm对文本进行编码,由于bert_wwm模型对输入序列的长度有限制,需要将所有句子调整为相同的长度,对长度大于max_len的句子进行切割,对小于max_len的句子填充[pad]来达到相同的长度,所述bert_wwm模型是中文自然语言处理中常用的预训练模型之一,它是bert的一种变种,bert_wwm模型在中文分词上有一些特定的改进,以更好地处理中文文本。
3.根据权利要求1所述的一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,所述步骤1)中包括两个模型,分别是模型一和模型二,其中模型一为后续的字级向量与标签向量特征交互,bert_wwm的输出直接作为模型一的文档向量表示。
4.根据权利要求3所述的一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,所述模型二在模型一的文本表示基础上经过lstm进行特征抽取得到文档级向量表示。
5.根据权利要求1所述的一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,所述步骤2)中的对数据集进行关键词抽取包括以下子步骤:
6.根据权利要求5所述的一种采用关键词进行标签表示与信息融合的食品安全评论信息检测方法,其特征在于,所述步骤s1中需要用到pkuseg对句子进行词性标记,...
【专利技术属性】
技术研发人员:熊蜀峰,张旭,张一鸣,樊晓博,时雷,席磊,
申请(专利权)人:河南农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。