一种基于LSTM的获取食品安全问题答案的方法及系统技术方案

技术编号:24091361 阅读:24 留言:0更新日期:2020-05-09 08:13
本发明专利技术实施例提供一种基于LSTM的获取食品安全问题答案的方法及系统。该方法包括:获取待回答问题;将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。本发明专利技术实施例通过基于LSTM模型对食品安全问题进行训练,并解决搜索引擎对食品安全事件检索准确性低的问题,能有效从新闻库中筛选出食品安全问题答案。

A method and system of obtaining food safety answers based on LSTM

【技术实现步骤摘要】
一种基于LSTM的获取食品安全问题答案的方法及系统
本专利技术涉及自然语言处理
,尤其涉及一种基于LSTM的获取食品安全问题答案的方法及系统。
技术介绍
近年来,由于各类食品安全事件频频发生,使得食品安全问题愈发严峻,加剧了大众对食品安全的担忧。由于信息不对称问题,对于食品安全类信息的数据常难以获取。目前针对食品安全事件语料主要来源于新闻报道。但是,由于新闻文本长短不一,加之答案分布的不确定性,对于一个食品安全相关问题,在食品安全事件新闻报道中人工寻找答案效率较低。而大多数自动问答系统以结构化方法构造食品安全数据库,从中挑选出符合问题的对应数据作为返回给消费者的答案。这种数据库构造方法非常依赖人工标注对应数据的质量,一旦数据标注有误差或者没有标注对应问题方面的答案数据,就不能给消费者合理的信息反馈。所以构造一个能够从新闻报道中找到消费者询问问题答案的食品安全问答系统显得很有必要,且这种问答系统能够做到自己生产答案,而不是从已有的数据库中找到答案。因此,需要提出一种能获取食品安全自动问答答案的方法,能提供相关食品安全事件的查询,给出包含答案的相关语句,保证消费者能够便捷的了解食品安全事件。
技术实现思路
本专利技术实施例提供一种基于LSTM的获取食品安全问题答案的方法及系统,用以解决现有技术中依靠人工搜索食品安全问题的答案效率低的问题。第一方面,本专利技术实施例提供一种基于LSTM的获取食品安全问题答案的方法,包括:获取待回答问题;将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。优选地,所述问答判断模型,通过以下步骤获得:获取食品安全问题答案样本集;按照问题答案对进行分类,将所述问题答案对中包含目标答案所在的句子定义为第一标签,将所述问题答案对中不包含目标答案的句子定义为第二标签;基于所述第一标签和所述第二标签,将所述食品安全问题样本集划分为训练集、交叉验证集和测试集;获取LSTM模型网络结构作为初始模型;将所述训练集、所述交叉验证集和所述测试集输入至所述初始模型进行训练,得到所述问答判断模型。优选地,所述获取食品安全问题答案样本集,具体包括:获取食品安全原始文档;基于预设食品安全事件进行人工提问,在所述食品安全原始文档中标注具有与所述人工提问匹配答案的句子,将所述具有与所述人工提问的句子与所述人工提问构成匹配问题答案对;在所述食品安全原始文档中标注与所述人工提问具有预设非关联度的句子,将所述具有预设非关联度的句子与所述人工提问构成不匹配问题答案对;对所述匹配问题答案对和所述不匹配问题答案对进行分词,采用Word2Vec模型生成食品安全领域的词向量,将问题答案对中分词后的问题和答案映射到词向量空间生成问题答案对向量表示;将所述词向量构建所述食品安全问题答案样本集。优选地,所述基于预设食品安全事件进行人工提问,在所述食品安全原始文档中标注具有与所述人工提问匹配答案的句子,将所述具有与所述人工提问的句子与所述人工提问构成匹配问题答案对,之前还包括:使用Lucene倒排索引系统,在所述食品安全原始文档中搜索与所述人工提问匹配程度最高的文章,在所述文章中搜索包含具有与所述人工提问关联信息的句子。优选地,所述将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果,具体包括:基于所述待回答问题,采用Lucene倒排索引系统,在所述食品安全原始文档中搜索与所述待回答问题匹配程度最高的文章,作为候选文章;将所述候选文章中的所有句子和所述待回答问题组成候选问题答案对;将所述候选问题答案对向量表示输入至所述问答判断模型,由所述问题判断模型进行匹配度计算,将具有最高匹配度的句子作为所述问题匹配结果。优选地,所述由所述问题判断模型进行匹配度计算,具体包括:所述问题判断模型根据所述所有句子与所述待回答问题的匹配程度进行匹配度打分,得到匹配度得分;根据所述匹配度得分,按照从高到低的顺序抽取句子与所述待回答问题进行匹配。优选地,所述问题答案对的格式为问题-答案-标签值。第二方面,本专利技术实施例提供一种基于LSTM的获取食品安全问题答案的系统,包括:获取模块,用于获取待回答问题;处理模块,用于将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述基于LSTM的获取食品安全问题答案的方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现任一项所述基于LSTM的获取食品安全问题答案的方法的步骤。本专利技术实施例提供的基于LSTM的获取食品安全问题答案的方法及系统,通过基于LSTM模型对食品安全问题进行训练,并解决搜索引擎对食品安全事件效率低的问题,能有效从新闻库中筛选出食品安全问题答案。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种基于LSTM的获取食品安全问题答案的方法流程图;图2为本专利技术实施例提供的问题判断模型训练方法流程图:图3为本专利技术实施例提供的问题判断模型训练整体流程示意图;图4为本专利技术实施例提供的食品安全自动问答系统的工作流程示意图;图5为本专利技术实施例提供的平均准确度和选取文章数量的关系示意图;图6为本专利技术实施例提供的一种基于LSTM的获取食品安全问题答案的系统结构图;图7为本专利技术实施例提供的电子设备的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的一种基于LSTM的获取食品安全问题答案的方法流程图,如图1所示,包括:S1,获取待回答问题;S2,将所述待回答问题输入至预先训练好的问答判断模型,获取本文档来自技高网...

【技术保护点】
1.一种基于LSTM的获取食品安全问题答案的方法,其特征在于,包括:/n获取待回答问题;/n将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。/n

【技术特征摘要】
1.一种基于LSTM的获取食品安全问题答案的方法,其特征在于,包括:
获取待回答问题;
将所述待回答问题输入至预先训练好的问答判断模型,获取所述问答判断模型输出的问题匹配结果;其中所述问答判断模型是基于食品安全问题答案样本集,使用人工标注的问题答案对及对应的匹配标签训练LSTM模型得到的。


2.根据权利要求1所述的基于LSTM的获取食品安全问题答案的方法,其特征在于,所述问答判断模型,通过以下步骤获得:
获取食品安全问题答案样本集;
按照问题答案对进行分类,将所述问题答案对中包含目标答案所在的句子定义为第一标签,将所述问题答案对中不包含目标答案的句子定义为第二标签;
基于所述第一标签和所述第二标签,将所述食品安全问题样本集划分为训练集、交叉验证集和测试集;
获取LSTM模型网络结构作为初始模型;
将所述训练集、所述交叉验证集和所述测试集输入至所述初始模型进行训练,得到所述问答判断模型。


3.根据权利要求2所述的基于LSTM的获取食品安全问题答案的方法,其特征在于,所述获取食品安全问题答案样本集,具体包括:
获取食品安全原始文档;
基于预设食品安全事件进行人工提问,在所述食品安全原始文档中标注具有与所述人工提问匹配答案的句子,将所述具有与所述人工提问的句子与所述人工提问构成匹配问题答案对;
在所述食品安全原始文档中标注与所述人工提问具有预设非关联度的句子,将所述具有预设非关联度的句子与所述人工提问构成不匹配问题答案对;
对所述匹配问题答案对和所述不匹配问题答案对进行分词,采用Word2Vec模型生成食品安全领域的词向量,将问题答案对中分词后的问题和答案映射到词向量空间生成问题答案对向量表示;
将所述词向量构建所述食品安全问题答案样本集。


4.根据权利要求3所述的基于LSTM的获取食品安全问题答案的方法,其特征在于,所述基于预设食品安全事件进行人工提问,在所述食品安全原始文档中标注具有与所述人工提问匹配答案的句子,将所述具有与所述人工提问的句子与所述人工提问构成匹配问题答案对,之前还包括:
使用Lucene倒排索引系统,在所述食品安全原始...

【专利技术属性】
技术研发人员:陈瑛赵筱钰陈昂轩董玉博侯文俊
申请(专利权)人:中国农业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1