一种网络餐饮风险识别方法及系统技术方案

技术编号:17098293 阅读:29 留言:0更新日期:2018-01-21 10:30
本发明专利技术公开了一种网络餐饮风险识别方法,包括以下步骤:采集网络餐饮店的关键信息;建立证照信息库;证照信息比对;经营异常判断;风险评估,建立多维风险评估模型,并计算餐饮风险值。本发明专利技术同时还提供了一种网络餐饮风险识别系统。本发明专利技术通过对网络餐饮店进行信息采集和分析,辅助食品监管人员及时发现网上餐饮违规经营目标、预警风险、精确执法。

A network catering risk identification method and system

The invention discloses a network catering risk identification method, which comprises the following steps: the key of network information collection of restaurants; establish certification information base; license information matching; abnormal operation judgment; risk assessment, establish a multi-dimensional risk assessment model, and calculate the risk value of food. At the same time, the invention also provides a network catering risk identification system. Through collecting and analyzing the information of online restaurants, the food assistant supervisors can find out online restaurant's illegal business objectives, early warning risks and precise law enforcement.

【技术实现步骤摘要】
一种网络餐饮风险识别方法及系统
本专利技术涉及数据分析
,特别涉及一种网络餐饮风险识别方法及系统。
技术介绍
随着互联网的高速发展和Web技术的不断改进,网络应用及信息传播途径日益多样化和便利。2016年网络餐饮外卖市场规模达980亿,且未来3年都将处于持续的增长趋势,餐饮安全问题层出不穷。相关单位实际监管中遇到一照多用、一址多店、证照假冒、无证经营、证照过期等多种技术问题,为监管带来困难。
技术实现思路
本专利技术的目的在于提供一种网络餐饮风险识别方法,其通过对网络餐饮店进行信息采集和分析,辅助食品监管人员及时发现网上餐饮违规经营目标、预警风险、精确执法。本专利技术同时还提供了一种网络餐饮风险识别系统。为实现上述目的,本专利技术采用以下技术方案:一种网络餐饮风险识别方法,包括以下步骤:S1、采集网络餐饮店的关键信息,所述关键信息包括证照信息、地址、电话号码、产品、销量、评论条数及评论内容;S2、建立证照信息库,所述证照信息库包含网络餐饮店的证照数据,所述证照数据包括工商营业执照和餐饮经验许可证数据;S3、证照信息比对,判断证照是否存在缺失、虚假及重复使用,若是则列为证照风险要素;S4、经营异常判断,采用正则表达式过滤出模糊地址,对判定为模糊地址的网络餐饮店,列为地址模糊风险要素,对比计算多个网络餐饮店的地址,若一致,则判定为地址重复的网络餐饮店,列为地址重复风险要素,对比计算多个网络餐饮店的电话号码,若一致,则判定为电话号码重复的网络餐饮店,列为电话号码重复风险要素;S5、风险评估,建立多维风险评估模型,并计算餐饮风险值。优选地,步骤S3中所述的判断证照是否存在重复使用,采用图片唯一性判断方式对步骤S1采集到的多家网络餐饮店的证照信息进行分析,判断是否存在多家网络餐饮店重复使用证照。优选地,步骤S3中所述的判断证照是否存在虚假及重复使用,通过以下方法实现:S31、预处理:对证照信息的图像进行二值化、噪声去除及倾斜较正处理,获得文档图片;S32、版面分析:将所述文档图片分段落;S33、字符切割:对文档图片进行字符切割处理;S34、字符识别:对步骤S31中切割出来的字符进行字符识别,获得证照信息字符;S35、版面恢复:对所述证照信息字符进行排版,使排版后的文字段落、位置、顺序与所述文档图片一致;S36、校正:根据语言上下文的关系,步骤S35获得的文字内容进行较正,最终获得证照文字信息;S37、对多家网络餐饮店的证照文字信息进行分析比对,判断是否存在多家网络餐饮店重复使用证照。S38、将网络餐饮店的证照文字信息与所述证照信息库的证照数据进行比对,判断是否存在虚假。优选地,步骤S1中所述的采集网络餐饮店的关键信息,通过以下方法实现:通过网络爬虫的方式,自动采集网络餐饮店的关键信息,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对订餐平台上的网络餐饮店信息进行请求,各搜索引擎对下载分页进行解析,提取并格式化搜索结果,搜索结果保存在数据库中。优选地,所述搜索结果采用的记录格式为:Record(RID,title,url,urlID,inTime,docTime,docSummary)。优选地,所述关键信息还包括餐饮店上线时间和月销量信息。优选地,所述步骤S4还包括:上线时间风险判断,计算当前时间与网络餐饮店的上线时间的差值,若该差值小于预先设定的上线时间阈值,则认定为新上线商家,列为新上线商家风险要素;月销量环比风险判断,判断月销量环比是否大于预先设定的环比阈值,若是,则列为月销环比大风险要素;差评风险判断,判断差评数是否大于预先设定的差评阈值,若是,则列为差评风险要素。优选地,步骤S5中所述的计算餐饮风险值通过以下方法实现:对各项风险要素分别赋予风险分值和权重值;对各项风险因素,计算其风险分值和权重值的乘积,获得风险中间值;计算各项风险因素的风险中间值之和,获得所述餐饮风险值。一种网络餐饮风险识别系统,包括:关键信息采集模块,其用于采集网络餐饮店的关键信息,所述关键信息包括证照信息、地址、电话号码、产品、销量、评论条数及评论内容;证照管理模块,其用于建立证照信息库,所述证照信息库包含网络餐饮店的证照数据,所述证照数据包括工商营业执照和餐饮经验许可证数据;证照信息比对模块,其用于判断网络餐饮店的证照是否存在缺失、虚假及重复使用,若是则列为证照风险要素;经营异常判断模块,其用于判断网络餐饮店是否存在地址模糊、地址重复、电话号码重复的情况,若存在则列为风险要素;风险评估模块,其用于建立多维风险评估模型,并计算餐饮风险值。采用上述技术方案后,本专利技术与
技术介绍
相比,具有如下优点:本专利技术通过对网络餐饮店进行信息采集和分析,辅助食品监管人员及时发现网上餐饮违规经营目标、预警风险、精确执法;通过证照审计、地址信息、销量排行、评价口碑等多个维度建立外卖餐饮商家风险指数评估模型,为执法人员及时发现涉嫌违法线索、精确执法提供依据;针对一照多用、一址多店、证照假冒、无证经营等多个日常监管的痛点,分项监测发现问题风险;通过分析区域内餐饮商家的生命周期、销量、口碑、舆情热点等经营动态,为监管决策提供参考依据。附图说明图1为本专利技术实施例一的流程示意图;图2为本专利技术实施例二的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例一请参阅图1,本专利技术公开了一种网络餐饮风险识别方法,包括以下步骤:S1、采集网络餐饮店的关键信息,关键信息包括证照信息、地址、电话号码、产品、销量、评论条数及评论内容。本步骤通过以下方法实现:通过网络爬虫的方式,自动采集网络餐饮店的关键信息,启动多个搜索引擎爬虫以多线程的方式模拟浏览器对订餐平台上的网络餐饮店信息进行请求,各搜索引擎对下载分页进行解析,提取并格式化搜索结果,搜索结果保存在数据库中。搜索结果采用的记录格式为:Record(RID,title,url,urlID,inTime,docTime,docSummary)。对搜索引擎下载分页的解析结果,经过URL排重分析、排除广告等无关内容等优化选择处理后保存于数据库中。为了深入判断餐饮店是否有风险,有时需要综合判断多个餐饮店,因此,在采集餐饮店关键信息的时候,可同时采集多个,甚至可采集某一地区的所有餐饮店的关键信息。S2、建立证照信息库,证照信息库包含网络餐饮店的证照数据,证照数据包括工商营业执照和餐饮经验许可证数据。证照信息库需要通过政府相关主管部门开放数据收集建设而成。对于从事餐饮经营的商家而言,必须获得工商营业执照和和餐饮经营监管部门发放的餐饮经营许可证,因此建立证照信息库对判断餐饮店是否有风险至关重要。S3、证照信息比对,判断证照是否存在缺失、虚假及重复使用,若是则列为证照风险要素。对于判断证照是否存在重复使用,采用图片唯一性判断方式对步骤S1采集到的多家网络餐饮店的证照信息进行分析,判断是否存在多家网络餐饮店重复使用证照。在本实施例中,图片唯一性判断方式具体为,分别计算多家网络餐饮店的证照信息(图片格式)的MD5值,通过比对MD5值判断是否存在多家网络餐饮店重复使用证照。对于判断证照是否存在虚假及重复使用,通本文档来自技高网
...
一种网络餐饮风险识别方法及系统

【技术保护点】
一种网络餐饮风险识别方法,其特征在于,包括以下步骤:S1、采集网络餐饮店的关键信息,所述关键信息包括证照信息、地址、电话号码、产品、销量、评论条数及评论内容;S2、建立证照信息库,所述证照信息库包含网络餐饮店的证照数据,所述证照数据包括工商营业执照和餐饮经验许可证数据;S3、证照信息比对,判断证照是否存在缺失、虚假及重复使用,若是则列为证照风险要素;S4、经营异常判断,采用正则表达式过滤出模糊地址,对判定为模糊地址的网络餐饮店,列为地址模糊风险要素,对比计算多个网络餐饮店的地址,若一致,则判定为地址重复的网络餐饮店,列为地址重复风险要素,对比计算多个网络餐饮店的电话号码,若一致,则判定为电话号码重复的网络餐饮店,列为电话号码重复风险要素;S5、风险评估,建立多维风险评估模型,并计算餐饮风险值。

【技术特征摘要】
1.一种网络餐饮风险识别方法,其特征在于,包括以下步骤:S1、采集网络餐饮店的关键信息,所述关键信息包括证照信息、地址、电话号码、产品、销量、评论条数及评论内容;S2、建立证照信息库,所述证照信息库包含网络餐饮店的证照数据,所述证照数据包括工商营业执照和餐饮经验许可证数据;S3、证照信息比对,判断证照是否存在缺失、虚假及重复使用,若是则列为证照风险要素;S4、经营异常判断,采用正则表达式过滤出模糊地址,对判定为模糊地址的网络餐饮店,列为地址模糊风险要素,对比计算多个网络餐饮店的地址,若一致,则判定为地址重复的网络餐饮店,列为地址重复风险要素,对比计算多个网络餐饮店的电话号码,若一致,则判定为电话号码重复的网络餐饮店,列为电话号码重复风险要素;S5、风险评估,建立多维风险评估模型,并计算餐饮风险值。2.如权利要求1所述的一种网络餐饮风险识别方法,其特征在于,步骤S3中所述的判断证照是否存在重复使用,采用图片唯一性判断方式对步骤S1采集到的多家网络餐饮店的证照信息进行分析,判断是否存在多家网络餐饮店重复使用证照。3.如权利要求1所述的一种网络餐饮风险识别方法,其特征在于,步骤S3中所述的判断证照是否存在虚假及重复使用,通过以下方法实现:S31、预处理:对证照信息的图像进行二值化、噪声去除及倾斜较正处理,获得文档图片;S32、版面分析:将所述文档图片分段落;S33、字符切割:对文档图片进行字符切割处理;S34、字符识别:对步骤S31中切割出来的字符进行字符识别,获得证照信息字符;S35、版面恢复:对所述证照信息字符进行排版,使排版后的文字段落、位置、顺序与所述文档图片一致;S36、校正:根据语言上下文的关系,步骤S35获得的文字内容进行较正,最终获得证照文字信息;S37、对多家网络餐饮店的证照文字信息进行分析比对,判断是否存在多家网络餐饮店重复使用证照。S38、将网络餐饮店的证照文字信息与所述证照信息库的证照数据进行比对,判断是否存在虚假。4.如权利要求1-3任一项所述的一种网络餐饮风险识别方法,其特征在于,步骤S1中所述的采集网...

【专利技术属性】
技术研发人员:吴少茂王志永郭建辉林文东林伟艺
申请(专利权)人:厦门美亚商鼎信息科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1