【技术实现步骤摘要】
菜单信息的识别方法及装置
本专利技术涉及计算机
,具体涉及一种菜单信息的识别方法及装置。
技术介绍
光学字符识别(OpticalCharacterRecognition,简称OCR)可以对图片中的文字信息进行提取,比如阿里云通用OCR服务可以完成对图片上的文字信息的提取。在提取出文字信息后,可以通过人工智能通用技术如树模型(决策树、随机森林、GBDT、Xgboost等)、神经网络模型(CNN、DNN等)等来对文字信息进行分析识别,得到需求的文本内容。上述得到需求的文本内容的过程,可通过一套专用算法模型来实现,该算法模型综合文字信息提取功能以及分析识别功能。与此同时,近年来,随着传统餐饮行业逐渐向智能化方向的发展,将传统的纸质菜单中的菜单文本同步至各种终端或服务器中具有极大的实用价值。因此,利用专用算法模型对菜单图片中的文本进行识别可视为一种有效的方式。现有的对菜单图片中的菜单文本进行识别的方案中,算法模型通常是通过如下方式得到的:采集菜单图片样本集合,并对各个菜单图片样本进行样本信息的标注后,得到图片标注信息;将菜单图片样本和图片标注信息输入至初始化的模型中 ...
【技术保护点】
1.一种菜单信息的识别方法,包括:获取与样本菜品相对应的菜品文本信息;模拟所述菜品文本信息在菜单图片中的呈现样式,根据模拟结果生成与所述菜品文本信息相对应的仿真菜单图片;将所述仿真菜单图片确定为菜单样本,根据所述菜品文本信息确定与所述菜单样本相对应的样本标注信息;根据所述菜单样本以及与所述菜单样本相对应的样本标注信息训练菜单识别模型,通过所述菜单识别模型获取待识别的菜单图片的识别结果。
【技术特征摘要】
1.一种菜单信息的识别方法,包括:获取与样本菜品相对应的菜品文本信息;模拟所述菜品文本信息在菜单图片中的呈现样式,根据模拟结果生成与所述菜品文本信息相对应的仿真菜单图片;将所述仿真菜单图片确定为菜单样本,根据所述菜品文本信息确定与所述菜单样本相对应的样本标注信息;根据所述菜单样本以及与所述菜单样本相对应的样本标注信息训练菜单识别模型,通过所述菜单识别模型获取待识别的菜单图片的识别结果。2.根据权利要求1所述的方法,其中,所述模拟所述菜品文本信息在菜单图片中的呈现样式包括:按照预设的菜单模拟规则,模拟所述菜品文本信息在菜单图片中的呈现样式;其中,所述菜单模拟规则包括以下中的至少一个:样式类子规则、和/或场景类子规则。3.根据权利要求2所述的方法,其中,当所述菜单模拟规则包括样式类子规则时;所述模拟所述菜品文本信息在菜单图片中的呈现样式包括:从预设的字体库中选择与所述菜品文本信息相对应的字体样式,按照选择的字体样式在菜单图片中呈现所述菜品文本信息,得到与选择的字体样式相对应的模拟结果;和/或,从预设的布局模板库中选择与所述菜品文本信息相对应的布局样式模板,按照选择的布局样式模板在菜单图片中呈现所述菜品文本信息,得到与选择的布局样式模板相对应的模拟结果;其中,所述菜品文本信息中的各个文本项与布局样式模板中的各个文本框对应。4.根据权利要求3所述的方法,其中,所述预设的字体库中包括多种字体样式;所述模拟所述菜品文本信息在菜单图片中的呈现样式包括:从预设的字体库中选择与所述菜品文本信息相对应的多种字体样式,按照选择的多种字体样式分别在菜单图片中呈现所述菜品文本信息,得到与选择的多种字体样式相对应的多种模拟结果;所述根据模拟结果生成与所述菜品文本信息相对应的仿真菜单图片包括:根据所述与选择的多种字体样式相对应的多种模拟结果中的各种模拟结果分别生成与所述菜品文本信息相对应的仿真菜单图片。5.根据权利要求3或4所述的方法,其中,所述预设的布局模板库中包括多种布局样式模板;所述模拟所述菜品文本信息在菜单图片中的呈现样式包括:从预设的布局模板库中选择...
【专利技术属性】
技术研发人员:刘泉,吴洋,杨宇,陈晨,魏世康,张依蕾,许晓吟,田正中,兰杰,朱兴,
申请(专利权)人:口碑上海信息技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。