【技术实现步骤摘要】
一种提取药品名称的方法
[0001]本专利技术涉及医药管理领域,特别涉及一种提取药品名称的方法
。
技术介绍
[0002]商品中台已经存在的部分商品没有图片,需要针对这部分商品进行图片补全,业务人员通过第三方系统提交商品图片到商品中台,运营在后台进行人工审核,现有的方式是,运营通过肉眼观察图片中的药品名称跟商品的药品名进行比较,来判断图片是否可用,图片数量多的情况下,审核效率低下
。
人工识别效率低下,商品图片维护工作成本高
。
技术实现思路
[0003]针对上述问题及现有方案的缺点,本专利提出一种基于
OCR
识别药品通用名的算法
。
该方法基于以下假设 :
1.
待识别的商品是药品类
。2.OCR
识别接口返回出来的结果返回多行文本,并标记每行文本所占的宽高
。3.
药盒上一般都是药品名称的字体最大
。
本专利技术提出了如下解决方案:一种提取药品名称的方法,包括如下步骤:步骤1, OCR
提取初步文字信息;步骤2,将所述初步文字信息中的干扰信息进行筛除以获得第一次过滤信息;步骤3,将所述第一次过滤信息与药品库中的标准药品名称进行对比,如果完全一致则匹配上并确定该第一过滤信息为药品通用名称,如果没有匹配上则在所述第一次过滤信息中查找占用面积最大的单个文字,并将含有该单个文字行文字作为药品通用名称
。
优选地,在所述步骤3中还包括步骤
3.1< ...
【技术保护点】
【技术特征摘要】
1.
一种提取药品名称的方法,其特征在于,包括如下步骤:步骤1, OCR
提取初步文字信息;步骤2,将所述初步文字信息中的干扰信息进行筛除以获得第一次过滤信息;步骤3,将所述第一次过滤信息与药品库中的标准药品名称进行对比,如果完全一致则匹配上并确定该第一过滤信息为药品通用名称,如果没有匹配上则在所述第一次过滤信息中查找占用面积最大的单个文字,并将含有该单个文字行文字作为药品通用名称
。2.
根据权利要求1所述的提取药品名称的方法,其特征在于,在所述步骤3中还包括步骤
3.1
,查找特定的关键字,并将占用面积最大的所述关键字所在的行中的文字作为药品通用名称
。3.
根据权利要求2所述的提取药品名...
【专利技术属性】
技术研发人员:彭裔,李锦程,兰浩,
申请(专利权)人:武汉小药药医药科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。