一种提取药品名称的方法技术

技术编号:39599258 阅读:6 留言:0更新日期:2023-12-03 19:59
一种提取药品名称的方法,其特征在于,包括如下步骤:步骤1,

【技术实现步骤摘要】
一种提取药品名称的方法


[0001]本专利技术涉及医药管理领域,特别涉及一种提取药品名称的方法


技术介绍

[0002]商品中台已经存在的部分商品没有图片,需要针对这部分商品进行图片补全,业务人员通过第三方系统提交商品图片到商品中台,运营在后台进行人工审核,现有的方式是,运营通过肉眼观察图片中的药品名称跟商品的药品名进行比较,来判断图片是否可用,图片数量多的情况下,审核效率低下

人工识别效率低下,商品图片维护工作成本高


技术实现思路

[0003]针对上述问题及现有方案的缺点,本专利提出一种基于
OCR
识别药品通用名的算法

该方法基于以下假设 :
1.
待识别的商品是药品类
。2.OCR
识别接口返回出来的结果返回多行文本,并标记每行文本所占的宽高
。3.
药盒上一般都是药品名称的字体最大

本专利技术提出了如下解决方案:一种提取药品名称的方法,包括如下步骤:步骤1, OCR
提取初步文字信息;步骤2,将所述初步文字信息中的干扰信息进行筛除以获得第一次过滤信息;步骤3,将所述第一次过滤信息与药品库中的标准药品名称进行对比,如果完全一致则匹配上并确定该第一过滤信息为药品通用名称,如果没有匹配上则在所述第一次过滤信息中查找占用面积最大的单个文字,并将含有该单个文字行文字作为药品通用名称

优选地,在所述步骤3中还包括步骤
3.1<br/>,查找特定的关键字,并将占用面积最大的所述关键字所在的行中的文字作为药品通用名称

优选地,所述关键字包括:颗粒,胶囊























浆和散中的一个或者多个

优选地,所述干扰信息包括:功能主治

批准文号

国药准字和使用方法中的一个或者多个

附图说明
[0004]图1基础了本专利技术的药品名称提取方法的流程图;图2为使用本专利技术的药品名称提取方法的一种情形

具体实施方式
[0005]本专利技术的基于
OCR
识别药品名的方法包括:文字识别模块,即:识别药盒上的文字,并输出识别结果

干扰项过滤模块,即:根据关键词过滤干扰项,如:文本中包含 功能主治

批准文号

国药准字

使用方法

食用方法

生产日期 等关键词的文本直接忽略

通用名提取模块,即:从过滤后的文本中,提取通
用名

如图1所示,一种提取药品名称的方法,包括如下步骤:步骤1, OCR
提取初步文字信息;步骤2,将所述初步文字信息中的干扰信息进行筛除以获得第一次过滤信息;步骤3,将所述第一次过滤信息与药品库中的标准药品名称进行对比,如果完全一致则匹配上并确定该第一过滤信息为药品通用名称,如果没有匹配上则在所述第一次过滤信息中查找占用面积最大的单个文字,并将含有该单个文字行文字作为药品通用名称

优选地,在所述步骤3中还包括步骤
3.1
,查找特定的关键字,并将占用面积最大的所述关键字所在的行中的文字作为药品通用名称

优选地,所述关键字包括:颗粒,胶囊























浆和散中的一个或者多个

优选地,所述干扰信息包括:功能主治

批准文号

国药准字和使用方法中的一个或者多个

如图2,本专利技术实现的方式为:提取文字结果:
{
ꢀꢀꢀꢀ
"words_result": [
ꢀꢀꢀꢀꢀꢀꢀꢀ
{
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"words": "
星鲨
D",
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"location": {
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"top": 15,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"left": 42,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"width": 42,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"height": 14
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
}
ꢀꢀꢀꢀꢀꢀꢀꢀ
},
ꢀꢀꢀꢀꢀꢀꢀꢀ
{
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"words": "

",
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"location": {
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"top": 22,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"left": 358,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"width": 9,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"height": 12
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
}
ꢀꢀꢀꢀꢀꢀꢀꢀ
},
ꢀꢀꢀꢀꢀꢀꢀꢀ
{
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"words": "3",
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"location": {
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"top": 26,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"left": 368,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"width": 8,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"height": 11
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
}
ꢀꢀꢀꢀꢀꢀꢀꢀ
},
ꢀꢀꢀꢀꢀꢀꢀꢀ
{
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"words": "
维生素
D
滴剂
",
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"location": {
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"top": 36,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"left": 44,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
"width": 2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种提取药品名称的方法,其特征在于,包括如下步骤:步骤1, OCR
提取初步文字信息;步骤2,将所述初步文字信息中的干扰信息进行筛除以获得第一次过滤信息;步骤3,将所述第一次过滤信息与药品库中的标准药品名称进行对比,如果完全一致则匹配上并确定该第一过滤信息为药品通用名称,如果没有匹配上则在所述第一次过滤信息中查找占用面积最大的单个文字,并将含有该单个文字行文字作为药品通用名称
。2.
根据权利要求1所述的提取药品名称的方法,其特征在于,在所述步骤3中还包括步骤
3.1
,查找特定的关键字,并将占用面积最大的所述关键字所在的行中的文字作为药品通用名称
。3.
根据权利要求2所述的提取药品名...

【专利技术属性】
技术研发人员:彭裔李锦程兰浩
申请(专利权)人:武汉小药药医药科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1