数据撷取方法、样板生成方法及非暂态电脑可读取记录媒体技术

技术编号:34088674 阅读:19 留言:0更新日期:2022-07-11 20:38
本发明专利技术提出一种数据撷取方法及一种样板生成方法。数据撷取方法读取待处理数据及撷取样板,待处理数据包含待处理数据内容,撷取样板包含撷取资讯与验证资讯,撷取资讯包含锚点资讯及相对于锚点资讯撷取范围。数据撷取方法根据锚点资讯检索待处理数据内容以获得符合锚点资讯参考点。数据撷取方法依据撷取范围于待处理数据撷取相对于参考点撷取数据。数据撷取方法还根据验证资讯筛选撷取数据,以产生结果数据。果数据。果数据。

【技术实现步骤摘要】
数据撷取方法、样板生成方法及非暂态电脑可读取记录媒体


[0001]本专利技术有关一种数据撷取方法、一种用于数据撷取样板生成方法以及一种非暂态电脑可读取记录媒体。

技术介绍

[0002]习知技术在摘录书面或数位数据摘要内容的过程,受限于数据之间部分内容的歧异,仅能透过人工方式逐一审阅每份文件再撷取数据。然而,如此方式不仅效率低落且易产生人为错误。
[0003]举例而言,同一医院在不同科别所使用的初诊数据表可能不完全相同。对于皮肤科与心脏科的初诊数据表,两者可能皆包含患者基本数据、紧急联络人、过敏药物等栏位数据。但对于心脏科的初诊数据表,可能还包含是否有植入物、是否对显影剂过敏、是否有中风病史等问题栏位。该些内容差异导致排板格式的差异。因此,当医院管理人员欲将各科病患的初诊数据表基本数据栏位内容撷取归档时,仅能以人工方式逐一处理。

技术实现思路

[0004]有鉴于此,申请人提出一种数据撷取方法。该数据撷取方法读取一待处理数据及一撷取样板,该待处理数据包含一待处理数据内容,该撷取样板包含一撷取资讯与一验证资讯,该撷取资讯包含一锚点资讯及相对于该锚点资讯一撷取范围。该数据撷取方法根据该锚点资讯检索该待处理数据内容以获得符合该锚点资讯一参考点。该数据撷取方法依据该撷取范围于该待处理数据撷取相对于该参考点一撷取数据。该数据撷取方法更根据该验证资讯筛选该撷取数据,以产生一结果数据。
[0005]申请人亦提出一种非暂态电脑可读取记录媒体用以储存一应用程序。该应用程序用以读取一待处理数据及一撷取样板,该待处理数据包含一待处理数据内容,该撷取样板包含一撷取资讯与一验证资讯,该撷取资讯包含一锚点资讯及相对于该锚点资讯一撷取范围。该应用程序根据该锚点资讯检索该待处理数据内容以获得符合该锚点资讯一参考点。该应用程序依据该撷取范围于该待处理数据撷取相对于该参考点一撷取数据。该应用程序更根据该验证资讯筛选该撷取数据,以产生一结果数据。
[0006]申请人还提出一种样板生成方法。该样板生成方法用以产生一撷取样板,该撷取样板用以撷取一待处理数据,该待处理数据包含一待处理数据内容。该样板生成方法读取一原始数据,该原始数据包含一原始数据内容,该原始数据内容包含一特征数据及相对于该特征数据一数据区块。该样板生成方法撷取该原始数据内容特征数据而定义一锚点资讯,该锚点资讯用以检索该待处理数据内容中符合该锚点资讯一参考点。该样板生成方法撷取该原始数据内容数据区块而定义一撷取范围,该撷取范围用以撷取该待处理数据内容中符合该撷取范围一撷取数据。该样板生成方法产生该锚点资讯与该撷取范围一相对位置关系。该样板生成方法定义一撷取资讯,该撷取资讯包含该锚点资讯、该撷取范围及该相对位置关系。该样板生成方法定义一验证资讯,该验证资讯用以筛选该撷取数据。该样板生成
方法更输出该撷取样板,该撷取样板包含该撷取资讯及该验证资讯。
附图说明
[0007][图1]是依据一些实施例数据撷取方法流程图;
[0008][图2A]是依据一些实施例待处理数据示意图;
[0009][图2B]是依据一些实施例文字内容撷取数据示意图;
[0010][图2C]是依据另一些实施例文字内容撷取数据示意图;
[0011][图3]是依据一些实施例图片内容撷取数据示意图;
[0012][图4]是依据一些实施例来源及目标数据库方块图;
[0013][图5]是依据一些实施例样板生成方法流程图;
[0014][图6A]是依据一些实施例原始数据示意图;
[0015][图6B]是依据一些实施例数据区块示意图;以及
[0016][图7]是依据另一些实施例原始数据示意图。
[0017]【符号说明】
[0018]1:待处理数据
[0019]11:待处理数据内容
[0020]111:参考点
[0021]112:撷取数据
[0022]2:原始数据
[0023]21:原始数据内容
[0024]211:数据区块
[0025]3:撷取样板
[0026]31:撷取范围
[0027]32:锚点资讯
[0028]321:第一锚点资讯
[0029]322:第二锚点资讯
[0030]33:验证资讯
[0031]4:来源数据库
[0032]5:目标数据库
[0033]6:伺服器
[0034]S01

S06:步骤
[0035]S11

S16:步骤
具体实施方式
[0036]图1是依据一些实施例数据撷取方法流程图,请参照图1。数据撷取方法读取待处理数据1(步骤S01),待处理数据1包含待处理数据内容11。数据撷取方法亦读取撷取样板3(步骤S02),撷取样板3包含撷取资讯与验证资讯33,撷取资讯包含锚点资讯32及相对于锚点资讯32撷取范围31。其后,数据撷取方法根据锚点资讯32检索待处理数据内容11以获得符合锚点资讯32参考点111(步骤S03)。数据撷取方法依据撷取范围31于待处理数据1撷取
HR”NOT“Beat analyzed%”)时,图2B撷取数据112为所欲筛除数据。
[0043]依据一些实施例,撷取数据112可以为待处理数据内容11上的特定文字,亦可以为特定图片。图3是依据一些实施例图片内容撷取数据示意图,请参照图3,撷取数据112为待处理数据内容11上的图表,而符合验证资讯33待处理数据内容11为图表上的座标轴数字。另外,于本实施例中,符合验证资讯33待处理数据内容11亦可以为图表上的座标栏位线所形成数个直线纹图案,抑或是包含直线纹图案及特定座标轴数字交集。
[0044]数据撷取方法完成撷取数据112筛选后,产生结果数据。结果数据可以是但不限于可携式文件格式(Portable Document Format,PDF)、文字格式、影像格式或前述格式组合。单笔结果数据可以包含一个或多个撷取数据112。
[0045]图4是依据一些实施例来源及目标数据库方块图,请参照图4。依据一些实施例,数据撷取方法运行于伺服器6,并存取至少一来源数据库4。举例而言,来源数据库4可以为超音波检查室数据库、电脑断层检查室数据库、血液检查室数据库。各个来源数据库4储存不同种类患者检查报告,即待处理数据1。依据一些实施例,数据撷取方法检测各个来源数据库4储存内容,当来源数据库4被置入新的待处理数据1时,即处理前述新的待处理数据1而产生相对应结果数据。依据一些实施例,数据撷取方法输出结果数据到至少一目标数据库5。举例而言,目标数据库5可以为心脏科数据库、骨科数据库、内分泌科数据库。对于心脏科所需结果数据,可能应包含超音波检查报告中心脏部分图片或血液检查报告中总胆固醇量数据;对于骨科所需结果数据,可能应包含电脑断层检查报告中股骨部分图片及血液检查报告中血钙浓度数据;对于内分泌科所需结果数据,可能应包含血液检查报告中雄性激素浓度数据。因此,就血本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据撷取方法,包含:读取一待处理数据及一撷取样板,该待处理数据包含一待处理数据内容,该撷取样板包含一撷取资讯与一验证资讯,该撷取资讯包含一锚点资讯及相对于该锚点资讯一撷取范围;根据该锚点资讯检索该待处理数据内容以获得符合该锚点资讯一参考点;依据该撷取范围于该待处理数据撷取相对于该参考点一撷取数据;以及根据该验证资讯筛选该撷取数据,以产生一结果数据。2.如权利要求1所述数据撷取方法,其特征在于,该锚点资讯是选自文字、图片、符号、图案、注记、孔洞及其组合所构成的群组。3.如权利要求1所述数据撷取方法,其特征在于,该验证资讯包含一验证公式,该数据撷取方法根据该验证公式筛选该撷取数据。4.如权利要求1所述数据撷取方法,其特征在于,还输出该结果数据到至少一目标数据库,该撷取样板更包含一目标数据库地址资讯,该数据撷取方法读取多个撷取样板,并根据各该撷取样板目标数据库地址资讯决定输出该结果数据该目标数据库。5.如权利要求4所述数据撷取方法,其特征在于,还存取至少一来源数据库,该来源数据库用以储存该待处理数据,该数据撷取方法检测该至少一来源数据库包含该待处理数据时,该数据撷取方法处理该待处理数据以产生该结果数据。6.一种非暂态电脑可读取记录媒体,用以储存一应用程序,该应用程序用以:读取一待处理数据及一撷取样板,该待处理数据包含一待处理数据内容,该撷取样板包含一撷取资讯与一验证资讯,该撷取资讯包含一锚点资讯及相对于该锚点资讯一撷取范围;根据该锚点资讯检索该待处理数据内容以获得符合该锚点资讯一参考点;依据该撷取...

【专利技术属性】
技术研发人员:田金山庄竣评
申请(专利权)人:上海中晶科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1