一种特定数据群集的端点搜索方法及其数据处理系统技术方案

技术编号:26800606 阅读:26 留言:0更新日期:2020-12-22 17:19
本发明专利技术揭示一种特定数据群集的端点搜索方法及其数据处理系统。所述特定数据群集的端点搜索方法包括:a)通过搜索系统接收所述数据集中包括的多个个体数据的各个数值的步骤;b)生成直方图数据的步骤,即通过使用所述搜索系统接收的所述各个数值,将所述数值可以具有的数值范围划分为具有预定组距的多个组,并将每个分割组相对应的个体数据的数量作为组值;及c)基于所述直方图数据,所述搜索系统搜索既存在于特定群集的终端的目标组的步骤。

【技术实现步骤摘要】
【国外来华专利技术】一种特定数据群集的端点搜索方法及其数据处理系统
本专利技术涉及一种特定数据群集的端点的搜索方法及其数据处理系统,更具体地,涉及一种在具有至少一个数据群集的数据集中可以有效地搜索特定数据群集的端点(例如,终点或起点等)的方法及其系统。
技术介绍
在许多技术或服务领域中正在分析和利用大量数据。例如,正在积极地应用分析特定医学数据以确定是否为不同患者使用药物或针对个体采用特定治疗方法等方式。图1示出了在预定的配套诊断工具中使用医学数据的示例,该诊断工具是用于选择适合于预定的目标抗癌剂的患者的手段。图1作为一个实施例,示出了使用用于检测在肺癌中的代表性生物标志物EGFR中特定基因(例如外显子18、19、20、21)突变的存在与否的测试试剂盒(例如,GenesWellTMddEGFR突变测试)所获得的医学数据。通过分析这些医学数据,可以在手术后开出靶向抗癌药之前选择对于治疗剂有效果的患者。但是,本专利技术的技术思想不限于所述实施例的应用,并且可以用于各种数据分析。另外,如图1所示,图中的每个点代表各个医学数据。另外,在实施本文档来自技高网...

【技术保护点】
1.一种特定数据群集的端点搜索方法,/n作为一种在具有至少一个群集的数据集中搜索特定群集的端点的方法,包括:/na)通过搜索系统接收所述数据集中包括的多个个体数据的各个数值的步骤;/nb)生成直方图数据的步骤,即通过使用所述搜索系统接收的所述各个数值,将所述数值可以具有的数值范围划分为具有预定组距的多个组,并将每个分割组相对应的个体数据的数量作为组值;/nc)使所述直方图数据平滑化的步骤;以及/nd)使所述平滑后的直方图数据差分化的步骤;/ne)基于差分后的直方图数据,搜索既满足预定的基准条件又存在于特定群集的终端的目标组的步骤。/n

【技术特征摘要】
【国外来华专利技术】20180508 KR 10-2018-00525221.一种特定数据群集的端点搜索方法,
作为一种在具有至少一个群集的数据集中搜索特定群集的端点的方法,包括:
a)通过搜索系统接收所述数据集中包括的多个个体数据的各个数值的步骤;
b)生成直方图数据的步骤,即通过使用所述搜索系统接收的所述各个数值,将所述数值可以具有的数值范围划分为具有预定组距的多个组,并将每个分割组相对应的个体数据的数量作为组值;
c)使所述直方图数据平滑化的步骤;以及
d)使所述平滑后的直方图数据差分化的步骤;
e)基于差分后的直方图数据,搜索既满足预定的基准条件又存在于特定群集的终端的目标组的步骤。


2.根据权利要求1所述的特定数据群集的端点搜索方法,其特征为,
基于所述差分后的直方图数据,搜索满足预定基准条件并且存在于特定群集的终端的目标组的步骤包括:在差分后的直方图数据中以一定方向搜索各个组的组值,搜索满足所述基准条件的组作为所述目标组的步骤,其中所述基准条件为,满足当前搜索的组之前的组值小于其之后的组值,所述之前组值等于或小于0,所述之后的组值等于或大于0的第1个组。


3.根据权利要求1所述的特定数据群集的端点搜索方法,其特征为,
所述特定数据群集的端点搜索方法还包括:f)当使用预定的组距搜索满足所述基准条件的目标组而搜索不到时,将所述组距减小到预定值的步骤;
使用减小的组距再次执行步骤b)至e)的步骤。


4.一种特定数据群集的端点搜索方法,
作为一种在具有至少一个群集的数据集中搜索特定群集的端点的方法,包括:
a)通过搜索系统接收所述数据集中包括的多个个体数据的各个数值的步骤;
b)生成直方图数据的步骤,即通过使用所述搜索系统接收的所述各个数值,将所述数值可以具有的数值范围划分为具有预定组距的多个组,并将每个分割组相对应的个体数据的数量作为组值;

【专利技术属性】
技术研发人员:金善禹
申请(专利权)人:第一百欧有限公司
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1