一种基于类别扩展的数据建模方法及系统技术方案

技术编号:38750874 阅读:13 留言:0更新日期:2023-09-09 11:17
本发明专利技术提供一种基于类别扩展的数据建模方法及系统,其中方法包括:搜罗用户的用于数据建模的基础数据的第一类别;基于所述第一类别和预设的类别扩展库,确定第二类别;获取所述第二类别对应的扩展数据;基于所述基础数据和所述扩展数据,进行数据建模。本发明专利技术的基于类别扩展的数据建模方法及系统,提升了数据建模的结果的全面性,可高效达到数据建模用于数据分析的目的,其次,也无需用户自行收集更多的其他类别的基础数据,降低了人力成本,提升了便捷性,同时,也更加人性化。也更加人性化。也更加人性化。

【技术实现步骤摘要】
一种基于类别扩展的数据建模方法及系统


[0001]本专利技术涉及计算机数据处理
,特别涉及一种基于类别扩展的数据建模方法及系统。

技术介绍

[0002]目前,用户想要进行数据建模时,用于数据建模的基础数据的类别往往是有限的,比如:用户想要构建一个半导体产业链图谱,准备的基础数据有光刻胶和硅晶圆两种半导体材料的介绍信息、光刻机一种半导体设备的介绍信息等,然而,半导体材料还有光掩膜板等,半导体设备还有单晶炉、氧化炉等。这样的话,可能会导致数据建模的结果不够全面,无法高效达到数据建模用于数据分析的目的(比如:构建产业链图谱用于产业分析)。另外,用户也可自行收集更多的其他类别的基础数据,但人力成本较大,便捷性较低,同时,也不够人性化。
[0003]因此,亟需一种解决办法。

技术实现思路

[0004]本专利技术目的之一在于提供了一种基于类别扩展的数据建模方法,对用户的用于数据建模的基础数据的第一类别进行扩展,获得第二类别,基于第二类别的扩展数据和基础数据一起进行数据建模,提升了数据建模的结果的全面性,可高效达到数据建模用于数据分析的目的,其次,也无需用户自行收集更多的其他类别的基础数据,降低了人力成本,提升了便捷性,同时,也更加人性化。
[0005]本专利技术实施例提供的一种基于类别扩展的数据建模方法,包括:
[0006]搜罗用户的用于数据建模的基础数据的第一类别;
[0007]基于第一类别和预设的类别扩展库,确定第二类别;
[0008]获取第二类别对应的扩展数据;
[0009]基于基础数据和扩展数据,进行数据建模。
[0010]优选的,搜罗用户的用于数据建模的基础数据的第一类别,包括:
[0011]获取用户对应的预设的权限场景库;
[0012]当用户使用智能终端进入权限场景库中的任一权限场景浏览场景界面时,获取场景界面内的第一文字布局;
[0013]将第一文字布局与预设的第一标准文字布局库中的任一第一标准文字布局进行匹配,获取第一匹配度;
[0014]当存在第一匹配度大于等于预设的第一匹配度阈值,获取最大第一匹配度的第一标准文字布局对应的预设的第一位置映射规则;
[0015]基于第一位置映射规则,将预设的框选提示信息映射进场景界面中;
[0016]当用户在场景界面中进行文字框选的框选动作时,获取框选动作的框选动作信息;
[0017]基于预设的第一特征提取模板,对框选动作信息进行特征提取,获得第一框选动作特征集;
[0018]将第一框选动作特征集与预设的标准框选动作特征集进行匹配,获取第二匹配度;
[0019]当第二匹配度大于等于预设的第二匹配度阈值时,接力框选动作在场景界面中进行自动文字框选;
[0020]与用户交互确定是否进入文字框选停止时机;
[0021]当为是时,停止进行自动文字框选,获取最终框选的文字内容,并作为基础数据;
[0022]对基础数据进行类别解析,确定第一类别。
[0023]优选的,接力框选动作在场景界面中进行自动文字框选,包括:
[0024]基于预设的第二特征提取模板,对框选动作信息进行特征提取,获得第二框选动作特征集;
[0025]基于预设的自动文字框选规则生成模板,根据第二框选动作特征集,生成自动文字框选规则;
[0026]基于自动文字框选规则,接力框选动作在场景界面中进行自动文字框选。
[0027]优选的,与用户交互确定是否进入文字框选停止时机,包括:
[0028]获取场景界面中剩余未框选文字的第二文字布局;
[0029]将第二文字布局与预设的第二标准文字布局库中的任一第二标准文字布局进行匹配,获取第三匹配度;
[0030]当存在第三匹配度大于等于预设的第三匹配度阈值时,获取获取最大第三匹配度的第二标准文字布局对应的预设的第二位置映射规则;
[0031]基于第二位置映射规则,将预设的框选结束位置标记提示信息映射进场景界面中;
[0032]当用户在场景界面中标记框选结束位置时,若自动文字框选抵达至框选结束位置,确定进入文字框选停止时机。
[0033]优选的,基于第一类别和预设的类别扩展库,确定第二类别,包括:
[0034]从类别扩展库中确定第一类别对应的第三类别;
[0035]统计第三类别的类别数目;
[0036]当类别数目为1时,将第三类别作为第二类别;
[0037]当类别数目不为1时,获取用户对第三类别偏好的偏好值;
[0038]基于目标类别条件,根据偏好值,尝试从第三类别中确定目标类别;
[0039]当尝试成功时,将目标类别作为第二类别;
[0040]否则,将偏好值大于等于预设的第一偏好阈值的第三类别作为第二类别;
[0041]其中,目标类别条件包括:
[0042]目标类别的偏好值大于等于预设的第二偏好阈值;
[0043]目标类别的偏好值大于其他第三类别的偏好值的差值大于等于预设的差值阈值。
[0044]优选的,获取用户对第三类别偏好的偏好值,包括:
[0045]获取第三类别与第一类别之间的类别关系;
[0046]基于预设的类别扩展选择记录检索条件生成模板,根据类别关系,生成类别扩展
选择记录检索条件;
[0047]获取用户对应的预设的类别扩展选择记录库;
[0048]从类别扩展选择记录中检索出符合类别扩展选择记录检索条件的类别扩展选择记录;
[0049]从预设的偏好值库中确定类别扩展选择记录的记录数目对应的偏好值。
[0050]优选的,获取第二类别对应的扩展数据,包括:
[0051]从预设的扩展数据库中确定第二类别对应的扩展数据。
[0052]本专利技术实施例提供的一种基于类别扩展的数据建模系统,其特征在于,包括:
[0053]类别搜罗模块,用于搜罗用户的用于数据建模的基础数据的第一类别;
[0054]类别确定模块,用于基于第一类别和预设的类别扩展库,确定第二类别;
[0055]扩展数据获取模块,用于获取第二类别对应的扩展数据;
[0056]数据建模模块,用于基于基础数据和扩展数据,进行数据建模。
[0057]优选的,类别搜罗模块搜罗用户的用于数据建模的基础数据的第一类别,包括:
[0058]获取用户对应的预设的权限场景库;
[0059]当用户使用智能终端进入权限场景库中的任一权限场景浏览场景界面时,获取场景界面内的第一文字布局;
[0060]将第一文字布局与预设的第一标准文字布局库中的任一第一标准文字布局进行匹配,获取第一匹配度;
[0061]当存在第一匹配度大于等于预设的第一匹配度阈值,获取最大第一匹配度的第一标准文字布局对应的预设的第一位置映射规则;
[0062]基于第一位置映射规则,将预设的框选提示信息映射进场景界面中;
[006本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于类别扩展的数据建模方法,其特征在于,包括:搜罗用户的用于数据建模的基础数据的第一类别;基于所述第一类别和预设的类别扩展库,确定第二类别;获取所述第二类别对应的扩展数据;基于所述基础数据和所述扩展数据,进行数据建模。2.如权利要求1所述的一种基于类别扩展的数据建模方法,其特征在于,所述搜罗用户的用于数据建模的基础数据的第一类别,包括:获取用户对应的预设的权限场景库;当用户使用智能终端进入所述权限场景库中的任一权限场景浏览场景界面时,获取所述场景界面内的第一文字布局;将所述第一文字布局与预设的第一标准文字布局库中的任一第一标准文字布局进行匹配,获取第一匹配度;当存在所述第一匹配度大于等于预设的第一匹配度阈值,获取最大所述第一匹配度的所述第一标准文字布局对应的预设的第一位置映射规则;基于所述第一位置映射规则,将预设的框选提示信息映射进所述场景界面中;当用户在所述场景界面中进行文字框选的框选动作时,获取所述框选动作的框选动作信息;基于预设的第一特征提取模板,对所述框选动作信息进行特征提取,获得第一框选动作特征集;将所述第一框选动作特征集与预设的标准框选动作特征集进行匹配,获取第二匹配度;当所述第二匹配度大于等于预设的第二匹配度阈值时,接力所述框选动作在所述场景界面中进行自动文字框选;与用户交互确定是否进入文字框选停止时机;当为是时,停止进行自动文字框选,获取最终框选的文字内容,并作为所述基础数据;对所述基础数据进行类别解析,确定所述第一类别。3.如权利要求2所述的一种基于类别扩展的数据建模方法,其特征在于,接力所述框选动作在所述场景界面中进行自动文字框选,包括:基于预设的第二特征提取模板,对所述框选动作信息进行特征提取,获得第二框选动作特征集;基于预设的自动文字框选规则生成模板,根据所述第二框选动作特征集,生成自动文字框选规则;基于所述自动文字框选规则,接力所述框选动作在所述场景界面中进行自动文字框选。4.如权利要求2所述的一种基于类别扩展的数据建模方法,其特征在于,与用户交互确定是否进入文字框选停止时机,包括:获取所述场景界面中剩余未框选文字的第二文字布局;将所述第二文字布局与预设的第二标准文字布局库中的任一第二标准文字布局进行匹配,获取第三匹配度;
当存在所述第三匹配度大于等于预设的第三匹配度阈值时,获取获取最大所述第三匹配度的所述第二标准文字布局对应的预设的第二位置映射规则;基于所述第二位置映射规则,将预设的框选结束位置标记提示信息映射进所述场景界面中;当用户在所述场景界面中标记框选结束位置时,若自动文字框选抵达至所述框选结束位置,确定进入文字框选停止时机。5.如权利要求1所述的一种基于类别扩展的数据建模方法,其特征在于,基于所述第一类别和预设的类别扩展库,确定第二类别,包括:从所述类别扩展库中确定所述第一类别对应的第三类别;统计所述第三类别的类别数目;当所述类别数目为1时,将所述第三类别作为所述第二类别;当所述类别数目不为1时,获取用户对所述第三类别偏好的偏好值;基于目标类别条件,根据所述偏好值,尝试从所述第三类别中确定目标类别;当尝试成功时,将所述目标类别作...

【专利技术属性】
技术研发人员:金震张京日张金平张宪涛
申请(专利权)人:北京三维天地科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1