一种基于机器学习和边缘计算的职业属性识别方法及系统技术方案

技术编号:24353612 阅读:32 留言:0更新日期:2020-06-03 02:06
本发明专利技术提出了一种基于机器学习和云计算、边缘计算的职业属性识别方法、系统及计算机可读存储介质,通过边缘爬虫网络计算方法以及用户的输入获得待分类的职业属性,进行语义、语法、语境分析以及初步识别,对初步识别结果训练学习识别职业属性分类,本发明专利技术采用边缘分布式计算过滤掉多数信息,减轻智能学习计算压力,提高系统职业属性识别准确率和工作效率。

A method and system of professional attribute recognition based on machine learning and edge computing

【技术实现步骤摘要】
一种基于机器学习和边缘计算的职业属性识别方法及系统
本专利技术涉及云计算的
,特别涉及一种基于机器学习和边缘计算的职业属性识别方法及系统。
技术介绍
近年来,随着时代的发展与科技的进步,信息社会已经到来,以云计算、机器学习、边缘计算等为代表的新一代信息技术的发展给人们的工作、学习、生活的方式带来了巨大的改变。云计算是通过网络“云”将程序分布式部署的计算方式,可提高数据处理效率和系统可靠性。机器学习是让计算机程序像人一样可以不断的积累经验,并且在这些经验的基础上性能得到提升的一种计算机技术,可提高对知识的学习和总结能力。边缘计算是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务,该技术将部分算法通过本地设备实现而无需交由云端,处理过程将在本地边缘计算层完成,大大提升处理效率,减轻云端的负荷。职业分类是指依据一定的科学方式和标准,按照职业的性质和特点,对不同职业进行系统地划分和归类,使其成为合理有序的职业类别体系,随着社会进步,社会分工在不断发展,职业类别将逐渐增多,现有职业分类方法基本依靠人工处理,不能实时自动进行分类,并且存在职业属性分类效率低、准确率低的问题。
技术实现思路
基于上述问题,本专利技术提出了一种基于机器学习和云计算、边缘计算的职业属性识别方法及系统,构建信息识别、分析、学习训练平台,采用边缘分布式计算过滤无关信息,减小计算压力,提高系统职业属性识别准确率和工作效率。本专利技术提供如下技术方案:一种基于机器学习和边缘计算的职业属性识别方法,所述方法包括:步骤101,制定网页搜索范围策略、网页搜索方法策略,根据所述网页搜索范围策略、网页搜索方法策略执行爬虫算法识别职业种类,对比数据库,识别第一职业属性。执行爬虫监听调度模块算法更新、数据库更新命令,传递所述第一职业属性并提交分析请求;步骤102,接收所述分析请求,分析所述第一职业属性,将段落文字通过语义、语法、语境分析,提取所述第一职业属性关键词,将所述关键词转换为十六进制的ASCII编码值,将ASCII编码值采用算法拼接,作为所述第一职业属性的标记特征值;步骤103,接收所述第一职业属性的标记特征值,遍历比对所述第一职业属性的标记特征值与数据库模块的职业属性特征值,识别所述第一职业属性是否为现有职业属性,若否则归入初步识别结果。步骤104,采用最低风险回归随机预测方法,对所述初步识别结果进行机器学习,获得所述第一职业属性分类。其中,基于机器学习和云计算、边缘计算的职业属性识别方法还包括监听边缘爬虫网络计算体模块执行状态,对异常、死机边缘爬虫网络计算体模块进行重启。其中,所述步骤103识别所述第一职业属性是否为现有职业属性具体为:比对置信度和预设阈值,若所述置信度大于或等于预设阈值则第一职业属性为现有职业属性,否则为新职业属性。其中,获得所示第一职业属性分类后,发送至客户端模块展示给用户。一种基于机器学习和边缘计算的职业属性识别系统,所述系统包括:至少一个边缘爬虫网络计算体模块和云计算平台。所述云计算平台包括爬虫监督调度模块、文字分析模块、初步识别模块、数据库模块、智能学习模块、信息交互模块。所述边缘爬虫网络计算体模块用于制定网页搜索范围策略、网页搜索方法策略,根据所述网页搜索范围策略、网页搜索方法策略执行爬虫算法识别职业种类,对比数据库,识别第一职业属性。执行爬虫监听调度模块算法更新、数据库更新命令,传递所述第一职业属性并提交分析请求;文字分析模块用于接收所述分析请求,分析所述第一职业属性,将段落文字通过语义、语法、语境分析,提取所述第一职业属性关键词,将所述关键词转换为十六进制的ASCII编码值,将ASCII编码值采用算法拼接,作为所述第一职业属性的标记特征值;初步识别模块用于接收所述第一职业属性的标记特征值,遍历比对所述第一职业属性的标记特征值与数据库模块的职业属性特征值,识别所述第一职业属性是否为现有职业属性,若否则归入初步识别结果。所述数据库模块用于存储职业属性分类信息和职业属性ASCII编码值,以及机器学习过程信息。所述智能学习模块用于采用最低风险回归随机预测方法,对所述初步识别结果进行机器学习,获得所述第一职业属性分类。其中,所述爬虫监听调度模块用于监听边缘爬虫网络计算体模块执行状态,对异常、死机边缘爬虫网络计算体模块进行重启,接收边缘爬虫网络计算体模块输入的分析数据,广播爬虫算法与职业属性数据库至所述边缘爬虫网络计算体模块。其中,所述识别所述第一职业属性是否为现有职业属性具体为:比对置信度和预设阈值,若所述置信度大于或等于预设阈值则第一职业属性为现有职业属性,否则为新职业属性。其中,获得所示第一职业属性分类后,发送至客户端模块展示给用户。另外,本专利技术还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行前述的基于机器学习和云计算、边缘计算的职业属性识别方法。本专利技术提出了一种基于机器学习和云计算、边缘计算的职业属性识别方法、系统及计算机可读存储介质,通过边缘爬虫网络计算方法以及用户的输入获得待分类的职业属性,进行语义、语法、语境分析以及初步识别,对初步识别结果训练学习识别职业属性分类,本专利技术采用边缘分布式计算过滤掉多数信息,减轻智能学习计算压力,提高系统职业属性识别准确率和工作效率。附图说明附图1为本专利技术的方法流程图;附图2为本专利技术的系统结构框图。具体实施方式下面结合附图与实施例对本专利技术作进一步详细描述。为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。本专利技术提出了一种基于机器学习和云计算、边缘计算的职业属性识别方法、系统及计算机可读存储介质,构建信息识别、分析、学习训练平台,采用边缘分布式计算过滤无关信息,减小计算压力,提高系统职业属性识别准确率和工作效率。第一实施例,本专利技术提出了一种基于机器学习和边缘计算的职业属性识别方法,使用云计算的手段,如附图1所示,所述方法包括至少一个边缘爬虫网络计算体模块和云计算平台,所述方法包括:步骤101,制定网页搜索范围策略、网页搜索方法策略,根据所述网页搜索范围策略、网页搜索方法策略执行爬虫算法识别职业种类,对比数据库,识别第一职业属性。执行爬虫监听调度模块算法更新、数据库更新命令,传递所述第一职业属性并提交分析请求;所述分析请求将传递至文字分析模块,进行分析。所述边缘爬虫网络计算体模块用于制定网页搜索范围策略、网页搜索方法策略。第一职业属性为新识别的、潜在的新职业属性。其中,爬虫监听调度模块监听边缘爬虫网络计算体模块执行状态,对异常、死机边缘爬虫网络计算体模块进行重启,接收边缘爬虫网络计算体模块输入的分析数据本文档来自技高网...

【技术保护点】
1.一种基于机器学习和边缘计算的职业属性识别方法,其特征在于:/n步骤101,制定网页搜索范围策略、网页搜索方法策略,根据所述网页搜索范围策略、网页搜索方法策略执行爬虫算法识别职业种类,对比数据库,识别第一职业属性;执行爬虫监听调度模块算法更新、数据库更新命令,传递所述第一职业属性并提交分析请求;/n步骤102,接收所述分析请求,分析所述第一职业属性,将段落文字通过语义、语法、语境分析,提取所述第一职业属性关键词,将所述关键词转换为十六进制的ASCII编码值,将ASCII编码值采用算法拼接,作为所述第一职业属性的标记特征值;/n步骤103,接收所述第一职业属性的标记特征值,遍历比对所述第一职业属性的标记特征值与数据库模块的职业属性特征值,识别所述第一职业属性是否为现有职业属性,若否则归入初步识别结果;/n步骤104,采用最低风险回归随机预测方法,对所述初步识别结果进行机器学习,获得所述第一职业属性分类。/n

【技术特征摘要】
1.一种基于机器学习和边缘计算的职业属性识别方法,其特征在于:
步骤101,制定网页搜索范围策略、网页搜索方法策略,根据所述网页搜索范围策略、网页搜索方法策略执行爬虫算法识别职业种类,对比数据库,识别第一职业属性;执行爬虫监听调度模块算法更新、数据库更新命令,传递所述第一职业属性并提交分析请求;
步骤102,接收所述分析请求,分析所述第一职业属性,将段落文字通过语义、语法、语境分析,提取所述第一职业属性关键词,将所述关键词转换为十六进制的ASCII编码值,将ASCII编码值采用算法拼接,作为所述第一职业属性的标记特征值;
步骤103,接收所述第一职业属性的标记特征值,遍历比对所述第一职业属性的标记特征值与数据库模块的职业属性特征值,识别所述第一职业属性是否为现有职业属性,若否则归入初步识别结果;
步骤104,采用最低风险回归随机预测方法,对所述初步识别结果进行机器学习,获得所述第一职业属性分类。


2.根据权利要求1所述的方法,其特征在于:基于机器学习和云计算、边缘计算的职业属性识别方法还包括监听边缘爬虫网络计算体模块执行状态,对异常、死机边缘爬虫网络计算体模块进行重启。


3.根据权利要求1所述的方法,其特征在于:所述步骤103识别所述第一职业属性是否为现有职业属性具体为:比对置信度和预设阈值,若所述置信度大于或等于预设阈值则第一职业属性为现有职业属性,否则为新职业属性。


4.根据权利要求1所述的方法,其特征在于:获得所示第一职业属性分类后,发送至客户端模块展示给用户。


5.一种基于机器学习和边缘计算的职业属性识别系统,其特征在于:所述系统包括至少一个边缘爬虫网络计算体模块和云计算平台;所述云计算平台包括爬虫监督调度模块、文字分析模块、初步识别模块、数据库模块、智能学习模块、信息交互模块;
所述边缘爬...

【专利技术属性】
技术研发人员:吴晓军
申请(专利权)人:河北冀联人力资源服务集团有限公司
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1