一种企业需求智能诊断方法、系统以及存储介质技术方案

技术编号:33064658 阅读:15 留言:0更新日期:2022-04-15 09:54
本发明专利技术提供了一种企业需求智能诊断方法、系统以及存储介质,该方法包括:按照企业所属行业类别在对应行业下获取源数据;对获取的该行业类别下的源数据进行过滤和预处理并提取对于需求分析有效的关键信息,消除噪音和无效信息;企业数据深度融合特征提取;利用得到的深度关联特征进行需求诊断识别模型构建;利用构建的识别模型进行实际企业需求诊断,得出与企业目前阶段需要相匹配的需求服务。本发明专利技术提供的企业需求智能诊断方法能够大幅度提升数据的处理和分析效率,减少人力和物力成本,且通过深度学习的方法得到的诊断模型比专家人为分析更为客观,方便企业在不同阶段进行智能化诊断得出需求结果。化诊断得出需求结果。化诊断得出需求结果。

【技术实现步骤摘要】
一种企业需求智能诊断方法、系统以及存储介质


[0001]本专利技术属于智能化数据挖掘和数据分析领域,具体涉及一种企业需求智能诊断方法、系统以及存储介质。

技术介绍

[0002]目前我国正处于互联网和智能信息时代,国家大力倡导在实施数字经济战略上抢新机,加快工业互联网创新发展,推动新一代信息技术与传统企业服务深度融合。目前有企业管理信息系统进行各类企业信息的管理和查询,然而随着有科创服务的深化,各类创业服务机构以及孵化器致力于提供科技成果转化、融资、项目落地和政策服务、产业资源导入等综合性的孵化服务,以及对优质早期项目进行直接投资,不同类型的企业在发展的不同阶段可能需要的需求不同,企业要投入大量人力物力进行数据处理并由专家进行需求分析,通常现有技术通常方法是通过领域内专家进行企业资料研读、问卷调查以及进行企业访谈、座谈等,之后依据这些数据做出诊断报告并发送给企业方提供决策,然而在此过程中企业需要有专门部门去做这项工作,或者需要委托第三方服务机构进行需求的诊断,这个过程需要处理大量的数据处理,且得出结论的过程中需要大量的领域内从业人员参与和对接,服务效率低、周期长,因而本申请提供了一种智能化的企业需求诊断以及分析方法及系统,大幅度提升数据的处理和分析效率,减少人力和物力成本,便捷性的为企业提供企业智能化需求分析结果。

技术实现思路

[0003]本专利技术的目的在于解决上述现有技术中存在的技术问题,提供一种企业需求智能诊断方法、系统以及存储介质。
[0004]本专利技术是通过以下技术方案实现的:提供了一种企业需求智能诊断方法,包含如下步骤:步骤1,按照企业所属行业类别在对应行业下获取源数据,获取源数据中可通过以下多种方式获取,包含但不限于企业查询APP、Web爬虫、企业微信、小程序等。获取的数据至少包含企业基础数据、企业融资数据、企业经营数据、企业知产数据、企业标签数据、企业竞品数据的六维度大类数据以及具体包含的数据小类信息如下表所示:
数据维度数据小类企业基础数据企业名称、企业全称、基本信息、成立时间、地区、注册资本、人员规模企业融资数据融资轮次、融资时间、融资金额、投资机构企业经营数据主营业务简介、产品销售情况、企业产品类型企业知产数据专利、商标、版权、软著企业标签数据行业大类、应用场景、融资情况企业竞品数据竞争对手基础数据、竞争对手融资数据、竞争对手经营数据
本申请收集10万家大中型企业作为源数据样本,提取包含上述数据对应阶段的服务数据,服务类别包含数据服务、投行咨询、创业服务、专业服务,并且具体每个服务类别下
设置多个具体的服务小类,如下表所示:步骤2,对获取的该行业类别下的源数据进行过滤和预处理并提取,提取对于需求分析有用的关键信息,消除噪音和无效信息;根据捕获到的与企业数据相关的内容去除如所网页的HTML源码、对网页源码中的广告、注释等内容过滤去噪以及提取出捕获数据中的中文文本内容;对上述中文文本进行预处理,可以是将该语句划分成多个词,该预处理数据即为一系列的词,包含数据去冗余、数据集成、数据融合、数据变换和数据规约的其中一种或多种。
[0005]步骤3,企业数据深度融合特征提取;在得到步骤2预处理后的企业文本数据,由于文本中的词语是离散的,通过词嵌入层将每一个词语经过空间映射,将 得到低维、稠密的词向量用以表示每一个词语。这样,每一个词语是一个一维向量,一个句子就能使用若干个一维向量来表示,于是我们得到一个矩阵来表示一个句子;词向量可以使用 word2vec、GloVe、fasttext 其中任何一种预训练的词向量,也可以用随机生成服从正态分布的固定维向量做词向量。
[0006]为了进一步提取企业数据信息之间深度特征以及信息之间的关联性,在进行深度卷积特征提取中,对获取的多个维度的企业数据词向量特征进行深度融合,对第一维度特征经过两个分支的卷积操作,其中第一分支包含三层卷积层,第二分支卷积层包含一层卷积层,通过上述两个分支的卷积层处理得到该维度下的词向量融合特征;还包括得到第二维度信息与第一维度信息进行关联融合特征,第二维度的词向量特征通过第三分支卷积操作后特征与上述第一维度特征的第二分支卷积得到的特征进行融合add计算,最后将第一维度下的词向量融合特征与得到的维度间的关联融合特征进行concat计算,各维度特征之
间特征均进行此融合操作,最终得到本维度融合特征以及维度间的深度关联特征;本申请具体第一维度特征第一分支经过卷积核为1
×
1和5
×
5以及1
×
1的三层结构,第二分支卷积核为1
×
1。第三分支为卷积核为1
×
1和5
×
5以及1
×
1的三层结构,这样不仅本身维度的数据经不同通道可一融合得到不同感受野下的融合特征,且通过不同维度多个通道进行不同维度特征融合,可以获得具备词向量特征相关性较高的深度语义特征。类似的其他维度间的特征也做相同过程的融合特征处理,可以极大提升模型分析的准确性。
[0007]步骤4,需求诊断识别模型构建将输入的词向量通过特征融合通道进行融合后,由于产生了较高纬度的特征,因而后续进行池化层操作以及全连接层计算,最终通过分类层输出需求结果,其中激活函数采用Relu激活函数,损失函数采用交叉熵(cross entropy)损失函数:其中K为模型训练中需求类别标签值数量,对于样本点i来说y是真实的标签,则y
i,k
=1,否则等于0,i为样本数,样本i属于标签k的概率为p
i,k , N为样本总数,L
loss
为训练损失值。
[0008]步骤5,利用构建的识别模型进行实际企业需求诊断,得出与企业目前阶段需要相匹配的需求服务。
[0009]在实际中,可以按照步骤1的方法获取企业自身数据之后提取相同词向量以及深度特征,如果获取的数据有所差别时,用户可以手动修正上述文本内容之后输入至诊断识别模型中,得到目前企业需要获得的一个或多种服务需求标签。
[0010]进一步,本申请还提供了一种企业需求智能诊断系统,包含如下功能模块:智能采集和源数据获取模块,按照企业所属行业类别在对应行业下获取源数据,获取源数据中可通过以下多种方式获取,包含但不限于企业查询APP、Web爬虫、企业微信、小程序等。获取的数据至少包含企业基础数据、企业融资数据、企业经营数据、企业知产数据、企业标签数据、企业竞品数据的六维度大类数据以及具体包含的数据小类信息如下表所示:
数据维度数据小类企业基础数据企业名称、企业全称、基本信息、成立时间、地区、注册资本、人员规模企业融资数据融资轮次、融资时间、融资金额、投资机构企业经营数据主营业务简介、产品销售情况、企业产品类型企业知产数据专利、商标、版权、软著企业标签数据行业大类、应用场景、融资情况企业竞品数据竞争对手基础数据、竞争对手融资数据、竞争对手经营数据
本申请收集10万家大中型企业作为源数据样本,提取包含上述数据对应阶段的服务数据,服务类别包含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业需求智能诊断方法,方法包含如下步骤:步骤1,按照企业所属行业类别在对应行业下获取源数据;步骤2,对获取的该行业类别下的源数据进行过滤和预处理并提取对于需求分析有效的关键信息,消除噪音和无效信息;步骤3,企业数据深度融合特征提取;对步骤2预处理后的企业文本数据进行企业按预设的数据维度进行词向量提取,对获取的多个维度的企业数据词向量特征进行深度融合,对第一维度特征经过两个分支的卷积操作,其中第一分支包含三层卷积层,第二分支卷积层包含一层卷积层,通过上述两个分支的卷积层处理得到该维度下的词向量融合特征;还包括得到第二维度信息与第一维度信息进行关联融合特征,第二维度的词向量特征通过第三分支卷积操作后特征与上述第一维度特征的第二分支卷积得到的特征进行融合add计算,最后将第一维度下的词向量融合特征与得到的维度间的关联融合特征进行concat计算,各维度特征之间特征均进行此融合操作,最终得到本维度融合特征以及维度间的深度关联特征;步骤4,利用得到的深度关联特征进行需求诊断识别模型构建;步骤5,利用构建的识别模型进行实际企业需求诊断,得出与企业目前阶段需要相匹配的需求服务。2.根据权利要求1所述的企业需求智能诊断方法,其特征在于:所述企业数据深度融合特征提取中第一分支网络卷积核依次为1
×
1和5
×
5以及1
×
1,第二分支卷积核为1
×
1。3.根据权利要求1所述的企业需求智能诊断方法,其特征在于:识别模型获取的企业样本数据至少包含企业基础数据、企业融资数据、企业经营数据、企业知产数据、企业标签数据、企业竞品数据的六维度大类数据;服务类别数据包含数据服务、投行咨询、创业服务、专业服务根据。4.权利要求1所述的企业需求智能诊断方法,其特征在于需求诊断识别模型在深度融合特征提取后还包含池化和全连接计算,需求诊断识别模型分类函数为SoftMax函数。5.一种企业需求智能诊断系统,其特征在于包含如下模块:智能采集和源数据获取模块、数据过滤和与数据预处理模块,企业数据深度融合特征提取模块、需求诊断识别模型构建模块、诊断结果输出模块,其中:智能采集和源数据获取模块,按照企业所属行业类别在对应行业下获取源数据;数据过滤和与数据预处理模块,对获取的该行业类别下的...

【专利技术属性】
技术研发人员:滕健张佩佩张斌高崎
申请(专利权)人:天津联创科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1