一种企业画像标签智能生成方法技术

技术编号:37178413 阅读:31 留言:0更新日期:2023-04-20 22:46
本申请实施例公开了一种企业画像标签智能生成方法,该方法通过收集企业经营数据文本,基于所述企业经营数据文本设计任务说明文本;并将所述任务说明文本通过训练后的所述生成模型,得到初始企业画像标签;再基于所述策略梯度损失函数优化所述生成模型生成标签的真实性和准确性;通过辨别模型对标签的真实性进行评分,实现真实且准确的企业画像标签生成,对企业经营情况进行多维度分析,提高企业的评估效率;该方法可以同时进行多个企业多方位的评估,简化了企业画像构建过程,提高了企业工作效率,并为企业投资提供了判断依据,降低了投资风险。低了投资风险。低了投资风险。

【技术实现步骤摘要】
一种企业画像标签智能生成方法


[0001]本专利技术涉及机器学习和企业财务风控
,具体涉及一种企业画像标签智能生成方法。

技术介绍

[0002]企业画像是多维度的企业商业信息数据的总体描述,是基于企业经营数据文本将经营、财务、行业、融资等情况标签化,从而提取出企业的特征标签,描绘出企业基本经营情况的一种方式。随着经济快速发展,企业数量日益增多,面对市场上大量的不同企业,为了更好地判断一家企业的总体经营状况,判断其投资风险,企业可以使用企业画像进行辅助,以实现对企业的精准分析。
[0003]目前,企业画像多为复杂多样的标签化文本数据,人为评估过程效率较低,容易出现误判的情况,增加投资风险。根据此类问题需要一种智能的企业画像标签分值评估的方法,可以同时进行多个企业多方位的评估,简化企业画像构建过程,提高企业工作效率,为企业投资提供判断依据,降低投资风险。

技术实现思路

[0004]基于此,有必要针对现有的问题,提供一种企业画像标签智能生成方法。
[0005]本专利技术提供了一种企业画像标签智能生成方法,该方法包本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种企业画像标签智能生成方法,其特征在于,包括:S1:收集企业经营数据文本,并基于所述企业经营数据文本构建文本向量对数据集;S2:构建生成模型;基于所述文本向量对数据集训练所述生成模型;训练过程包括计算与向量对应的概率分布;S3:基于所述企业经营数据文本设计任务说明文本;将所述任务说明文本通过训练后的所述生成模型,得到第一文本向量;S4:根据所述第一文本向量得到初始企业画像标签;基于所述初始企业画像标签构建向量矩阵;S5:构建辨别模型;将所述向量矩阵通过所述辨别模型,得到标签的真实性评分;S6:基于所述与向量对应的概率分布、所述标签的真实性评分,计算策略梯度损失函数;并基于所述策略梯度损失函数优化所述生成模型;S7:将所述任务说明文本通过优化后的所述生成模型,得到第二文本向量;根据所述第二文本向量得到真实企业画像标签。2.根据权利要求1所述的企业画像标签智能生成方法,其特征在于,S1中,构建所述文本向量对数据集的过程包括:采用中文分词器对所述企业经营数据文本进行分词,再基于one

hot编码将分词结果向量化,得到企业数据词向量,所述企业数据词向量记为:;采用自回归预测方法将企业数据词向量的前i

1个向量,与第i个向量组成文本向量对,所述文本向量对记为:,n表示向量的数量;基于多个所述文本向量对构建所述文本向量对数据集。3.根据权利要求2所述的企业画像标签智能生成方法,其特征在于,S2中,采用12层Transformer网络结构构建所述生成模型。4.根据权利要求2所述的企业画像标签智能生成方法,其特征在于,S2中,训练过程包括:将企业数据词向量的前i

1个向量输入所述生成模型,提取其文本特征,将所述文本特征经过Softmax函数得到与第i个向量对应的一维概率分布,计算公式为:;其中,表示与第i个向量对应的一维概率分布;表示提取出的企业数据词向量的前i

1个向量的文本特征;Gen()表示生成模型;表示企业数据词向量的前i

1个向量;计算第i个向量及与其对应的一维概率分布的交叉熵损失函数,计算公式为:;其中,Loss()表示交叉熵损失函数;为生成模型的权重参数;x表示与第i个向量对应的一维概率分布中相同索引对应的值;y表示第i个向量中相同索引对应的值;表示第i个向量;在整个所述文本向量对数据集上,采用梯度下降反向传播算法最小化所述交叉熵损失函数,以此使所述生成模型学习到文本向量。
5.根据权利要求4所述的企...

【专利技术属性】
技术研发人员:胡为民郑喜余露谢丽慧熊自康
申请(专利权)人:深圳市迪博企业风险管理技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1