本发明专利技术涉及金融科技机器学习技术领域,具体说是一种基于机器学习的基金经理的个人真实业绩曲线计算方法,包括数据准备、机器学习模型构建和绩效曲线的合成。其中,模型采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中。本发明专利技术所述方法中,PCA降维能够消除各个变量共线性,提高聚类准确率;DBSCAN能够自动排除类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;能够剥离出大部分基金经理的真实业绩,误差部分较小,并且不影响整体业绩曲线计算。整体业绩曲线计算。整体业绩曲线计算。
【技术实现步骤摘要】
一种基于机器学习的基金经理个人真实业绩曲线计算方法
[0001]本专利技术涉及金融科技机器学习
,具体说是一种基于机器学习的基金经理的个人真实业绩曲线计算方法。
技术介绍
[0002]随着资管行业的发展,基金的投资成为越来越多个人与机构的重要配置方向,基金经理的分析成为基金筛选的重要参考指标。如何准确的计算一个基金经理的个人业绩曲线成为一个重要的技术难题,由于基金可以分为股票型、债券型、混合型、货币型、FOF型等多种类型,一个人可能挂名多种类型的基金,同一个基金可能会发生投资方向和类型的变化,同一只基金也可能并非基金经理自己一直管辖,存在大量的基金经理变更情况,也存在基金经理只挂名而不实际管理的情况,导致很难通过传统的技术手段计算基金经理合理的业绩曲线。
[0003]情况1:基金经理同时管理多只偏股基金,其中某只基金仅仅是挂名,并未实际管理。
[0004]情况2:基金经理管理多只偏股基金,其中某几只基金实际管理过,后期移交给其他人管理,但是依然挂自己的名字。
[0005]情况3:基金经理管理多只偏股基金,其中有一只基金中途变更为偏债型基金。
[0006]以上情况下,如果简单把多只基金收益算作是基金经理管理的偏股型基金,会有失公允,不便于用户掌握该基金经理的真实收益情况。
技术实现思路
[0007]针对现有技术中存在的缺陷,本专利技术的目的在于提供一种基于机器学习的基金经理个人真实业绩曲线计算方法,基于基金经理过往管理的基金业绩曲线、持仓以及公告的文本资料,通过机器学习的技术剥离其管辖的各类基金,并计算基金经理个人真实的含权分类(指分类允许持有股票)基金业绩曲线。
[0008]为达到以上目的,本专利技术采取的技术方案是:
[0009]一种基于机器学习的基金经理个人真实业绩曲线计算方法,包括以下步骤:
[0010]S1、数据准备:获取不同类型的基金从成立至今的累积净值数据、基金经理任职与离职日期数据、基金每个报告期的持仓数据、区分类型变动的基金公告数据,将各类型的所有基金按照时间维度区分个人管辖与非个人管辖的基金,并贴上对应标签;
[0011]S2、机器学习模型构建:对多人管理中实际个人管辖的对应类型基金按照时间戳打标签,对每个类型的每个基金经理构建模型,将挂该基金经理名称的所有对应类型基金从具体持仓和历史收益率两个维度构建多因子模型,采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中,从而为与基金经理存在实际关系的基金打上对应的标签,自动排除了类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;
[0012]S3、绩效曲线的合成:对每个基金经理管理的每类基金产品(如偏股、纯债),在管理该类产品期间计算对应的基金经理历史绩效,计算方式为,用管理期间所有的该类基金进行每天的收益率市值加权处理,得到每天的加权收益率,然后基于每天的加权收益率计算历史累计净值曲线,净值曲线从1开始计算从而得到所有对应类型基金经理的历史业绩。
[0013]进一步地,步骤S2包括以下步骤:
[0014]S21、获取区间基金经理管理的全部某类基金日收益率并计算基金的行业收益,得到每只基金的区间收益率矩阵,其中,行业收益采用该基金持有的最近一期全部股票持仓计算得到,基金行业收益率计算公式为:
[0015][0016]其中,M
i,t
为使用历史最近的全部持仓和最近的季报持仓模拟的单只基金在t日的投资于i行业的权益持仓总市值,gn
,t
为单只基金模拟持仓的属于行业i的股票n在t日的收益率,m
n,t
为模拟的单只基金投资于行业i的股票资产n在t日的市值,N为该基金持有的i行业股票数量;
[0017]S22、对每只基金的区间收益率矩阵进行PCA降维;
[0018]S23、对每只基金的降维后的日度时间序列指标按日期做聚类,每个日期由L个基金和S个维度构成L
×
S矩阵,对该矩阵进行DBSCAN聚类,以基金经理单独管理的基金A为目标基金,所有分类不为
‑
1且与A分类一致的基金与A归为一类,认为是基金经理真实管理的基金。
[0019]进一步地,步骤S2中所述日收益率为32维,由申万1级行业分类的31个行业的行业收益率和一个基金收益率组成,降维后的维度数为5。
[0020]进一步地,所述DBSCAN聚类算法的参数Eps由K距离曲线算法得出,MinPts设置为2,其中,Eps代表样本邻域距离阈值,MinPts代表样本距离为Eps的邻域中样本个数的阈值。
[0021]进一步地,步骤S3中所述绩效曲线的合成计算公式如下:
[0022]Curve(m)
t
=Curve(m)
t
‑1*(1+R(m)
t
)
ꢀꢀꢀꢀ
(2)
[0023][0024]其中R(m)
t
为基金经理m在t日期收益率,W
it
为基金经理m在t日期管理的该类基金i占当天所有管理的对应类型基金比例,R
it
为基金经理m在t日期管理的该类型基金i的当天收益率,Curve(m)
t
初始值为1,n为t日期基金经理管理的i类型基金总数量。
[0025]本专利技术所述的基于机器学习的基金经理个人真实业绩曲线计算方法,相比于现有技术,具有以下有益效果:
[0026]PCA降维能够消除各个变量共线性,提高聚类准确率;DBSCAN能够自动排除类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;本方法能够剥离出大部分基金经理的真实业绩,误差部分较小,并且不影响整体业绩曲线计算。
附图说明
[0027]本专利技术有如下附图:
[0028]图1本专利技术机器学习模型构建流程图;
[0029]图2本专利技术方法实施效果图。
具体实施方式
[0030]以下结合附图对本专利技术作进一步详细说明。
[0031]本专利技术所述的基于机器学习的基金经理个人真实业绩曲线计算方法,包括如下步骤:
[0032]S1、数据准备:获取不同类型的基金从成立至今的累积净值数据、基金经理任职与离职日期数据、基金每个报告期的持仓数据、基金的公告数据(区分类型变动),将各类型的所有基金按照时间维度区分各个人管辖与非个人管辖的基金,并贴上对应标签。
[0033]S2、机器学习模型构建:主要目标是对多人管理中实际个人管辖的对应类型基金打标签(按照时间戳打),对每个类型的各个基金经理构建模型,将挂该基金经理名称的所有对应类型基金从具体持仓和历史收益率两个维度构建多因子模型,采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中,从而为与基金经理存在实际关系的基金打上对应的标签,自动排除了类型不符合或者特征不符合的基金进入基金经理个人业绩曲本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的基金经理个人真实业绩曲线计算方法,其特征在于,包括以下步骤:S1、数据准备:获取不同类型的基金从成立至今的累积净值数据、基金经理任职与离职日期数据、基金每个报告期的持仓数据、区分类型变动的基金公告数据,将各类型的所有基金按照时间维度区分个人管辖与非个人管辖的基金,并贴上对应标签;S2、机器学习模型构建:对多人管理中实际个人管辖的对应类型基金按照时间戳打标签,对每个类型的每个基金经理构建模型,将挂该基金经理名称的所有对应类型基金从具体持仓和历史收益率两个维度构建多因子模型,采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中,从而为与基金经理存在实际关系的基金打上对应的标签,自动排除了类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;S3、绩效曲线的合成:对每个基金经理管理的每类基金产品,在管理该类产品期间计算对应的基金经理历史绩效,计算方式为,用管理期间所有的该类基金进行每天的收益率市值加权处理,得到每天的加权收益率,然后基于每天的加权收益率计算历史累计净值曲线,净值曲线从1开始计算从而得到所有对应类型基金经理的历史业绩。2.如权利要求1所述的基于机器学习的基金经理个人真实业绩曲线计算方法,其特征在于,步骤S2包括以下步骤:S21、获取区间基金经理管理的全部某类基金日收益率并计算基金的行业收益,得到每只基金的区间收益率矩阵,其中,行业收益采用该基金持有的最近一期全部股票持仓计算得到,基金行业收益率计算公式为:其中,M
i,t
为使用历史最近的全部持仓和最近的季报持仓模拟的单只基金在t日的投资于i行业的权益持仓总市值,g
n,t
为单只基金模拟持仓的属于行业i的股票n在t日的收益率,m
n,t
为模拟的单只基金投...
【专利技术属性】
技术研发人员:方童根,徐经纬,
申请(专利权)人:北京汇成基金销售有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。