当前位置: 首页 > 专利查询>河海大学专利>正文

基于基金双画像机制的基金组合推荐方法及系统技术方案

技术编号:38924396 阅读:43 留言:0更新日期:2023-09-25 09:33
本发明专利技术公开了一种基于基金双画像机制的基金组合推荐方法及系统,该系统包括基金数据采集模块、基金双画像模块、基金优选模块、基金自选组合模块、基金智选组合模块。基金数据采集模块采集投资者及基金信息,基金双画像模块对基金投资者画像和基金经理画像进行构建,基金优选模块基于基金双画像特征机制为投资者推荐偏好匹配的基金,基金自选组合模块从投资者自选基金集合中进行组合构建及子基金权重配比,基金智选组合模块从优选模块的基金集合中进行智能组合构建及子基金权重配比。本发明专利技术通过构建基金双画像机制,优选出与投资者偏好匹配的基金,并基于改进风险指标的均值—方差模型重新衡量基金的风险,最终推荐抗风险能力较强的基金组合。较强的基金组合。较强的基金组合。

【技术实现步骤摘要】
基于基金双画像机制的基金组合推荐方法及系统


[0001]本专利技术涉及基金推荐系统及方法,特别是指一种基于基金双画像机制的基金组合推荐系统及方法。

技术介绍

[0002]随着大众互联网理财观念的逐步普及,理财规模随之扩大,智能投顾以低成本、低门槛、大众定制理财方案等特点迎合了中产阶层、大众富裕阶层的理财需要,降低了投资顾问服务的门槛,使普通理财用户也可以享受投资顾问服务。但投资者大多缺乏系统、科学的投资观念,投资行为更多受产品驱动,很多人还完全没有接触过关于基金投资的推荐系统。
[0003]对金融投资产品进行有效分析,向用户推荐合适的投资产品,一直以来是金融投资领域的专家及从业者所期望达到的目标。在配置基金时,不仅仅需要考虑到基金的选取和权重的配比,还要考虑到投资者的意向以及可接受的类别,同时需要尽可能的减少个人主观意愿的影响。在当今互联网快速发展的时代,股票、基金等投资产品种类的五花八门让普通投资者眼花缭乱,难以在此基础上做出理性客观的选择。因此,为了满足基金投资者的需求,降低投资服务门槛,使普通基金投资者也可以享受投资顾问服务,构建一个能够辅助基金投资者进行个性化、智能化投资的基金组合推荐系统便变得尤为重要。

技术实现思路

[0004]专利技术目的:本专利技术提供一种基于基金双画像机制的基金组合推荐方法及系统,目的是提供一种实现对基金投资的判断指导,最大程度地规避风险,提高客户投资收益的基金组合推荐方法及系统。本专利技术不仅考虑基金投资者的偏好和基金经理的投资风格,还考虑基金组合中各子基金的选取方法,实现基金组合的智能配置与推荐,从而帮助基金投资者提高投资收益,降低投资风险。
[0005]技术方案:一种基于基金双画像机制的基金组合推荐方法,包括以下步骤:
[0006](1)采集基金投资者的信息并从公开的基金网页上定期爬取基金信息存储到数据库中;
[0007](2)在基于本体的画像构建方法基础上,结合层次聚类对采集的投资者信息和基金数据集进行分析;通过属性与类之间的关联度对属性的重要性进行评分,选择评分高的属性进行画像构建,从而完成基金经理画像和基金投资者画像的双画像构建及迭代;
[0008](3)在已有双画像的基础上,使用基于密度改进后的聚类算法对基金经理画像进行聚类,并与基金投资者画像进行匹配,从而构建完备的基金双画像机制以对其特征进行分析并优选基金推荐;
[0009](4)提出改进风险指标评价的均值

方差模型,结合已构建的基金双画像,对现有基金组合中各子基金的权重进行智能配比,推荐满足投资者偏好和抗风险能力较强的基金组合投资方案。
[0010]进一步的,所述基于密度改进后的聚类算法,包括:
[0011]a.确定聚类算法中聚类中心点数目K的大小;对于给定的K值,计算在该K值条件下,聚类后的每一个点到聚类中心点的距离之和;接着采用Gap算法来确定拐点,其公式为:
[0012]Gap(K)=E(log D
k
)

log D
k
ꢀꢀꢀꢀ
(1)
[0013]其中,D
k
为损失函数,E(log D
k
)为log D
k
的期望值;
[0014]b.确定聚类算法中的初始点;在整个数据集中,计算数据点的密度,对于当前数据集D,选择密度最大的一个数据点a,将其作为初始迭代点之一;然后,选择所有与a点距离小于其数据半径的点,称为C
(a)
,更新当前数据集D=D

C
(a)
,继续向下查找,直至选择了K个初始迭代点为止;
[0015]c.根据初始迭代点和K值,进行聚类:对于每一个样本点x,都包含两个值:该点的类别和该点距离类中心点的距离;对于每一个簇,计算簇中所有样本点的平均值来作为该簇的聚类中心点,若该中心点与计算前的中心点一致或达到预定迭代次数,则终止,输出结果;若不一致且未达到预定的迭代次数,则继续循环,直至达到结果;
[0016]d.最后将投资者的年收入情况、债务状况定义为风险承受能力指标δ,分别以δ1,δ2表示,将学历、职业、收入来源、投资知识定义为数据浮动指标ω,分别以ω1,ω2,ω3,ω4表示;对可接受的最大损失,以α表示,根据前述的画像按照以下公式计算投资者可接受的投资风险程度:
[0017][0018]其中,R为投资者可接受的风险程度,N为投资者问卷中该问题的所有选项,n为投资者选择的第n个选项;对于每一个投资者画像,根据其R值和偏好的投资类型,从基金经理集合中选择画像与之匹配的基金经理;设该基金经理集合为U
(i)
,对于集合中每一个的基金经理x
(i)
∈U
(i)
,统计其所属类别C
i
;最后,在该基金经理推荐集合C中,抽取出现次数最多的基金经理类型所管理的基金产品作为优选基金,并分析该基金的特征,为后续基金组合的构建提供依据。
[0019]进一步的,步骤(4)中改进风险指标评价的均值

方差模型,基于基金的整体走势趋势定义基金的风险指标;对于第i类基金X
(i)
,定义其价格随时间的时间序列为:对于基金的整体趋势判断,用一次函数来近似拟合;定义基金走势趋势函数为y
(i)
=a
(i)
x
(i)
+b
(i)
,S
j
为第i类基金在第j日的价格误差,定义误差函数为:
[0020][0021][0022]基金的整体趋势即为该误差取最小值时,a、b的取值,因此,其具体的数学模型为:
[0023][0024][0025]求解该模型,得到基金走势趋势线y
(i)
=a
(i)
x
(i)
+b
(i)
,基于基金的整体趋势,定义基金的风险指数为:
[0026][0027][0028][0029]由此可以得到基金的风险评价指数;定义组合基金r
p
,组合的各类资产的权重为ω
i
,i=1,2,...,n,则组合基金收益率为:
[0030][0031]其中,计算组合基金的期望收益率为:
[0032][0033]由此可得到改进后的均值方差模型:
[0034]minσ(r
p
)
[0035][0036]其中,为投资者的预期收益率。
[0037]进一步地,步骤(1)中,在Scrapy框架上,通过改进其下载中间件,使得爬虫能够精确地爬取基金信息;针对基金信息具有周期性的特点,进一步采用Crontab设置定时指令对爬取功能进行封装,实现周期性爬取功能。
[0038]进一步的,步骤(2)中,在基于本体的画像构建方法基础上,结合层次聚类对爬取的数据集进行分析,并通过属性与类之间的关联度对属性的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基金双画像机制的基金组合推荐方法,其特征在于,包括以下步骤:(1)采集基金投资者的信息并从公开的基金网页上定期爬取基金信息存储到数据库中;(2)在基于本体的画像构建方法基础上,结合层次聚类对采集的投资者信息和基金数据集进行分析;通过属性与类之间的关联度对属性的重要性进行评分,选择评分高的属性进行画像构建,从而完成基金经理画像和基金投资者画像的双画像构建及迭代;(3)在已有双画像的基础上,使用基于密度改进后的聚类算法对基金经理画像进行聚类,并与基金投资者画像进行匹配,从而构建完备的基金双画像机制以对其特征进行分析并优选基金推荐;(4)提出改进风险指标评价的均值

方差模型,结合已构建的基金双画像,对现有基金组合中各子基金的权重进行智能配比,推荐满足投资者偏好和抗风险能力较强的基金组合投资方案。2.根据权利要求1所述基于基金双画像机制的基金组合推荐方法,其特征在于:所述基于密度改进后的聚类算法,包括:a.确定聚类算法中聚类中心点数目K的大小;对于给定的K值,计算在该K值条件下,聚类后的每一个点到聚类中心点的距离之和;接着采用Gap算法来确定拐点,其公式为:Gap(K)=E(log D
k
)

log D
k
ꢀꢀꢀꢀ
(1)其中,D
k
为损失函数,E(log D
k
)为log D
k
的期望值;b.确定聚类算法中的初始点;在整个数据集中,计算数据点的密度,对于当前数据集D,选择密度最大的一个数据点a,将其作为初始迭代点之一;然后,选择所有与a点距离小于其数据半径的点,称为C
(a)
,更新当前数据集D=D

C
(a)
,继续向下查找,直至选择了K个初始迭代点为止;c.根据初始迭代点和K值,进行聚类:对于每一个样本点x,都包含两个值:该点的类别和该点距离类中心点的距离;对于每一个簇,计算簇中所有样本点的平均值来作为该簇的聚类中心点,若该中心点与计算前的中心点一致或达到预定迭代次数,则终止,输出结果;若不一致且未达到预定的迭代次数,则继续循环,直至达到结果;d.最后将投资者的年收入情况、债务状况定义为风险承受能力指标δ,分别以δ1,δ2表示,将学历、职业、收入来源、投资知识定义为数据浮动指标ω,分别以ω1,ω2,ω3,ω4表示;对可接受的最大损失,以α表示,根据前述的画像按照以下公式计算投资者可接受的投资风险程度:其中,R为投资者可接受的风险程度,N为投资者问卷中该问题的所有选项,n为投资者选择的第n个选项;对于每一个投资者画像,根据其R值和偏好的投资类型,从基金经理集合中选择画像与之匹配的基金经理;设该基金经理集合为U
(i)
,对于集合中每一个的基金经理
x
(i)
∈U
(i)
,统计其所属类别C
i
;最后,在该基金经理推荐集合C中,抽取出现次数最多的基金经理类型所管理的基金产品作为优选基金,并分析该基金的特征,为后续基金组合的构建提供依据。3.根据权利要求1所述基于基金双画像机制的基金组合推荐方法,其特征在于:步骤(4)中改进风险指标评价的均值

方差模型,基于基金的整体走势趋势定义基金的风险指标;对于第i类基金X
(i)
,定义其价格随时间的时间序列为:对于基金的整体趋势判断,用一次函数来近似拟合;定义基金走势趋势函数为y
(i)
=a
(i)
x
(i)
+b
(i)
,S
j
为第i类基金在第j日的价格误差,定义误差函数为:基金在第j日的价格误差,定义误差函数为:基金的整体趋势即为该误差取最小值时,a、b的取值,因此,其具体的数学模型为:基金的整体趋势即为该误差取最小值时,a、b的取值,因此,其具体的数学模型为:求解该模型,得到基金走势趋势线y
(i)
=a
(i)
x
(i)
+b
(i)
,基于基金的整体趋势,定义基金的风险指数为:的风险指数为:的风险指数为:由此可以得到基金的风险评价指数;定义组合基金r
p
,组合的各类资产的权重为ω
i
,i=1,2,...,n,则组合基金收益率为:其中,计算组合基金的期望收益率为:由此可得到改进后的均值方差模型:
minσ(r
p
)其中,为投资者的预期收益率。4.根据权利要求1所述基于基金双画像机制的基金组合推荐方法,其特征在于:步骤(1)中,在Scrapy框架上,改进其下载中间件并针对基金信息具有周期性的特点,采用Crontab设置定时指令对爬取功能进行封装,实现周期性爬取功能。5.基于基金双画像机制的基金组合推荐系统,其特征在于,所述系统包括:基金数据采集模块、基金双画像模块、基金优选模块、基金自选组合模块、基金智选组合模块;所述基金数据采集模块用于从公开的基金信息网页对基金数据实行周期性爬取;所述基金画像模块将基金画像分为基金投资者画像和基金经理画像两部分分别进行构建;所述...

【专利技术属性】
技术研发人员:陶飞飞李昕瑞袁驰唐勇军张晓东李鑫刘颜君
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1