基于支持向量机算法的金融资产分类方法及系统
未命名
10-09
阅读:145
评论:0
1.本发明涉及财会金融领域,尤其涉及一种基于支持向量机算法的金融资产分类方法及系统。
背景技术:
2.在金融市场中,对金融资产进行准确分类和预测对于投资决策和风险管理至关重要。只有通过准确了解金融资产的性质和趋势,投资者才能做出明智的决策,降低风险并实现更好的投资回报。因此,确保金融资产的正确分类和可靠预测是投资者在市场中取得成功的关键。
3.svm有很强的学习能力和泛化能力,但svm模型预测性能的优劣却与参数的选择密切相关。因此采用有效的方法搜寻最佳的svm参数,获取较高的分类准确度是目前研究的热点问题。
4.尽管现有的svm通过核函数可以应对非线性分类问题,但是面对金融、生物医药、天文测量等各类场景中的大规模数据分析的需要,该数据集在某种意义上更加复杂或抽象,对经典svm的分类精度要求提高,因此需要另辟蹊径。学者们通过实证结果发现果蝇算法在操作中易于实现,并且具有局部搜索能力强的优点。可以采用foa果蝇优化算法对svm模型进行参数优化以提升模型的预测性能,但与此同时由于金融领域样本多为不均衡样本,尤其是对于资产分类大部分资产可划分为以摊余成本计量资产,非平衡样本制约了foa果蝇算法对svm支持向量机限度。
5.本发明提出的非均衡样本处理方法hsmote(hierarchical synthesis minority oversampling technique)可以很好地结合果蝇优化算法,在smote基础上,通过对样本特征向量采取层级化处理,获取样本重构,打破了非平衡样本对模型优化的制约,使得果蝇法可以搜寻出更好的超参数适配模型。
6.本发明运用的hsmote非均衡样本处理方法和foa参数寻优方法,将hsmote、foa方法与svm模型进行结合,构建了基于foa-hsmote-svm的金融资产分类模型,与网格法搜索参数的svm评估效果进行对比,实验结果证明foa-hsmote-svm模型在金融资产分类的准确率同时对于非均衡样本也有了更好的适用性。
技术实现要素:
7.本发明所要解决的技术问题是克服现有技术对于金融资产分类准确率不足的缺陷,提供一种可适应非平衡样本的果蝇算法优化svm,旨在提高金融资产分类的准确性和稳定性。
8.该模型采用了支持向量机的核心原理和优势,利用果蝇算法对核函数进行优化,结合金融领域的特定特征和数据,通过对训练数据的学习和优化,实现对金融资产进行准确分类和预测。
9.考虑到金融资产分类,其中金融资产中属于分类中的第二类资产占比最大。对于
此类非均衡问题,hsmote对它进行处理时表现良好,可以提高参数的有效性及科学性,抗噪性能优良。
10.hsmote是本发明在smote基础上提出的,针对样本特征向量的类型不同而设计,本发明中采用了one-hot编码,导致向量中存在布尔类型和浮点型数据混合,直接采取smote处理容易使得布尔类型数据波动幅度较大,对模型的构建产生影响。
11.结合foa更简便、较强的局部搜索能力,对svm进行参数寻优,构建改进svm金融资产分类模型。实证结果表明基于foa-hsmote-svm的金融资产分类模型有着优异的性能,证明本方法能够为企业、投资者及相关金融支持机构精准、批量进行金融资产分类提供辅助手段。
12.实现本发明的技术解决方案:一种基于svm算法的金融资产分类模型,包括如下步骤:
13.步骤1、收集数据:收集金融市场的相关数据,所述相关数据包括公司财务报表数据、债券股票相关数据、公司经营数据、以及行业和市场数据;
14.步骤2、预处理数据:对步骤1中收集得到的所述相关数据执行数据清洗、重构样本、特征提取和特征选择操作,以提取与金融资产分类相关的有效特征;
15.步骤3、构建金融资产分类模型:
16.基于果蝇优化算法优化svm参数,其中判别函数其中k(xi,yi)为核函数,xi和yi分别代表样本不同的特征值,b为常数,ai为拉格朗日因子i=1,2
…
n;
17.对核函数k(xi,yi)进行全局寻优,构建金融资产分类模型;
18.步骤4、将步骤2预处理后的数据带入步骤3中构建得到的所述金融资产分类模型,与缺省步骤2中重构样本处理而构建出模型的准确率、召回率、f1值进行对比;
19.步骤5、选择通过步骤4比较得到的指标更优的金融资产分类模型。
20.优选地,步骤1中2、我们收集了以下数据:
21.(1)公司财务报表数据:
22.利润表:包括营业收入、净利润等指标,可用于评估公司的业务模式和盈利能力。现金流量表:特别是经营活动现金流量,可用于分析公司的现金流入和流出情况。
23.(2)债券股票相关数据:
24.债券股票发行文件:包括债券条款和条件,可用于了解债券的还本付息安排和现金流量规定。债券偿还计划:记录了债券的偿还时间表和金额,可用于分析债券的合同现金流量。
25.(3)公司经营数据:
26.销售合同数据:包括销售合同金额、收款条件等,可用于评估公司与客户之间的合同现金流量。供应商合同数据:包括采购合同金额、付款条件等,可用于评估公司与供应商之间的合同现金流量。
27.(4)行业和市场数据:
28.行业报告和研究:了解所处行业的常见业务模式和现金流特征,为比较和分析提供参考。市场指标和竞争情况:了解市场竞争环境和行业趋势,以评估公司管理金融资产的优势和劣势。
29.优选地,步骤2中,对所获取的数据进行数据清洗,剔除异常值和缺失数据,并排除了那些被指定为以公允价值计量、其变动计入其他综合收益的非交易性权益工具投资的数据,最终得到了200条有效数据。随后,进行特征工程,包括特征提取和特征选择,旨在提取与金融资产分类相关的有效特征。我们选择了最具代表性和重要性的特征,即公司管理金融资产的业务模式和金融资产的合同现金流量特征,以降低模型的复杂性并提高分类准确性。
30.表1公司管理金融资产业务模式
[0031][0032]
(1)选取业务模式,合同现金流量作为特征x值,最后输出变量是金融资产分类:1代表以摊余成本计量的金融资产、2代表以公允价值计量且其变动计入其他综合收益的金融资产、3代表以公允价值计量且其变动计入当期损益的金融资产,对于股票而言,股票减少特殊情况引起的偏差,在数据预处理阶段将指定为以公允价值计量且其变动计入其他综合收益的非交易性权益工具投资的股票剔除,其余直接将该资产分类为第3类资产。
[0033]
表2公司管理金融资产分类
[0034][0035]
(2)对所收集的股票和债券进行金融资产分类判断。例如对于债券,如果满足条件:利用one-hot编码,可以通过现金流测试并且业务模式为1,即向量x=[1,0,0,
…
]。如果满足条件:可以通过现金流测试并且业务模式为2,即向量x=[0,1,0,
…
]。同样地,如果债券不满足可以通过现金流测试并且业务模式为其他业务模式的条件,即向量x=[0,0,1,
…
]。
[0036]
(3)优选地,步骤3中,利用hsmote算法处理非平衡样本,hsmote方法是通过在少数类样本中插入人造样本以降低数据的过度倾斜程度,从而提高模型的预测精度。hsmote算法步骤如下:
[0037]
针对少数类样本中的每一个样本x,计算它到该类其他的每个样本间的欧式距离,搜索距离其最近邻样本k个,记录近邻下标;依照少数类样本和多数类样本之间不均衡的比例设置少数类样本的采样倍率向量n=(ω1,ω2,ω3,..,ωn),对所有少数类样本x,从这k个最近邻样本中随机选择xi(i=1,2,
…
,n),第i个样本的特征向量表示为xi=(x
i1
,x
i2
,x
i3
,
…
,x
in
);
[0038]
考虑样本间的波动性式中表示对应第j个特征所有样本的平
均值。考虑样本之间的冲突性:其中r
ij
为第i个指标和第j个指标的相关系数。
[0039]
考虑不同数据类型的波动系数f,经过测试对于本样本布尔类型和浮点型的波动系数分别设置为0.5和2.
[0040][0041]
权重
[0042][0043]
1)将每一个近邻样本xi分别与原始样本x按照x
new
=x+rand(0,1)
×n⊙
(x
i-x)合成新样本,其中n
⊙
(x
i-x)为向量的哈达玛(hadamard)积;
[0044]
foa是通过模拟果蝇群的觅食行为,并基于果蝇群体的协作机制进行的寻优操作,算法中包括了视觉搜索和嗅觉搜索两个部分,关键参数仅为种群数量和最大迭代次数,相对于其他的智能算法,foa更加易于理解、操作简便,且具有较强的局部搜索能力,应用于诸多领域如多背包问题、财务危机预警、神经网络参数优化以及物流服务。具体操作流程为:
[0045]
1)设置种群规模sizepop、最大迭代次数max gen、果蝇群体位置范围lr以及果蝇单词飞行范围fr等相关参数值。在(x,y)标上给出对应的果蝇群体中每个个体的位置信息,初始位置为:x
axis
=rand(lr),y
axis
=rand(lr)。
[0046]
2)赋予果蝇群中每一只果蝇一个随机的飞行方向和距离,,果蝇个体i新的位置为:xi=x
axis
+rand(fr),yi=y
axis
+rand(fr)
[0047]
3)计算出果蝇个体位置距离原点的距离disti,计算公式:
[0048]
4)计算味道浓度判定值si和果蝇群体中每个果蝇的味道浓度值smelli,si=1/disti,smelli=fitness(si),其中,fitness是适应度函数或目标函数;
[0049]
5)选择当前群体中味道浓度最佳的果蝇,并记录下其味道浓度值和位置:
[0050]
[bestsmell,bestindex]=min(smell)
[0051]
6)果蝇群中其他果蝇均按照最佳味道浓度值和对应的位置信息,靠拢此位置:
[0052]
smellbest=bestsmell
[0053]
x
axis
=x(bestindex)
[0054]yaxis
=y(bestindex)
[0055]
7)重复子步骤2)至子步骤6)直到算法迭代次数达到max gen。
[0056]
foa-hsmote-svm的最终计算方式为,以摊余成本计量资产为多数样本s
maj
,以公允价值计量且其变动计入其他综合收益为少数类样本为s
min
,具体步骤如下:
[0057]
1)计算出s
min
中每个样本点(x
smin
,y
smin
)的k个最近信用风险样本邻点,随机抽取一个邻点|s
maj-s
min
|/2,将该邻点与原样本点(x
smin
,y
smin
)的差值乘以[0,1]之间的随机数δ,再加上原样本点(x
smin
,y
smin
),这样就获得一个新的信用风险样本
[0058]
2)重复1),直到人工合成的信用风险样本数达到|s
maj-s
min
|/2;
[0059]
3)模型参数初始化,选取svm的核函数g和惩罚系数c,并确定果蝇味道浓度判定函
数的目标函数式,确定果蝇优化算法的迭代次数max gen和种群规模sizepop,以及算法终止的bestsmell等参数,其中,max gen为100,sizepop为20;
[0060]
4)使用foa对svm预警模型的参数进行寻优,根据si=1/disti两个公式算出果蝇味道浓度判定值smelli并进行迭代循环;
[0061]
5)当bestsmell小于指定值时算法终止,获得浓度值最佳的参数,并代入最优参数和x
new
,作为样本集输入foa-hsmote-svm金融资产分类模型。
[0062]
(4)优选地,步骤4中,我们将数据集分为训练集和验证集,总共包含200条数据。按照70%的比例划分,训练集包含140条数据,测试集包含60条数据。对于改进支持向量机算法对于线性不可分情况,考虑松弛变量,在法对于线性不可分情况,考虑松弛变量,在引入惩罚因子c。
[0063]
同时模型可以合并贝叶斯优化,其中w是所有可能的模型,x为模型的输入,y为模型的输出,m为模型参数的平均值,∑是模型之间两两的协方差矩阵,利用高斯过程:
[0064]
p(y|x,d)=∫p(y|x,d)p(w|d)dw~n(m,∑)
[0065]
进一步的搜索,确定最终超参数。最终使用交叉验证等方法对模型进行评估和调优,包括准确率、召回率、f1分数等指标。并分别与网格搜索法得到超参数的svm,foa-svm进行对比,结果显示,该模型在未知数据上具有较好的泛化能力。
[0066]
表3三种分类模型测试结果对比
[0067][0068][0069]
优选地,步骤5中我们使用训练好的svm模型对验证集中的金融资产数据进行预测和分类。经过预测和分类的结果显示,模型的准确率高达98%,表明该模型具有出色的分类效果。
附图说明
[0070]
图1是金融资产分类方法具体工作流程图
[0071]
图2为金融资产分类股票债券处理流程图
具体实施方式
[0072]
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0073]
实现本发明的技术解决方案:一种基于svm算法的金融资产分类模型,包括如下步骤:
[0074]
步骤1、收集数据:收集金融市场的相关数据,所述相关数据包括公司财务报表数
据、债券股票相关数据、公司经营数据、以及行业和市场数据;
[0075]
步骤2、预处理数据:对步骤1中收集得到的所述相关数据执行数据清洗、重构样本、特征提取和特征选择操作,以提取与金融资产分类相关的有效特征;
[0076]
步骤3、构建金融资产分类模型:
[0077]
基于果蝇优化算法优化svm参数,其中判别函数其中k(xi,yi)为核函数,xi和yi分别代表样本不同的特征值,b为常数,ai为拉格朗日因子i=1,2
…
n;
[0078]
对核函数k(xi,yi)进行全局寻优,构建金融资产分类模型;
[0079]
步骤4、将步骤2预处理后的数据带入步骤3中构建得到的所述金融资产分类模型,与缺省步骤2中重构样本处理而构建出模型的准确率、召回率、f1值进行对比;
[0080]
步骤5、选择通过步骤4比较得到的指标更优的金融资产分类模型。
[0081]
优选地,步骤1中2、我们收集了以下数据:
[0082]
(1)公司财务报表数据:
[0083]
利润表:包括营业收入、净利润等指标,可用于评估公司的业务模式和盈利能力。现金流量表:特别是经营活动现金流量,可用于分析公司的现金流入和流出情况。
[0084]
(2)债券股票相关数据:
[0085]
债券股票发行文件:包括债券条款和条件,可用于了解债券的还本付息安排和现金流量规定。债券偿还计划:记录了债券的偿还时间表和金额,可用于分析债券的合同现金流量。
[0086]
(3)公司经营数据:
[0087]
销售合同数据:包括销售合同金额、收款条件等,可用于评估公司与客户之间的合同现金流量。供应商合同数据:包括采购合同金额、付款条件等,可用于评估公司与供应商之间的合同现金流量。
[0088]
(4)行业和市场数据:
[0089]
行业报告和研究:了解所处行业的常见业务模式和现金流特征,为比较和分析提供参考。市场指标和竞争情况:了解市场竞争环境和行业趋势,以评估公司管理金融资产的优势和劣势。
[0090]
优选地,步骤2中,对所获取的数据进行数据清洗,剔除异常值和缺失数据,并排除了那些被指定为以公允价值计量、其变动计入其他综合收益的非交易性权益工具投资的数据,最终得到了200条有效数据。随后,进行特征工程,包括特征提取和特征选择,旨在提取与金融资产分类相关的有效特征。我们选择了最具代表性和重要性的特征,即公司管理金融资产的业务模式和金融资产的合同现金流量特征,以降低模型的复杂性并提高分类准确性。
[0091]
(1)选取业务模式,合同现金流量作为特征x值,最后输出变量是金融资产分类:1代表以摊余成本计量的金融资产、2代表以公允价值计量且其变动计入其他综合收益的金融资产、3代表以公允价值计量且其变动计入当期损益的金融资产,对于股票而言,股票减少特殊情况引起的偏差,在数据预处理阶段将指定为以公允价值计量且其变动计入其他综合收益的非交易性权益工具投资的股票剔除,其余直接将该资产分类为第3类资产。
[0092]
(2)对所收集的股票和债券进行金融资产分类判断。例如对于债券,如果满足条
件:可以通过现金流测试并且业务模式为1,即向量x=[1,0,0
…
]。如果满足条件:可以通过现金流测试并且业务模式为2,即向量x=[0,1,0
…
]。同样地,如果债券不满足可以通过现金流测试并且业务模式为其他业务模式的条件,即向量x=[0,0,1
…
]。
[0093]
(3)优选地,步骤3中,利用hsmote算法处理非平衡样本,hsmote方法是通过在少数类样本中插入人造样本以降低数据的过度倾斜程度,从而提高模型的预测精度。hsmote是本发明在smote基础上提出的,针对样本特征向量的类型不同而设计,本发明中采用了one-hot编码,导致向量中存在布尔类型和浮点型数据混合,直接采取smote处理容易使得布尔类型数据波动幅度较大,对模型的构建产生影响。
[0094]
hsmote算法步骤如下:
[0095]
针对少数类样本中的每一个样本x,计算它到该类其他的每个样本间的欧式距离,搜索距离其最近邻样本k个,记录近邻下标;
[0096]
1)依照少数类样本和多数类样本之间不均衡的比例设置少数类样本的采样倍率向量n=(ω1,ω2,ω3,..,ωn),对所有少数类样本x,从这k个最近邻样本中随机选择xi(i=1,2,
…
,n),第i个样本的特征向量可以表示为xi=(x
i1
,x
i2
,x
i3
,
…
,x
in
);考虑样本间的波动性式中表示对应第j个特征所有样本的平均值。
[0097]
2)考虑样本之间的冲突性:其中r
ij
为第i个指标和第j个指标的相关系数。
[0098]
3)考虑不同数据类型的波动系数f,经过测试对于本样本布尔类型和浮点型的波动系数分别设置为0.5和2.
[0099][0100]
权重
[0101]
4)将每一个近邻样本xi分别与原始样本x按照x
new
=x+rand(0,1)
×n⊙
(x
i-x)合成新样本,其中n
⊙
(x
i-x)为向量的哈达玛(hadamard)积;
[0102]
5)把合成的新样本和原始训练样本集合并为新的训练样本集,并使用新训练样本集在模型上进行学习。
[0103]
foa是通过模拟果蝇群的觅食行为,并基于果蝇群体的协作机制进行的寻优操作,算法中包括了视觉搜索和嗅觉搜索两个部分,关键参数仅为种群数量和最大迭代次数,相对于其他的智能算法,foa更加易于理解、操作简便,且具有较强的局部搜索能力,应用于诸多领域如多背包问题、财务危机预警、神经网络参数优化以及物流服务。具体操作流程为:
[0104]
1)设置种群规模sizepop、最大迭代次数max gen、果蝇群体位置范围lr以及果蝇单词飞行范围fr等相关参数值。在(x,y)标上给出对应的果蝇群体中每个个体的位置信息,初始位置为:x
axis
=rand(lr),y
axis
=rand(lr)。
[0105]
2)赋予果蝇群中每一只果蝇一个随机的飞行方向和距离,,果蝇个体i新的位置为:xi=x
axis
+rand(fr),yi=y
axis
+rand(fr)
[0106]
3)计算出果蝇个体位置距离原点的距离disti,计算公式:
[0107]
4)计算味道浓度判定值si和果蝇群体中每个果蝇的味道浓度值smelli,si=1/disti,smelli=fitness(si),其中,fitness是适应度函数或目标函数;
[0108]
5)选择当前群体中味道浓度最佳的果蝇,并记录下其味道浓度值和位置:
[0109]
[bestsmell,bestindex]=min(smell)
[0110]
6)果蝇群中其他果蝇均按照最佳味道浓度值和对应的位置信息,靠拢此位置:
[0111]
smellbest=bestsmell
[0112]
x
axis
=x(bestindex)
[0113]yaxis
=y(bestindex)
[0114]
7)重复子步骤2)至子步骤6)直到算法迭代次数达到max gen。
[0115]
foa-hsmote-svm的最终计算方式为,以摊余成本计量资产为多数样本s
maj
,以公允价值计量且其变动计入其他综合收益为少数类样本为s
min
,具体步骤如下:
[0116]
1)计算出s
min
中每个样本点(x
smin
,y
smin
)的k个最近信用风险样本邻点,随机抽取一个邻点|s
maj-s
min
|/2,将该邻点与原样本点(x
smin
,y
smin
的差值乘以[0,1]之间的随机数δ,再加上原样本点(x
smin
,y
smin
),这样就获得一个新的信用风险样本
[0117]
2)重复1),直到人工合成的信用风险样本数达到|s
maj-s
min
|/2;
[0118]
3)模型参数初始化,选取svm的核函数g和惩罚系数c,并确定果蝇味道浓度判定函数的目标函数式,确定果蝇优化算法的迭代次数max gen和种群规模sizepop,以及算法终止的bestsmell等参数,其中,max gen为100,sizepop为20;
[0119]
4)使用foa对svm预警模型的参数进行寻优,根据si=1/disti两个公式算出果蝇味道浓度判定值smelli并进行迭代循环;
[0120]
5)当bestsmell小于指定值时算法终止,获得浓度值最佳的参数,并代入最优参数和x
new
,作为样本集输入foa-hsmote-svm金融资产分类模型。
[0121]
(4)优选地,步骤4中,我们将数据集分为训练集和验证集,总共包含200条数据。按照70%的比例划分,训练集包含140条数据,测试集包含60条数据。对于改进支持向量机算法对于线性不可分情况,考虑松弛变量,在法对于线性不可分情况,考虑松弛变量,在引入惩罚因子c。
[0122]
同时模型可以合并贝叶斯优化,其中w是所有可能的模型,x为模型的输入,y为模型的输出,m为模型参数的平均值,∑是模型之间两两的协方差矩阵,利用高斯过程:
[0123]
p(y|x,d)=∫p(y|x,d)p(w|d)dw~n(m,∑)
[0124]
进一步的搜索,确定最终超参数。最终使用交叉验证等方法对模型进行评估和调优,包括准确率、召回率、f1分数等指标。并分别与网格搜索法得到超参数的svm,foa-svm进行对比,结果显示,该模型在未知数据上具有较好的泛化能力。
[0125]
优选地,步骤5中我们使用训练好的svm模型对验证集中的金融资产数据进行预测和分类。经过预测和分类的结果显示,模型的准确率高达98%,表明该模型具有出色的分类效果。
[0126]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
技术特征:
1.基于支持向量机算法的金融资产分类方法,其特征在于,包括如下步骤:步骤1、收集数据:收集金融市场的相关数据,所述相关数据包括公司财务报表数据、债券股票相关数据、公司经营数据、以及行业和市场数据;步骤2、预处理数据:对步骤1中收集得到的所述相关数据执行数据清洗、重构样本、特征提取和特征选择操作,以提取与金融资产分类相关的有效特征;步骤3、构建金融资产分类模型:基于果蝇优化算法优化svm参数,其中判别函数其中k(x
i
,y
i
)为核函数,x
i
和y
i
分别代表样本不同的特征值,b为常数,a
i
为拉格朗日因子i=1,2
…
n;对核函数k(x
i
,y
i
)进行全局寻优,构建金融资产分类模型;步骤4、将步骤2预处理后的数据带入步骤3中构建得到的所述金融资产分类模型,与缺省步骤2中重构样本处理而构建出模型的准确率、召回率、f1值进行对比;步骤5、选择通过步骤4比较得到的指标更优的金融资产分类模型。2.根据权利要求1所述的基于支持向量机算法的金融资产分类方法,其特征在于,步骤2中重构样本包括以下子步骤:步骤2-a-1、利用hsmote算法处理非平衡样本,针对少数类样本中的每一个样本x,计算它到该类其他的每个样本间的欧式距离,搜索距离其最近邻样本k个,记录近邻下标;步骤2-a-2、依照少数类样本和多数类样本之间不均衡的比例设置少数类样本的采样倍率向量n=(ω1,ω2,ω3,..,ω
n
),对所有少数类样本x,从这k个最近邻样本中随机选择x
i
(i=1,2,
…
,n),第i个样本的特征向量表示为x
i
=(x
i1
,x
i2
,x
i3
,
…
,x
in
);步骤2-a-3、考虑样本间的波动性式中表示对应第j个特征所有样本的平均值;步骤2-a-4、考虑样本之间的冲突性:其中r
ij
为第i个指标和第j个指标的相关系数;步骤2-a-5、考虑不同数据类型的波动系数f,经过测试对于本样本布尔类型和浮点型的波动系数分别设置为0.5和2;权重步骤2-a-6、将每一个近邻样本x
i
分别与原始样本x按照:x
new
=x+rand(0,1)
×
n
⊙
(x
i-x)合成新样本,其中n
⊙
(x
i-x)为向量的哈达玛(hadamard)积。3.根据权利要求1所述的基于支持向量机算法的金融资产分类方法,其特征在于,1)公司财务报表数据:包括营业收入、净利润等指标2)债券股票相关数据:包括债券条款和条件,、债券偿还计划:3)公司经营数据:包括销售合同数据,、供应商合同数据:4)行业和市场数据:包括行业报告和研究。
4.根据权利要求1所述的金融资产分类方法,其特征在于,所述步骤2中所述数据清洗包括以下子步骤:步骤2-b-1、对所获取的数据进行数据清洗,剔除异常值和缺失数据,选取200条有效数据,按照70%的比例划分,训练集包含140条数据,测试集包含60条数据。;步骤2-b-2、选取业务模式,和合同现金流量,作为输入变量,最后输出变量是金融资产分类,所述金融资产分为三类:1代表以摊余成本计量的金融资产、2代表以公允价值计量且其变动计入其他综合收益的金融资产、3代表以公允价值计量且其变动计入当期损益的金融资产。5.根据权利要求1所述的金融资产分类方法,其特征在于,所述支持向量机算法对于线性不可分情况,考虑松弛变量,在引入惩罚因子c。6.根据权利要求1至4任意一项权利要求所述的金融资产分类方法,其特征在于步骤3包括以下子步骤:1)步骤3-1、设置种群规模sizepop、最大迭代次数max gen、果蝇群体位置范围lr以及果蝇单词飞行范围fr等相关参数值。;在(x,y)标上给出对应的果蝇群体中每个个体的位置信息,初始位置为:x
axis
=rand(lr),y
axis
=rand(lr);2)步骤3-2、赋予果蝇群中每一只果蝇一个随机的飞行方向和距离,,果蝇个体i新的位置为:x
i
=x
axis
+rand(fr),y
i
=y
axis
+rand(fr)3)步骤3-3、计算出果蝇个体位置距离原点的距离dist
i
,计算公式:4)步骤3-4、计算味道浓度判定值s
i
和果蝇群体中每个果蝇的味道浓度值smell
i
,s
i
=1/dist
i
,smell
i
=fitness(s
i
),其中,fitness是权利要求步骤3)所述判别函数;5)步骤3-5、选择当前群体中味道浓度最佳的果蝇,并记录下其味道浓度值和位置:[bestsmell,bestindex]=min(smell)6)步骤3-6、果蝇群中其他果蝇均按照最佳味道浓度值和对应的位置信息,靠拢此位置:smellbest=bestsmellx
axis
=x(bestindex)y
axis
=y(bestindex)7)步骤3-7、重复子步骤3-2、2)至子步骤3-6、6),直到算法迭代次数达到max gen。7.根据权利要求5所述的金融资产分类方法,其特征在于,其中以摊余成本计量资产为多数样本s
maj
j,以公允价值计量且其变动计入其他综合收益为少数类样本为s
min
,构建金融资产分类模型foa-smote-svm的步骤为包括:1)计算出s
min
中每个样本点(x
smin
,y
smin
)的k个最近信用风险样本邻点,随机抽取一个邻点|s
maj-s
min
|/2,将该邻点与原样本点(x
smin
,y
smin
)的差值乘以[0,1]之间的随机数δ,再加上原样本点(x
smin
,y
smin
),这样就获得一个新的信用风险样本),这样就获得一个新的信用风险样本2)重复1),直到人工合成的信用风险样本数达到|s
maj-s
min
|/2;3)模型参数初始化,选取svm的核函数g和惩罚系数c,并确定果蝇味道浓度判定函数的目标函数式,确定果蝇优化算法的迭代次数max gen和种群规模sizepop,以及算法终止的
bestsmell等参数,其中,max gen为100,sizepop为20;4)使用foa对svm预警模型的参数进行寻优,根据s
i
=1/dist
i
两个公式算出果蝇味道浓度判定值smell
i
并进行迭代循环;5)当bestsmell小于指定值时算法终止,获得浓度值最佳的参数,并代入最优参数和x
new
,作为样本集输入foa-smote-svm金融资产分类模型。8.根据权利要求6所述的金融资产分类方法,其特征在于,所得到的模型构建得到的所述金融资产分类模型可以合并贝叶斯优化,其中w是所有可能的模型,x为模型的输入,y为模型的输出,m为模型参数的平均值,∑是模型之间两两的协方差矩阵利用高斯过程:p(y|x,d)=∫p(y|x,d)p(w|d)dw~n(m,∑)进一步的搜索,确定最终超参数。9.根据权利还要求1所述的金融资产分类方法,其特征在于,步骤4)包括将测试集的数据带入所述金融资产分类方法进行分类效果评估,并分别与网格搜索法得到超参数的svm,foa-svm的准确率、召回率、f1值进行对比。10.根据权利要求3或8所述的金融资产分类方法,其特征在于,为了股票减少特殊情况引起的偏差,在数据预处理阶段将指定为以公允价值计量且其变动计入其他综合收益的非交易性权益工具投资的股票剔除,其余直接将该资产分类为第3类资产。11.一种金融资产分类系统,其特征在于包括:数据收集单元,用于收集金融市场的相关数据,包括公司财务报表数据、债券股票相关数据、公司经营数据、以及行业和市场数据;数据预处理单元,用于对所述数据收集单元收集得到的相关数据执行数据清洗、重构样本、特征提取和特征选择操作,以提取与金融资产分类相关的有效特征;金融资产分类模型构建单元,用于构建基于foa-hsmote-svm的金融资产分类模型;评估单元,用于将所述数据预处理单元预处理后的数据带入构建得到的所述金融资产分类模型,与未进行平衡后的样本构建的模型效果进行评估。12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行如权利要1-4中任一项所述的金融资产分类方法的操作。
技术总结
本发明提供了一种金融资产分类方法及系统,具体涉及一种基于支持向量机算法的金融资产分类方法及系统。该模型旨在提高金融资产分类的准确性和稳定性。通过结合金融财会领域的特定特征和数据,本发明利用SVM算法构建了金融资产分类模型,并通过对训练数据的学习和优化,实现了对金融资产的准确分类和预测。该模型在金融投资决策和风险管理中具有广泛的应用前景。本发明为金融资产分类领域提供了一种创新的解决方案,能够在金融投资决策和风险管理中提供准确的支持和指导。理中提供准确的支持和指导。理中提供准确的支持和指导。
技术研发人员:刘梦迪 许凤
受保护的技术使用者:南京财经大学
技术研发日:2023.06.06
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
