一种基于胶囊网络的企业税收合规风险评估方法与流程

未命名 07-23 阅读:127 评论:0


1.本发明属于企业风控技术领域,具体涉及一种基于胶囊网络的企业税收合规风险评估方法。


背景技术:

2.企业税收合规是指企业按照国家税收法规和政策规定及时、准确地申报和缴纳税款的过程,对企业稳定发展至关重要。企业税收合规风险评估能够有效帮助企业识别和控制风险,提高税收合规水平。
3.目前,税收风险主要是靠财务人员对企业的税收关联数据进行分析,以判别企业税收风险的高低。但常与财务人员的主观性相关联,存在主观性和局限性;且由于人工评估效率有限,对参与评估数据的要求较高,需要提前对数据进行清洗和处理,难以处理大量和复杂数据,也导致分析结果准确性难以保证。同时传统风险评估多选择考虑单一风险因素的影响,无法全面、综合地考虑不同风险因素间的关系,易导致分析结果产生较大误差,进而导致税收风险评估的准确率较低。


技术实现要素:

4.本发明在于提供一种基于胶囊网络的企业税收合规风险评估方法,通过采用残差网络、胶囊网络对企业税收指标类型数据进行学习处理,获取融合税收特征向量和风险特征向量,同时能够获取企业税收指标风险项;并采用均方差损失函数对残差网络模型和胶囊网络模型进行优化、以及采用余弦相似度计算企业各风险指标存在风险的概率,并输出对应的风险评估结果,以表示企业在对应风险指标上的企业税收合规状况,实现企业税收合规风险的自动、智能评估,帮助企业及时发现潜在风险,提高税收合规水平;能够克服由于财务人员主观性和单一因素考量局限性导致的税收风险评估结果准确性低的技术缺陷,提高税收合规风险评估的准确性。
5.一种基于胶囊网络的企业税收合规风险评估方法,包括如下步骤:s1:获取企业的税收指标数据,并进行预处理,获取格式化的数据特征;s2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;s3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;s4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;s5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,用于表示企业在各风险指标上的企业税收合规状况。
6.通过采用残差网络、胶囊网络对企业税收指标类型数据进行学习处理,获取融合
税收特征向量和风险特征向量,同时能够获取企业税收指标风险项;并采用均方差损失函数对残差网络模型和胶囊网络模型进行优化、以及采用余弦相似度计算企业各风险指标存在风险的概率,并输出对应的风险评估结果,以表示企业在对应风险指标上的企业税收合规状况,实现企业税收合规风险的自动、智能评估,帮助企业及时发现潜在风险,提高税收合规水平;能够克服由于财务人员主观性和单一因素考量局限性导致的税收风险评估结果准确性低的技术缺陷,提高税收合规风险评估的准确性。
7.进一步的,所述s1中,企业的税收指标数据中数据指标包括:营业收入增长率、毛利率、费用率、有效税率、应纳税额、逾期未缴税款金额、税收违规次数、企业所得税负担率。
8.进一步的,所述s1中,对企业的税收指标数据进行预处理,获取格式化的数据特征的过程具体包括如下步骤:s11:基于获取的税收指标数据,对各税收指标数据进行归一化处理;s12:依照时间序列h对w个税收指标类型进行排列,构建时间序列与税收指标类型的二维向量,作为格式化的数据特征。
9.进一步的,所述s11中,对各税收指标数据进行归一化处理的计算表达式为:;式中,表示归一化后的税收指标数据值,其取值范围为0至1,表示原始税收指标数据值,表示对应税收指标中的最大值,表示对应税收指标中的最小值。
10.进一步的,所述s2中,基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量的过程具体包括:对各税收指标类型数量分别构建残差网络,共个;即设残差网络为函数,其中;残差网络包括卷积层和全连接层;s21:将数据特征的每一列税收指标类型,即,分别作为对应残差网络卷积层的输入;s22:残差网络卷积层对税收指标类型进行卷积处理后,结合跳跃连接,计算各税收指标类型对应的特征向量,并拼接各税收指标类型对应的特征向量,构建新的特征矩阵;各税收指标类型对应的特征向量的计算表达式为:;拼接各税收指标类型对应的特征向量,构建新的特征矩阵,其计算表达式为:;其中,新的特征矩阵的形状为,表示特征向量的长度,表示拼接后特征向量的宽度,即税收指标类型个数;s23:将所构建的特征矩阵作为残差网络全连接层的输入,并采用激活函数进行
激活处理,用于输出融合税收特征向量;融合税收特征向量的计算表达式为:;式中,为激活函数;为残差网络中全连接层的权重矩阵,其形状为;为残差网络中全连接层的偏置向量;为一维的融合税收特征向量,其向量长度为。
11.通过残差网络进行特征学习,为企业税收合规风险评估提供关键信息,用于后续的企业税收合规风险评估。
12.进一步的,所述s3中,基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量的过程具体包括:s31:将数据特征作为胶囊网络卷积层的输入,获取新的特征图,以提取数据特征的局部特征;新的特征图的计算表达式为:;式中,为激活函数;为胶囊网络中卷积层的权重矩阵;为胶囊网络中卷积层的偏置向量;为卷积操作;s32:基于所得的特征图,利用胶囊网络的胶囊层捕捉表述特征存在和属性的向量;其中,胶囊层为个,每个胶囊层由多个胶囊单元组成;胶囊层的输出向量,用于表示特征的存在和属性,其计算表达式为:;式中,为第个胶囊层的输出向量,其中,;为胶囊层的计算函数;s33:将个胶囊层的输出向量作为动态路由层的输入,通过迭代更新胶囊层和风险特征向量间的连接权重,用于输出风险特征向量;连接权重的计算表达式为:;风险特征向量的计算表达式为:
;式中,表示第个胶囊层和第个风险特征向量间的连接权重;为连接权重的未归一化数据;为归一化函数;为风险特征向量,其向量长度与融合税收特征向量的长度一致,其中,,为风险特征向量个数;为激活函数。
13.通过胶囊网络捕捉这些风险特征在数据特征中的存在和属性,为企业税收合规风险评估提供关键信息,用于后续的企业税收合规风险评估。
14.进一步的,所述s4中,结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化的过程具体包括:s41:基于真实的税收特征向量和真实的风险特征向量,分别计算残差网络、胶囊网络的损失,并结合权重,计算残差网络和胶囊网络加权损失;残差网络损失函数的计算表达式为:;胶囊网络损失函数的计算表达式为:;残差网络和胶囊网络加权损失的计算表达式为:;式中,、为超参数,用于控制残差网络和胶囊网络损失的权重;s42:采用梯度下降反向传播算法,分别更新残差网络和胶囊网络的权重;残差网络的梯度的计算表达式为:;胶囊网络的梯度的计算表达式为:;更新残差网络权重的过程为:;更新胶囊网络权重的过程为:;
式中,是学习率,用于控制参数更新的步长。
15.通过迭代优化模型权重参数,可以提高所提取出的税收特征和风险特征的准确性,从而更准确地进行企业税收合规风险评估。
16.进一步的,所述s5中,利用余弦相似度计算企业存在风险的概率,输出企业税收合规风险评估结果的过程包括:s51:结合融合税收特征向量和风险特征向量,计算两者间的余弦相似度;余弦相似度的计算表达式为:;式中,为余弦相似度计算函数,用于表示风险指标项存在风险的概率;为融合税收特征向量和风险特征向量的点积;为融合税收特征向量的模;为风险特征向量的模;s52:设定相似度阈值,基于余弦相似度的值判别企业是否存在风险;;式中,表示第类风险指标存在风险的结果;当时,表示该企业的第类风险指标存在风险,当时,表示该企业的第类风险指标不存在风险。
17.一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述任一项所述的方法。
18.一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一项所述的方法。
19.本发明的有益效果为:本发明通过采用残差网络、胶囊网络对企业税收指标类型数据进行学习处理,获取融合税收特征向量和风险特征向量,同时能够获取企业税收指标风险项;并采用均方差损失函数对残差网络模型和胶囊网络模型进行优化、以及采用余弦相似度计算企业各风险指标存在风险的概率,并输出对应的风险评估结果,以表示企业在对应风险指标上的企业税收合规状况,实现企业税收合规风险的自动、智能评估,帮助企业及时发现潜在风险,提高税收合规水平;能够克服由于财务人员主观性和单一因素考量局限性导致的效率低、且税收风险评估结果准确性低的技术缺陷,提高税收合规风险评估的处理效率和结果准确性。
附图说明
20.图1为本发明的流程图;图2为本发明中计算机设备的结构示意图。
具体实施方式
21.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
22.要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
23.另外,在以下描述中,提供具体细节是为了便于透彻理解实例,对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
24.实施例1图1所示的是一种基于胶囊网络的企业税收合规风险评估方法,通过采用残差网络、胶囊网络对企业税收指标类型数据进行学习处理,获取融合税收特征向量和风险特征向量,同时能够获取企业税收指标风险项;并采用均方差损失函数对残差网络模型和胶囊网络模型进行优化、以及采用余弦相似度计算企业各风险指标存在风险的概率,并输出对应的风险评估结果,以表示企业在对应风险指标上的企业税收合规状况,实现企业税收合规风险的自动、智能评估,帮助企业及时发现潜在风险,提高税收合规水平;能够克服由于财务人员主观性和单一因素考量局限性导致的税收风险评估结果准确性低的技术缺陷,提高税收合规风险评估的准确性。该方法具体包括如下步骤:s1:获取企业的税收指标数据,并进行预处理,获取格式化的数据特征;其中,企业的税收指标数据中数据指标包括:营业收入增长率(%)、毛利率(%)、费用率(%)、有效税率(%)、应纳税额(元)、逾期未缴税款金额(元)、税收违规次数(次)、企业所得税负担率(%)。
25.其中,对企业的税收指标数据进行预处理,获取格式化的数据特征的过程具体包括如下步骤:s11:基于获取的税收指标数据,对各税收指标数据进行归一化处理;对各税收指标数据进行归一化处理的计算表达式为:;式中,表示归一化后的税收指标数据值,其取值范围为0至1,表示原始税收指标数据值,表示对应税收指标中的最大值,表示对应税收指标中的最小值。
26.s12:依照时间序列h对w个税收指标类型进行排列,构建时间序列与税收指标类型的二维向量,作为格式化的数据特征。
27.所构建的二维向量为,其中,为时间序列长度,为税收指标类型;二维向量中,行代表时间节点,列代表税收指标类型,将其作为格式化的数据特征,用于后续残差网络和胶囊网络的输入。
28.s2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;其过程具体包括:对各税收指标类型数量分别构建残差网络,共个;即设残差网络为函数,其中;残差网络包括卷积层和全连接层;s21:将数据特征的每一列税收指标类型,即,分别作为对应残差网络卷积层的输入;将数据特征按列拆分,并将每一列税收指标类型作为独立的输入特征,分别输入到对应的残差网络中,使得每个残差网络独立关注不同的税收指标。
29.s22:残差网络卷积层对税收指标类型进行卷积处理后,结合跳跃连接,计算各税收指标类型对应的特征向量,并拼接各税收指标类型对应的特征向量,构建新的特征矩阵;各税收指标类型对应的特征向量的计算表达式为:;拼接各税收指标类型对应的特征向量,构建新的特征矩阵,其计算表达式为:;其中,新的特征矩阵的形状为,表示特征向量的长度,表示拼接后特征向量的宽度,即税收指标类型个数;s23:将所构建的特征矩阵作为残差网络全连接层的输入,并采用激活函数进行激活处理,用于输出融合税收特征向量;融合税收特征向量的计算表达式为:;式中,为激活函数;为残差网络中全连接层的权重矩阵,其形状为;为残差网络中全连接层的偏置向量;为一维的融合税收特征向量,其向量长度为。
30.通过残差网络进行特征学习,为企业税收合规风险评估提供关键信息,用于后续的企业税收合规风险评估。
31.s3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;
进一步的,所述s3中,基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量的过程具体包括:构建胶囊网络,用于多任务学习;胶囊网络包括一个卷积层、多个胶囊层、一个动态路由层。采用胶囊网络获取多维度的风险特征向量的过程具体包括:s31:将数据特征作为胶囊网络卷积层的输入,获取新的特征图,以提取数据特征的局部特征;新的特征图的计算表达式为:;式中,为激活函数;为胶囊网络中卷积层的权重矩阵;为胶囊网络中卷积层的偏置向量;为卷积操作;s32:基于所得的特征图,利用胶囊网络的胶囊层捕捉表述特征存在和属性的向量;其中,胶囊层为个,每个胶囊层由多个胶囊单元组成;胶囊层的输出向量,用于表示特征的存在和属性,其计算表达式为:;式中,为第个胶囊层的输出向量,其中,;为胶囊层的计算函数;s33:将个胶囊层的输出向量作为动态路由层的输入,通过迭代更新胶囊层和风险特征向量间的连接权重,用于输出风险特征向量;连接权重的计算表达式为:;风险特征向量的计算表达式为:;式中,表示第个胶囊层和第个风险特征向量间的连接权重;为连接权重的未归一化数据;为归一化函数;为风险特征向量,其向量长度与融合税收特征向量的长度一致,其中,,为风险特征向量个数;为激活函数。
32.在企业税收合规风险评估过程中,风险指标包括逾期未缴税款风险、税收缴纳不足风险、税收筹划风险、税收征管制度变更风险等。
33.通过胶囊网络捕捉这些风险特征在数据特征中的存在和属性,为企业税收合规风
险评估提供关键信息,用于后续的企业税收合规风险评估。
34.s4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;其过程具体包括:s41:基于真实的税收特征向量和真实的风险特征向量,分别计算残差网络、胶囊网络的损失,并结合权重,计算残差网络和胶囊网络加权损失;残差网络损失函数的计算表达式为:;胶囊网络损失函数的计算表达式为:;残差网络和胶囊网络加权损失的计算表达式为:;式中,、为超参数,用于控制残差网络和胶囊网络损失的权重;s42:采用梯度下降反向传播算法,分别更新残差网络和胶囊网络的权重;残差网络的梯度的计算表达式为:;胶囊网络的梯度的计算表达式为:;更新残差网络权重的过程为:;更新胶囊网络权重的过程为:;式中,是学习率,用于控制参数更新的步长。
35.通过迭代优化模型权重参数,可以提高所提取出的税收特征和风险特征的准确性,从而更准确地进行企业税收合规风险评估。
36.s5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,用于表示企业在各风险指标上的企业税收合规状况;其过程具体包括:s51:结合融合税收特征向量和风险特征向量,计算两者间的余弦相似度,以评估各风险指标存在风险的概率;余弦相似度的计算表达式为:
;式中,为余弦相似度计算函数,用于表示风险指标项存在风险的概率;为融合税收特征向量和风险特征向量的点积;为融合税收特征向量的模;为风险特征向量的模;s52:设定相似度阈值,基于余弦相似度的值判别企业是否存在风险;;式中,表示第类风险指标存在风险的结果;当时,表示该企业的第类风险指标存在风险,当时,表示该企业的第类风险指标不存在风险。
37.通过输出各风险指标类型的评估结果,实现企业税收合规风险的智能评估,帮助企业及时发现潜在风险,提高税收合规水平。
38.实施例2基于同一技术构思,如图2所示,本实施例还提供了一种与前述实施例提供的方法对应的计算机设备,包括处理器2、存储器1和总线,存储器存储有处理器可执行的机器可读指令,当计算机设备运行时,处理器与存储器之间通过总线通信,机器可读指令被处理器执行时执行上述任一项所述的方法。
39.其中,存储器1至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。
40.存储器1在一些实施例中可以是企业税收合规风险评估系统的内部存储单元,例如硬盘。存储器1在另一些实施例中也可以是企业税收合规风险评估系统的外部存储设备,例如插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)等。进一步地,存储器1还可以既包括企业税收合规风险评估系统的内部存储单元也包括外部存储设备。存储器1不仅可以用于存储安装于企业税收合规风险评估系统的应用软件及各类数据,例如企业税收合规风险评估系统程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
41.处理器2在一些实施例中可以是一中央处理器(central processing unit, cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器1中存储的程序代码或处理数据,例如执行企业税收合规风险评估程序等。
42.本发明公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
43.本发明公开实施例所提供的应用页面内容刷新方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的方法的步骤,具体可参见上述方法实施例,在此不再赘述。
44.本发明公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前
述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
45.可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
46.需要说明的是,在本发明的描述中,术语第一、第二等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,多个的含义是指至少两个。
47.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
48.应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
49.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
50.此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
51.上述提到的存储介质可以是只读存储器,磁盘或光盘等。
52.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
53.尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:
1.一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,包括如下步骤:s1:获取企业的税收指标数据,并进行预处理,获取格式化的数据特征;s2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;s3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;s4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;s5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,用于表示企业在各风险指标上的企业税收合规状况。2.根据权利要求1所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s1中,企业的税收指标数据中数据指标包括:营业收入增长率、毛利率、费用率、有效税率、应纳税额、逾期未缴税款金额、税收违规次数、企业所得税负担率。3.根据权利要求1所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s1中,对企业的税收指标数据进行预处理,获取格式化的数据特征的过程具体包括如下步骤:s11:基于获取的税收指标数据,对各税收指标数据进行归一化处理;s12:依照时间序列h对w个税收指标类型进行排列,构建时间序列与税收指标类型的二维向量,作为格式化的数据特征。4.根据权利要求3所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s11中,对各税收指标数据进行归一化处理的计算表达式为:;式中,表示归一化后的税收指标数据值,其取值范围为0至1,表示原始税收指标数据值,表示对应税收指标中的最大值,表示对应税收指标中的最小值。5.根据权利要求3所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s2中,基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量的过程具体包括:对各税收指标类型数量分别构建残差网络,共个;即设残差网络为函数,其中;残差网络包括卷积层和全连接层;s21:将数据特征的每一列税收指标类型,即,分别作为对应残差网络卷积层的输入;s22:残差网络卷积层对税收指标类型进行卷积处理后,结合跳跃连接,计算各税收指标类型对应的特征向量,并拼接各税收指标类型对应的特征向量,构建新的特征矩阵;
各税收指标类型对应的特征向量的计算表达式为:;拼接各税收指标类型对应的特征向量,构建新的特征矩阵,其计算表达式为:;其中,新的特征矩阵的形状为,表示特征向量的长度,表示拼接后特征向量的宽度,即税收指标类型个数;s23:将所构建的特征矩阵作为残差网络全连接层的输入,并采用激活函数进行激活处理,用于输出融合税收特征向量;融合税收特征向量的计算表达式为:;式中,为激活函数;为残差网络中全连接层的权重矩阵,其形状为;为残差网络中全连接层的偏置向量;为一维的融合税收特征向量,其向量长度为。6.根据权利要求5所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s3中,基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量的过程具体包括:s31:将数据特征作为胶囊网络卷积层的输入,获取新的特征图,以提取数据特征的局部特征;新的特征图的计算表达式为:;式中,为激活函数;为胶囊网络中卷积层的权重矩阵;为胶囊网络中卷积层的偏置向量;为卷积操作;s32:基于所得的特征图,利用胶囊网络的胶囊层捕捉表述特征存在和属性的向量;其中,胶囊层为个,每个胶囊层由多个胶囊单元组成;胶囊层的输出向量,用于表示特征的存在和属性,其计算表达式为:;式中,为第个胶囊层的输出向量,其中,;为胶囊层的计算函数;s33:将个胶囊层的输出向量作为动态路由层的输入,通过迭代更新胶囊层和风险特征向量间的连接权重,用于输出风险特征向量;
连接权重的计算表达式为:;风险特征向量的计算表达式为:;式中,表示第个胶囊层和第个风险特征向量间的连接权重;为连接权重的未归一化数据;为归一化函数;为风险特征向量,其向量长度与融合税收特征向量的长度一致,其中,,为风险特征向量个数;为激活函数。7.根据权利要求6所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s4中,结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化的过程具体包括:s41:基于真实的税收特征向量和真实的风险特征向量,分别计算残差网络、胶囊网络的损失,并结合权重,计算残差网络和胶囊网络加权损失;残差网络损失函数的计算表达式为:;胶囊网络损失函数的计算表达式为:;残差网络和胶囊网络加权损失的计算表达式为:;式中,、为超参数,用于控制残差网络和胶囊网络损失的权重;s42:采用梯度下降反向传播算法,分别更新残差网络和胶囊网络的权重;残差网络的梯度的计算表达式为:;胶囊网络的梯度的计算表达式为:;更新残差网络权重的过程为:
;更新胶囊网络权重的过程为:;式中,是学习率,用于控制参数更新的步长。8.根据权利要求7所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述s5中,利用余弦相似度计算企业存在风险的概率,输出企业税收合规风险评估结果的过程包括:s51:结合融合税收特征向量和风险特征向量,计算两者间的余弦相似度;余弦相似度的计算表达式为:;式中,为余弦相似度计算函数,用于表示风险指标项存在风险的概率;为融合税收特征向量和风险特征向量的点积;为融合税收特征向量的模;为风险特征向量的模;s52:设定相似度阈值,基于余弦相似度的值判别企业是否存在风险;;式中,表示第类风险指标存在风险的结果;当时,表示该企业的第类风险指标存在风险,当时,表示该企业的第类风险指标不存在风险。9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8中任一项所述的方法。

技术总结
本发明属于企业风控技术领域,具体涉及一种基于胶囊网络的企业税收合规风险评估方法,包括:S1:获取企业的税收指标数据,预处理后获取格式化的数据特征;S2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;S3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;S4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;S5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,表示企业在各风险指标上的企业税收合规状况。业税收合规状况。业税收合规状况。


技术研发人员:胡为民 黄婵娟 何永定 张丽
受保护的技术使用者:深圳市迪博企业风险管理技术有限公司
技术研发日:2023.06.15
技术公布日:2023/7/21
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐