一种配电网调频方法、装置、设备和存储介质与流程

未命名 07-22 阅读：250 评论：0

1.本发明涉及计算机技术领域，尤其涉及一种配电网调频方法、装置、设备和存储介质。

背景技术：

2.随着技术的发展，越来越多的电动汽车被生产和使用。电动汽车需要使用充电桩进行充电。目前，随着越来越多的插电式电动汽车负荷通过充电桩接入配电网，充电桩的功率变换装置所采用的电力电子器件缺少传统发电机组所固有的惯性与阻尼，会导致在实时充电的过程中会造成配电网的惯性与阻尼缺失。并且当大量电动汽车接入配电网导致具有固有惯性和阻尼的传统机组在配电网中的占比越来越少，会导致配电网中电力系统的同步机制越来越差，使得配电网中电力系统的稳定性降低。

技术实现要素：

3.本发明提供了一种配电网调频方法、装置、设备和存储介质，以有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。
4.根据本发明的一方面，提供了一种配电网调频方法，该方法包括：
5.获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，所述当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息；
6.将所述当前状态信息和所述当前电网调度信息输入至预设决策网络模型中，所述预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，所述目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的；
7.基于所述预设决策网络模型的输出，获得所述配电网中充电桩对应的当前充电桩动作信息和所述配电网中储能电池对应当前储能电池动作信息，并基于所述当前充电桩动作信息和所述当前储能电池动作信息，对所述配电网进行调频。
8.根据本发明的另一方面，提供了一种配电网调频装置，该装置包括：
9.信息获取模块，用于获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，所述当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息；
10.信息输入模块，用于将所述当前状态信息和所述当前电网调度信息输入至预设决策网络模型中，所述预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，所述目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的；
11.动作信息确定模块，用于基于所述预设决策网络模型的输出，获得所述配电网中
充电桩对应的当前充电桩动作信息和所述配电网中储能电池对应当前储能电池动作信息，并基于所述当前充电桩动作信息和所述当前储能电池动作信息，对所述配电网进行调频。
12.根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：
13.至少一个处理器；以及
14.与所述至少一个处理器通信连接的存储器；其中，
15.所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的配电网调频方法。
16.根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的配电网调频方法。
17.本发明实施例的技术方案，通过预先基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建获得目标奖励函数，并基于目标奖励函数进行强化学习获得预设决策网络模型。该预设决策网络模型可以针对不同的环境状态信息，如样本状态信息和样本电网调度信息决策出最优的动作信息，以便保证配电网中总发电量与总负荷量相平衡。在多个电动汽车充电的过程中，获取配电网中的当前状态信息和配电网接收到的当前电网调度信息，并将获取的当前状态信息和所述当前电网调度信息输入至预设决策网络模型中进行动作决策，从而基于预设决策网络模型的输出，可以获得决策出最优的当前动作信息，并基于当前动作信息对充电桩和储能电池进行动作，从而基于当前动作信息可以有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性和用户的充电体验。
18.应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
19.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
20.图1是根据本发明实施例一提供的一种配电网调频方法的流程图；
21.图2是本发明实施例一所涉及的一种虚拟同步机的电动汽车充电站的示例图；
22.图3是本发明实施例一所涉及的一种双向交直流变换器的示例图；
23.图4是本发明实施例一所涉及的一种双向直流变换器的示例图；
24.图5是根据本发明实施例二提供的另一种配电网调频方法的流程图；
25.图6是根据本发明实施例三提供的一种配电网调频装置的结构示意图；
26.图7是实现本发明实施例的配电网调频方法的电子设备的结构示意图。
具体实施方式
27.为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。
28.需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
29.实施例一
30.图1为本发明实施例一提供了一种配电网调频方法的流程图，本实施例可适用于对基于预设决策网络模型的输出对配电网进行调频的情况，尤其适用于针对多个电动汽车充电时进行配电网调频的情况，该方法可以由配电网调频装置来执行，该配电网调频装置可以采用硬件和/或软件的形式实现，该配电网调频装置可配置于电子设备中。如图1所示，该方法包括：
31.s110、获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息。
32.其中，配电网下可以存在多个充电站。配电网可以给多个充电站同时供电。每个充电站中存在多个充电桩和储能电池。电动汽车可以由充电站内的充电桩进行充电。图2给出了一种虚拟同步机的电动汽车充电站的示例图。参见图2。充电站内部充电桩采用虚拟同步技术。电动汽车通过充电桩进行并网，借此实现能量的双向流动。虚拟同步机是一种模拟同步机的工具。虚拟同步机可以用于模拟电力系统的运行状态。本方案适用于配电网下存在充电站的情况。本方案不限制配电网下充电站的数量，现以配电网下存在一个充电站，且该充电站内存在4个充电桩为例。虚拟同步机的电动汽车充电站可以包括：外部通讯网络、充电站内部信息通信网络、10kv交流母线、0.7kv直流母线、电动汽车充电站运行控制中心、接入充电的电动汽车、储能电池。外部通讯网络可以用于接收充电站外部的当前电网调度信息。充电站内部信息通信网络可以用于接收充电站内的当前状态信息。10kv交流母线与0.7kv直流母线经双向交直流(ac/dc)变换器(1)以电力线相连。例如，图3给出了一种双向交直流变换器的示例图。双向交直流变换器可以是采用虚拟同步机技术进行控制的。同时10kv交流母线以通讯线与电动汽车充电站运行控制中心相连。电动汽车充电站运行控制中心可以对10kv交流母线运行信息进行监测，并通过通讯线和外部通讯网络与充电站内部信息通信网络相连，汽车充电站运行控制中心中存在预设决策网络模型。0.7kv直流母线和各个接入充电的电动汽车与储能电池经双向直流(dc/dc)变换器(2)-(6)以电力线相连。例如，图4给出了一种双向直流变换器的示例图。双向直流变换器可以采用常规恒功率进行控
制。同时0.7kv直流母线经通讯线与充电站内部信息通信网络相连。储能电池可以用于维持充电侧直流母线电压。在无电动汽车接入充电的情况下，储能电池为预设决策网络模型输出的动作信息提供虚拟惯量储备，以使基于虚拟同步机的电动汽车充电站仍能为电网提供一定的惯性支撑。在有电动汽车接入充电时，储能电池也可以为充电侧直流母线提供电压支撑。
33.其中，当前频率偏差信息为当次获取的配电网频率信息与上次获取的配电网频率信息之间的偏差值。上次获取信息时刻与当次获取信息时刻之间的时间差为获取信息的时间间隔。当前电量信息可以是指电动汽车在当前时刻的电池电量信息。用户调频信息可以是指电动汽车在接入充电桩时用户设定的充电频率信息。当前电网调度信息可以是指电力系统中调度系统对整个充电站进行的输出频率调节信息。当前电网调度信息可用于对配电网中的发电端进行整体的发电频率限制。具体地，在电动汽车进行充电的过程中，可以实时获取配电网中的当前状态信息和配电网接收到的当前电网调度信息，以便基于获取的当前状态信息和当前电网调度信息，确定出当前时刻配电网对应的调频动作信息，即配电网中所有充电桩对应的当前充电桩动作信息和配电网中储能电池对应当前储能电池动作信息，并基于当前充电桩动作信息和当前储能电池动作信息，对各个充电桩和储能电池进行调频处理，从而基于当前充电桩动作信息和当前储能电池动作信息，实现对对配电网的调频动作，进而在满足电动汽车充电需要的同时，利用充电站内可调度容量，对配电网中电力系统频率偏差进行调整，进一步降低因用户调频需求，导致的电力系统频率变化率，有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。
34.s120、将当前状态信息和当前电网调度信息输入至预设决策网络模型中，预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的。
35.其中，强化学习可以由智能体(agent)、环境(environment)、状态(state)、动作(action)和奖励(reward)组成。本实施例中，充电桩或储能电池可以作为一个智能体。s110中的当前状态信息和当前电网调度信息可以作为状态。当前充电桩动作信息和当前储能电池动作信息可以作为动作或是动作集合。目标奖励函数可以用于预设决策网络模型采取某个动作信息后获得的奖励值。智能体执行了某个动作后，环境将会转换到一个新的状态，对于该新的状态环境会给出奖励信息(正奖励或者负奖励)，然后智能体根据新的状态和环境反馈的奖励信息，确定新的动作。智能体通过强化学习，可以知道自己在什么状态下，应该采取什么样的动作使得自身获得最大奖励。本实施例可以基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率构建目标奖励函数。
36.示例性地，预设决策网络模型的网络架构可以包括但不限于：深度确定性策略梯度算法(deep deterministic policy gradient,ddpg)、长短期记忆网络lstm(long short-term memory)、残差网络resnet、深度神经网络dnn(deep neural networks)、卷积神经网络cnn(convolutional neural network)或者全连接网络fc(fully connection)中的至少一种。
37.具体地，可以基于预设强化学习方式，比如基于策略的强化学习方式或者基于价值的强化学习方式，利用目标奖励函数对待训练的预设决策网络模型进行强化学习，最大化电动汽车充电过程中配电网中总发电量与总负荷量之前的综合奖励值，从而可以有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率。本实施例可以利用强化学习后获得的预设决策网络模型对充电站内每个充电桩和储能电池进行动作决策，从而实现对配电网的调频。
38.s130、基于预设决策网络模型的输出，获得配电网中充电桩对应的当前充电桩动作信息和配电网中储能电池对应当前储能电池动作信息，并基于当前充电桩动作信息和当前储能电池动作信息，对配电网进行调频。
39.其中，当前充电桩动作信息可以包括：当前时刻充电桩的最优频率和最优输出功率。当前储能电池动作信息可以包括：当前时刻储能电池需要模拟的最优频率和最优输出功率。具体地，基于预设决策网络模型的输出，获得配电网中充电桩对应的当前充电桩动作信息和配电网中储能电池对应当前储能电池动作信息。该当前充电桩动作信息和该当前储能电池动作信息是在满足电动汽车充电需求的前提下，用于通过调节频率来调节输出功率，从而有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，并通过调节后的最优输出功率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性和电动汽车用户的充电体验。
40.本发明实施例的技术方案，通过预先基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建获得目标奖励函数，并基于目标奖励函数进行强化学习获得预设决策网络模型。该预设决策网络模型可以针对不同的环境状态信息，如样本状态信息和样本电网调度信息决策出最优的动作信息，以便保证配电网中总发电量与总负荷量相平衡。在多个电动汽车充电的过程中，获取配电网中的当前状态信息和配电网接收到的当前电网调度信息，并将获取的当前状态信息和当前电网调度信息输入至预设决策网络模型中进行动作决策，从而基于预设决策网络模型的输出，可以获得决策出最优的当前动作信息，并基于当前动作信息对充电桩和储能电池进行动作，从而基于当前动作信息可以有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性和用户的充电体验。
41.在上述技术方案的基础上，s130中“基于当前充电桩动作信息和当前储能电池动作信息，对配电网进行调频”可以包括：基于当前充电桩动作信息，对配电网中充电桩的当前运行功率进行调整，获得充电桩的目标充电桩运行功率；基于当前储能电池动作信息，对配电网中储能电池的当前运行功率进行调整，获得储能电池的目标储能电池运行功率；基于目标充电桩运行功率和目标储能电池运行功率，确定配电网的目标发电功率。
42.其中，目标充电桩运行功率可以是指经过预设决策网络模型确定出的充电桩最优输出功率。目标储能电池运行功率可以是指经过预设决策网络模型确定出的储能电池最优输出功率。
43.具体地，基于当前充电桩动作信息，对配电网中充电桩的当前运行功率进行调整，获得充电桩的目标充电桩运行功率，并基于目标充电桩输出功率对充电桩进行调整。基于当前储能电池动作信息，对配电网中储能电池的当前运行功率进行调整，获得储能电池的
目标储能电池运行功率，并基于目标储能电池输出功率对储能电池进行调整。还可以基于目标充电桩运行功率和目标储能电池运行功率，确定配电网的目标发电功率。基于目标发电功率确定出配电网的目标输出功率，并基于目标输出功率对配电网进行调整。
44.示例性地，还可以基于当前充电桩动作信息，对配电网中充电桩的当前运行功率进行调整，获得充电桩的目标充电桩运行频率，其中，目标充电桩运行频率可以是指经过预设决策网络模型确定出的充电桩最优输出频率。基于预设的输出频率和输出功率之间的对应关系和目标充电桩运行频率，确定充电桩的目标充电桩输出功率。并基于目标充电桩输出功率对充电桩进行调整。基于当前储能电池动作信息，对配电网中储能电池的当前运行功率进行调整，获得储能电池的目标储能电池运行频率，其中，目标储能电池运行频率可以是指经过预设决策网络模型确定出的储能电池最优输出频率。基于预设的输出频率和输出功率之间的对应关系和目标储能电池运行频率，确定充电桩的目标储能电池输出功率。并基于目标储能电池输出功率对储能电池进行调整。还可以基于目标充电桩运行频率和目标储能电池运行频率，确定配电网的目标发电频率。基于目标发电频率确定出配电网的目标输出功率，并基于目标输出功率对配电网进行调整。
45.这样的好处在于，可以先确定出配电网中各个充电桩的调整动作信息和储能电池的调整动作信息，准确地针对每个充电桩和储能电池进行调整。还可以先确定出配电网中整个充电站的调整动作信息，再针对已使用的充电桩进行动作调整，最后使用储能电池对充电站与已使用充电桩之间的频率差值或是输出功率差值进行动作调整，从而可以保证每个已使用的充电桩实现最优的调整，并准确地输出功率。
46.在上述技术方案的基础上，预设决策网络模型的强化学习过程可以包括：将样本数据集中的样本状态信息和样本电网调度信息输入至待训练的预设决策网络模型中进行动作决策；基于待训练的预设决策网络模型输出的样本动作信息对配电网中调频机组进行调频处理，获得执行样本动作信息之后的样本状态信息和样本电网调度信息；其中，样本动作信息包括：充电桩对应的样本动作信息和储能电池对应的样本动作信息；调频机组包括：配电网中的充电桩和储能电池；基于目标奖励函数和执行样本动作信息之后的样本状态信息与样本电网调度信息，确定样本动作信息对应的目标奖励值；基于目标奖励值，调整待训练的预设决策网络模型中的网络参数，在满足预设收敛条件时训练结束的情况下，获得待使用的预设决策网络模型。
47.其中，样本数据集中可以包括：样本状态信息和样本电网调度信息。样本数据集可以是指在电动汽车实际充电场景中获取到的数据。预设收敛条件可以是指通过预设决策网络模型确定出最大的目标奖励值。最大的目标奖励值可以是但不限于目标奖励峰值。调频机组可以是指在充电站中通过调频操作来支撑充电站中的惯性和阻尼的可调频设备。调频机组可用于保证充电站中总发电量与总负荷量相平衡，从而电力系统的稳定性。
48.具体地，将从样本数据集中获取的样本状态信息和样本电网调度信息，输入至待训练的预设决策网络模型中进行动作决策；基于待训练的预设决策网络模型输出的样本动作信息对配电网中调频机组进行调频处理，获得执行样本动作信息之后的样本状态信息和样本电网调度信息。将执行样本动作信息之后的样本状态信息和样本电网调度信息代入至目标奖励函数中，确定出样本动作信息对应的目标奖励值；基于目标奖励值，调整待训练的预设决策网络模型中的网络参数，并将最大的目标奖励值对应的网络参数作为预设决策网
络模型的有效网络参数。这样的好处在于，可针对电动汽车充电的实际场景，进行针对性预设决策网络模型训练，进一步提升了模型的训练的准确性。
49.在上述技术方案的基础上，该方法还包括：在获取配电网中的当前状态信息和配电网接收到的当前电网调度信息之前，获取虚拟同步机对应的当前同步机状态信息、一次调压参数信息和当前电网频率偏差信息；其中，虚拟同步机为配电网中交直流变换器对应的模拟同步电机；当前同步机状态信息包括：虚拟同步机对应的当前同步机角速度和当前同步机运行功率；一次调压参数信息包括：一次调频系数和一次调频深度因子；对一次调频深度因子、一次调频系数和当前电网频率偏差信息进行相乘处理，获得相乘结果；基于当前同步机角速度，对当前同步机运行功率和相乘结果进行加权求和处理，获得虚拟同步机对应的当前机械转矩；基于当前机械转矩对配电网中交直流变换器进行调整。
50.其中，虚拟同步机的运行模式分为两种。一种运行模式是惯量支撑模式，即步骤s110-s130所组成的方案中的运行模式。该运行模式为仅对同步电机进行模拟。另一种是运行模式是在模拟同步电机的基础上对一次调频特性进行模拟，从而实现两次调频操作，进一步有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。例如，虚拟同步机对应的当前同步机角速度可以用ω表示。虚拟同步机对应的当前同步机运行功率可以用p
ref
表示。一次调频系数可以用kf表示。一次调频深度因子可以用δ表示。当前电网频率偏差信息可以用电网额定频率与当前电网运行频率之前的差值表示。电网额定频率可以用f0表示。当前电网运行频率可以用f表示。对一次调频深度因子、一次调频系数和当前电网频率偏差信息进行相乘处理，获得相乘结果。相乘结果可以用δkf(f
0-f)表示。基于当前同步机角速度，对当前同步机运行功率和相乘结果进行加权求和处理，获得虚拟同步机对应的当前机械转矩。当前机械转矩可以用tm表示。其中，当前机械转矩的表达式为从而在获取配电网中的当前状态信息和配电网接收到的当前电网调度信息之前，基于当前机械转矩对配电网中交直流变换器进行调整。双向交直流变换器相当于是整个充电站中输入功率的控制器。双向直流变换器相当于是整个充电站中输出功率的控制器。优先确定或调整好充电站的输入功率，再依据确定的输入功率，可以更加准确且快速地实现对充电站中各个充电桩的输出功率的调整，进一步有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。
51.在上述技术方案的基础上，一次调频深度因子的确定过程可以包括：获取电动汽车充电过程中的用户调频信息；若用户调频信息为空值，则一次调频深度因子为0；若用户调频信息为非空值，则基于充电汽车的电量信息、调频参与电量和标准电量，确定一次调频深度因子。
52.其中，以充电站中第i个电动汽车为例。用户调频信息可以用wi表示。一次调频深度因子可以用δi表示。在一个运行周期后更新调频深度因子。运行周期可以是指基于历史充电过程中的一次调频深度因子变化的有效时间区间，预先设置更新调频深度因子的时长。运行周期还可以以一秒为周期循环时长，实现对一次调频深度因子的实时动态更新。其中，可能会存在多个相邻运行周期对应的一次调频深度因子相同的情况。具体地，若用户调频信息为空值，即wi＝0，则将第i个电动汽车的一次调频深度因子确定为0。若用户调频信
息为非空值，则基于充电汽车的电量信息、调频参与电量、标准电量，确定一次调频深度因子。标准电量为第i个电动汽车接入充电桩时提交的电量需求目标。充电汽车的电量信息为第i个电动汽车的当前电量。调频参与电量为电动汽车充电站运行控制中心所设置的调频参与电量阈值。充电汽车的电量信息可以用soci表示。调频参与电量可以用soc
p
表示。标准电量可以用soc
i,goal
表示。在用户调频信息为非空值的前提下，若充电汽车的电量信息大于或等于调频参与电量，则第i个电动汽车的一次调频深度因子的表达式如下：
[0053][0054]
在用户调频信息为非空值的前提下，若充电汽车的电量信息小于调频参与电量，则第i个电动汽车的一次调频深度因子的表达式如下：
[0055][0056]
将充电站中的各个电动汽车的一次调频深度因子进行求和，并将求和结果的平均值确定为整个充电站的一次调频深度因子。假设充电站中电动汽车数量为n，则整个充电站的一次调频深度因子的表达式如下：
[0057][0058]
由此，通过用户调频信息、充电汽车的电量信息、调频参与电量以及标准电量，可以在每个运行周期后确定出相应的一次调频深度因子。还可以先基于用户调频信息，确定用户是否存在调频的意愿，并对一次调频深度因子进行初步确定。再基于充电汽车的电量信息、调频参与电量以及标准电量，对有调频意愿的电动汽车进行一次调频深度因子的确定，最终确定出准确的一次调频深度因子。并且可以基于每个电动汽车对应的一次调频深度因子，确定出整个充电站的一次调频深度因子，进而在获得虚拟同步机对应的当前机械转矩之前，确定出准确的一次调频深度因子，并保证了确定出的当前机械转矩的准确性，进一步有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。
[0059]
实施例二
[0060]
图5为本发明实施例二提供的另一种配电网调频方法的流程图，本实施例在上述实施例的基础上，对目标奖励函数的构建过程进行详细描述。其中与上述各实施例相同或相应的术语的解释在此不再赘述。如图5所示，该方法包括：
[0061]
s510、基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率构建目标奖励函数。
[0062]
其中，配电网中交直流变换器的第一变换器运行功率包括：第一时刻配电网中交直流变换器的第一变换器运行功率、第二时刻配电网中交直流变换器的第二变换器运行功率和第一时刻和第二时刻之间的时间差。第一时刻在第二时刻之前。第一变换器运行功率可以是执行动作之前的运行功率。第二变换器运行功率可以是执行动作之后的运行功率。配电网中储能电池的电池运行功率包括：第一时刻配电网中储能电池的第一电池运行功率
和第二时刻配电网中储能电池的第二电池运行功率。第一电池运行功率可以是执行动作之前的运行功率。第二电池运行功率可以是执行动作之后的运行功率。
[0063]
具体地，基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率构建目标奖励函数，从而可以基于构建出的目标奖励函数判断出最小化电网调度信息中二次调频调度指令误差、最大化充电站的售电收益以及最小化储能电池指令动作变化，进而有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。
[0064]
s520、基于样本状态信息、样本电网调度信息和目标奖励函数进行强化学习，获得预设决策网络模型。
[0065]
s530、获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息。
[0066]
s540、将当前状态信息和当前电网调度信息输入至预设决策网络模型中。
[0067]
s550、基于预设决策网络模型的输出，获得配电网中充电桩对应的当前充电桩动作信息和配电网中储能电池对应当前储能电池动作信息，并基于当前充电桩动作信息和当前储能电池动作信息，对配电网进行调频。
[0068]
本发明实施例的技术方案，通过基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率构建目标奖励函数，可以基于构建出的目标奖励函数判断出最小化电网调度信息中二次调频调度指令误差、最大化充电站的售电收益以及最小化储能电池指令动作变化，进而有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性。
[0069]
在上述技术方案的基础上，s510可以包括：基于第一变换器运行功率、第二变换器运行功率、电网调度信息、实际运行功率和时间差，构建第一奖励函数；基于实际运行功率和时间差，构建第二奖励函数；基于第一电池运行功率和第二电池运行功率，构建第三奖励函数；对第一奖励函数、第二奖励函数和第三奖励函数，构建目标奖励函数。
[0070]
其中，第一奖励函数可以用于表征电网调度信息中二次调频调度指令误差。第二奖励函数可以用于表征充电站的售电收益。第三奖励函数可以用于表征储能电池指令动作变化。基于第一奖励函数、第二奖励函数和第三奖励函数，可以确定出目标奖励函数。例如，目标奖励函数的表达式如下：
[0071][0072]
其中，α、β分别为奖励计算的权重因子，c为电动汽车参与调频的收入计算权重因子，ξ为电网调度信息中二次调频调度指令标记，存在二次调频调度指令时，其值为1，否则为0，p
s,t
和p
s,t-1
为双向交直流变换器(1)分别在t和t-1时刻的运行功率，p
bess,t
和p
bess,t-1
为储能电池分别在t和t-1时刻的运行功率，δt为时间差，pc为电网调度信息中二次调频调度指令，pi为第i个充电桩的实际运行功率。第一奖励函数的表达式如下：
[0073][0074]
第二奖励函数的表达式如下：
[0075][0076]
第三奖励函数的表达式如下：
[0077]
β(p
bess,t-p
bess,t-1
)2[0078]
示例性地，控制中心的在经过一个时间间隔δt后的t时刻信息输入为[δf,pc,ev1,
…
,ev4,soc
bess
,p
bess
]。其中，δf为当前频率偏差信息，pc为当前电网调度信息二次调度指令值，电动汽车充电桩1获取信息为ev1＝[soc1,w1]，soc1、w1分别为接入电动汽车1的当前电量信息、调频信息，同理有evi＝[soci,wi](i＝1,2,3,4)，soc
bess
为储能电池的电量信息，p
bess
为t时刻储能电池的运行指令功率值。控制中心基于t时刻的信息输入，根据深度确定性策略梯度算法中设计的目标奖励函数计算t时刻的环境奖励值r
t
。控制中心t+1时刻的信息输出为[δp
ev1
,
…
,δp
ev4
,δp
bess
]，其中δp
ev1
，
…
δp
ev4
分别为接入电动汽车充电桩1至4的运行指令功率变化值，δp
bess
为t+1时刻储能电池的运行指令功率变化值。在获得环境奖励r
t
后，对充电站t时刻达到目标奖励值对应的配电网中的当前状态信息和配电网接收到的当前电网调度信息记为s
t
、控制中心输出的动作指令信息记为a
t
以及环境奖励函数记为r
t
，并以[s
t
,a
t
,r
t
]的方式进行存储。结合实际运营情况，电动汽车充电站参与辅助调频控制方法对其运行状态进行选择选择，若运行状态设置为学习训练状态时，则对模型进行训练，以实现对模型的优化；若运行状态设置为使用运行状态时，则使用模型输出的数据对充电站中的充电桩和储能电池的运行状态进行调整。以实际使用为例，将t时刻电动汽车充电站内外部信息，即配电网中的当前状态信息和配电网接收到的当前电网调度信息，输入至预设决策网络模型，得到各部分动作指令a
t
并且通过充电站内部信息通信网络将各部分动作指令分配至各充电站及储能电池并执行。
[0079]
需要说明的是，各充电桩的运行指令功率由基本运行功率和功率变化指令组成。基本运行功率由其运行模式决定。功率变化指令由充电站运行控制中心下达。储能电池的功率指令由充电站运行控制中心下达。双向交直流变换器中虚拟同步机控制模块为直流侧电容提供能量，以保持恒定电压，并且接收来自电动汽车充电站运行控制中心发出的一次调频深度因子，同时对电动汽车充电站并网点的电网频率进行监测，虚拟同步机控制模块以并网点电网频率为依据，自主地参与电网频率的辅助调频，参见图3，双向交直流变换器结构不是本方案介绍的重点，故不对双向交直流变换器内部结构进行介绍。双向直流变换器在恒定的直流电压下为电动汽车动力电池进行充电，参见图4，双向直流变换器结构不是本方案介绍的重点，故不对双向直流变换器内部结构进行介绍。进而，基于虚拟同步机的电动汽车充电站能够根据并网点频率变化自主地参与电网一次调频，并且合理地为站内充电桩分配上级调度部门下达的调度指令即当前电网调度信息，达到对电网系统频率偏差进行响应，降低系统频率的变化率，改善频率稳定性的功能。
[0080]
以下是本发明实施例提供的配电网调频装置的实施例，该装置与上述各实施例的配电网调频方法属于同一个发明构思，在配电网调频装置的实施例中未详尽描述的细节内
容，可以参考上述配电网调频方法的实施例。
[0081]
实施例三
[0082]
图6为本发明实施例三提供的一种配电网调频装置的结构示意图。如图6所示，该装置包括：信息获取模块610、信息输入模块620和动作信息确定模块630。
[0083]
其中，信息获取模块610，用于获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息；信息输入模块620，用于将当前状态信息和当前电网调度信息输入至预设决策网络模型中，预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的；动作信息确定模块630，用于基于预设决策网络模型的输出，获得配电网中充电桩对应的当前充电桩动作信息和配电网中储能电池对应当前储能电池动作信息，并基于当前充电桩动作信息和当前储能电池动作信息，对配电网进行调频。
[0084]
本发明实施例的技术方案，通过预先基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建获得目标奖励函数，并基于目标奖励函数进行强化学习获得预设决策网络模型。该预设决策网络模型可以针对不同的环境状态信息，如样本状态信息和样本电网调度信息决策出最优的动作信息，以便保证配电网中总发电量与总负荷量相平衡。在多个电动汽车充电的过程中，获取配电网中的当前状态信息和配电网接收到的当前电网调度信息，并将获取的当前状态信息和当前电网调度信息输入至预设决策网络模型中进行动作决策，从而基于预设决策网络模型的输出，可以获得决策出最优的当前动作信息，并基于当前动作信息对充电桩和储能电池进行动作，从而基于当前动作信息可以有效的平衡配电网中充电桩所需的电网频率和配电网中电力系统的输出频率，保证配电网中总发电量与总负荷量相平衡，提升配电网稳定性和用户的充电体验。
[0085]
可选地，动作信息确定模块630具体用于：基于当前充电桩动作信息，对配电网中充电桩的当前运行功率进行调整，获得充电桩的目标充电桩运行功率；基于当前储能电池动作信息，对配电网中储能电池的当前运行功率进行调整，获得储能电池的目标储能电池运行功率；基于目标充电桩运行功率和目标储能电池运行功率，确定配电网的目标发电功率。
[0086]
可选地，配电网中交直流变换器的第一变换器运行功率包括：第一时刻配电网中交直流变换器的第一变换器运行功率、第二时刻配电网中交直流变换器的第二变换器运行功率和第一时刻和第二时刻之间的时间差；配电网中储能电池的电池运行功率包括：第一时刻配电网中储能电池的第一电池运行功率和第二时刻配电网中储能电池的第二电池运行功率。
[0087]
可选地，该装置还包括：
[0088]
目标奖励函数构建模块，用于基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率构建目标奖励函数。
[0089]
可选地，目标奖励函数构建模块具体用于：基于第一变换器运行功率、第二变换器
运行功率、电网调度信息、实际运行功率和时间差，构建第一奖励函数；基于实际运行功率和时间差，构建第二奖励函数；基于第一电池运行功率和第二电池运行功率，构建第三奖励函数；对第一奖励函数、第二奖励函数和第三奖励函数，构建目标奖励函数。
[0090]
可选地，该装置还包括：
[0091]
动作决策模块，用于将样本数据集中的样本状态信息和样本电网调度信息输入至待训练的预设决策网络模型中进行动作决策；
[0092]
样本信息确定模块，用于基于待训练的预设决策网络模型输出的样本动作信息对配电网中调频机组进行调频处理，获得执行样本动作信息之后的样本状态信息和样本电网调度信息；其中，样本动作信息包括：充电桩对应的样本动作信息和储能电池对应的样本动作信息；调频机组包括：配电网中的充电桩和储能电池；
[0093]
目标奖励值确定模块，用于基于目标奖励函数和执行样本动作信息之后的样本状态信息与样本电网调度信息，确定样本动作信息对应的目标奖励值；
[0094]
预设决策网络模型确定模块，用于基于目标奖励值，调整待训练的预设决策网络模型中的网络参数，在满足预设收敛条件时训练结束的情况下，获得待使用的预设决策网络模型。
[0095]
可选地，该装置还包括：
[0096]
调频信息获取模块，用于在获取配电网中的当前状态信息和配电网接收到的当前电网调度信息之前，获取虚拟同步机对应的当前同步机状态信息、一次调压参数信息和当前电网频率偏差信息；其中，虚拟同步机为配电网中交直流变换器对应的模拟同步电机；当前同步机状态信息包括：虚拟同步机对应的当前同步机角速度和当前同步机运行功率；一次调压参数信息包括：一次调频系数和一次调频深度因子；
[0097]
第一运算模块，用于对一次调频深度因子、一次调频系数和当前电网频率偏差信息进行相乘处理，获得相乘结果；
[0098]
第二运算模块，用于基于当前同步机角速度，对当前同步机运行功率和相乘结果进行加权求和处理，获得虚拟同步机对应的当前机械转矩；
[0099]
转矩调整模块，用于基于当前机械转矩对配电网中交直流变换器进行调整。
[0100]
可选地，该装置还包括：
[0101]
用户调频信息获取模块，用于获取电动汽车充电过程中的用户调频信息；
[0102]
第一深度因子确定模块，用于若用户调频信息为空值，则一次调频深度因子为0；
[0103]
第二深度因子确定模块，用于若用户调频信息为非空值，则基于充电汽车的电量信息、调频参与电量和标准电量，确定一次调频深度因子。
[0104]
本发明实施例所提供的配电网调频装置可执行本发明任意实施例所提供的配电网调频方法，具备执行配电网调频方法相应的功能模块和有益效果。
[0105]
值得注意的是，上述配电网调频装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。
[0106]
实施例四
[0107]
图7示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助
理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0108]
如图7所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(rom)12、随机访问存储器(ram)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序，来执行各种适当的动作和处理。在ram 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0109]
电子设备10中的多个部件连接至i/o接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0110]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如配电网调频方法。
[0111]
在一些实施例中，配电网调频方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时，可以执行上文描述的配电网调频方法的一个或多个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行配电网调频方法。
[0112]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0113]
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0114]
在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存
储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0115]
为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0116]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)、区块链网络和互联网。
[0117]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务中，存在的管理难度大，业务扩展性弱的缺陷。
[0118]
应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。
[0119]
上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

技术特征：
1.一种配电网调频方法，其特征在于，包括：获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，所述当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息；将所述当前状态信息和所述当前电网调度信息输入至预设决策网络模型中，所述预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，所述目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的；基于所述预设决策网络模型的输出，获得所述配电网中充电桩对应的当前充电桩动作信息和所述配电网中储能电池对应当前储能电池动作信息，并基于所述当前充电桩动作信息和所述当前储能电池动作信息，对所述配电网进行调频。2.根据权利要求1所述的方法，其特征在于，所述基于所述当前充电桩动作信息和所述当前储能电池动作信息，对所述配电网进行调频，包括：基于所述当前充电桩动作信息，对所述配电网中充电桩的当前运行功率进行调整，获得充电桩的目标充电桩运行功率；基于所述当前储能电池动作信息，对所述配电网中储能电池的当前运行功率进行调整，获得储能电池的目标储能电池运行功率；基于所述目标充电桩运行功率和目标储能电池运行功率，确定所述配电网的目标发电功率。3.根据权利要求1所述的方法，其特征在于，所述配电网中交直流变换器的第一变换器运行功率包括：第一时刻配电网中交直流变换器的第一变换器运行功率、第二时刻配电网中交直流变换器的第二变换器运行功率和第一时刻和第二时刻之间的时间差；所述配电网中储能电池的电池运行功率包括：第一时刻配电网中储能电池的第一电池运行功率和第二时刻配电网中储能电池的第二电池运行功率。4.根据权利要求1所述的方法，其特征在于，基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率构建目标奖励函数，包括：基于第一变换器运行功率、第二变换器运行功率、电网调度信息、实际运行功率和时间差，构建第一奖励函数；基于所述实际运行功率和所述时间差，构建第二奖励函数；基于第一电池运行功率和第二电池运行功率，构建第三奖励函数；对所述第一奖励函数、所述第二奖励函数和所述第三奖励函数，构建目标奖励函数。5.根据权利要求1所述的方法，其特征在于，预设决策网络模型的强化学习过程，包括：将样本数据集中的样本状态信息和样本电网调度信息输入至待训练的预设决策网络模型中进行动作决策；基于待训练的预设决策网络模型输出的样本动作信息对配电网中调频机组进行调频处理，获得执行样本动作信息之后的样本状态信息和样本电网调度信息；其中，所述样本动作信息包括：充电桩对应的样本动作信息和储能电池对应的样本动作信息；所述调频机组包括：配电网中的充电桩和储能电池；
基于目标奖励函数和所述执行样本动作信息之后的样本状态信息与样本电网调度信息，确定所述样本动作信息对应的目标奖励值；基于所述目标奖励值，调整待训练的预设决策网络模型中的网络参数，在满足预设收敛条件时训练结束的情况下，获得待使用的预设决策网络模型。6.根据权利要求1所述的方法，其特征在于，在获取配电网中的当前状态信息和配电网接收到的当前电网调度信息之前，所述方法还包括：获取虚拟同步机对应的当前同步机状态信息、一次调压参数信息和当前电网频率偏差信息；其中，所述虚拟同步机为配电网中交直流变换器对应的模拟同步电机；所述当前同步机状态信息包括：虚拟同步机对应的当前同步机角速度和当前同步机运行功率；所述一次调压参数信息包括：一次调频系数和一次调频深度因子；对所述一次调频深度因子、所述一次调频系数和所述当前电网频率偏差信息进行相乘处理，获得相乘结果；基于当前同步机角速度，对所述当前同步机运行功率和所述相乘结果进行加权求和处理，获得虚拟同步机对应的当前机械转矩；基于所述当前机械转矩对配电网中交直流变换器进行调整。7.根据权利要求6所述的方法，其特征在于，所述一次调频深度因子的确定过程包括：获取电动汽车充电过程中的用户调频信息；若所述用户调频信息为空值，则一次调频深度因子为0；若所述用户调频信息为非空值，则基于充电汽车的电量信息、调频参与电量和标准电量，确定一次调频深度因子。8.一种配电网调频装置，其特征在于，包括：信息获取模块，用于获取配电网中的当前状态信息和配电网接收到的当前电网调度信息；其中，所述当前状态信息包括：配电网中的当前频率偏差信息、配电网中充电汽车的当前电量信息和用户调频信息；信息输入模块，用于将所述当前状态信息和所述当前电网调度信息输入至预设决策网络模型中，所述预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，所述目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的；动作信息确定模块，用于基于所述预设决策网络模型的输出，获得所述配电网中充电桩对应的当前充电桩动作信息和所述配电网中储能电池对应当前储能电池动作信息，并基于所述当前充电桩动作信息和所述当前储能电池动作信息，对所述配电网进行调频。9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的配电网调频方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的配电网调频方法。

技术总结
本发明公开了一种配电网调频方法、装置、设备和存储介质。该方法包括：获取配电网中的当前状态信息和接收到的当前电网调度信息；将当前状态信息和当前电网调度信息输入至预设决策网络模型中，预设决策网络模型是预先基于目标奖励函数进行强化学习获得的，目标奖励函数是基于配电网中交直流变换器的变换器运行功率、配电网中储能电池的电池运行功率、电网调度信息和配电网中充电桩的实际运行功率进行构建的；基于预设决策网络模型的输出，获得配电网中充电桩对应的当前充电桩动作信息和配电网中储能电池对应当前储能电池动作信息，并基于当前充电桩动作信息和当前储能电池动作信息，对配电网进行调频，从而保证配电网中总发电量与总负荷量相平衡。总发电量与总负荷量相平衡。总发电量与总负荷量相平衡。

技术研发人员：王伟杰徐远途薛博文梁健辉华耀黄荣杰董富德朱德强张培培盘倩钟芬芳盘荣波郭景宇杨浩李炳坤赵文陈伯滔
受保护的技术使用者：广东电网有限责任公司清远供电局
技术研发日：2023.05.09
技术公布日：2023/7/21

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种测量等离子体4.6GHz低杂波局域频谱的系统 下一篇：一种基于自适应补偿结构的大跨度桥架结构的制作方法

一种配电网调频方法、装置、设备和存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种配电网调频方法、装置、设备和存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表