国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210871781.6 (22)申请日 2022.07.22 (71)申请人 浙江工业大 学 地址 310014 浙江省杭州市拱 墅区潮王路 18号 (72)发明人 张有兵 熊美淞 费琦 杨晓东  王国烽 翁国庆 王立成 戚军  (74)专利代理 机构 杭州天正专利事务所有限公 司 33201 专利代理师 楼明阳 (51)Int.Cl. H02J 3/16(2006.01) H02J 3/38(2006.01) H02J 3/06(2006.01) G06F 30/27(2020.01)G06Q 10/06(2012.01) G06Q 50/06(2012.01) G06F 113/04(2020.01) G06F 119/02(2020.01) (54)发明名称 一种基于深度强化学习算法的实时 电压调 控方法 (57)摘要 一种基于深度强化学习算法的实时 电压调 控方法, 包括: S1: 在日前阶段, 建立集中优化模 型, 求解确定有载调压变压器和离散投切电容器 组的控制策略; S2: 在日中阶段, 基于多智能体深 度强化学习框架建立多智能体的实时优化深度 神经网络, 进行离线学习优化, 最终获得SOP实时 调控策略。 本发明在第一阶段, 将优化问题表述 为一个混合整数二阶锥规划, 获得有载分接开关 和可投切电容器组的每小时调度策略; 在第二阶 段, 将配电网划分为多个子网络, 继而通过良好 的控制策略和子网的局部测量信息, 实时调节柔 性软开关, 完成电压的实时调控。 本发明面向高 渗透率光伏接入的配电网, 有效缓解负荷波动带 来的电压 违规、 网损增 加等问题。 权利要求书5页 说明书12页 附图5页 CN 115313403 A 2022.11.08 CN 115313403 A 1.一种基于深度强化学习算法的实时电压调控方法, 其特 征在于, 包括以下步骤: S1: 在日前阶段, 建立集中优化模型, 求解确定有载调压变压器(on ‑load tap  changers, OLTC)和离 散投切电容器组(capacitor  banks, CBs)的控制策略; S2: 在日中阶段, 基于多智能体深度强化学习(multi  agent deep reinforcement   learning, MA ‑DRL)框架建立多智能体 的实时优化深度神经网络(deep  neural network, DNN), 进行离线学习优化, 最终 获得SOP实时调控策略。 2.如权利要求1所述的基于深度强化学习算法的实时电压调控方法, 其特征在于, 所述 步骤S1中, 日前集中优化模型建立和求 解过程为: min f=WL(floss+fswitch)+WVfV     (1) 式(1)中各项的权重系数WL和WV可以通过使用层次分析处理来确定; 系统总运行成本包 括两部分, 即电力损耗成本floss和开关调控 成本fswitch; 有功功率损耗的总成本涉及网络损 耗和SOP输电造成的功率损耗, 其中Closs、 Ctap、 Ccap分别是相关有功功率损耗、 OLTC和CBs 的 成本系数; Ωb和ΩO分别是不含OLTC的支路合集和 包含OLTC的支路合集; NT是时间段合集, NN是系统所有节点的合集; Δt是每个时段的持续时间, rij是支路ij上的电阻值, It,ij是t时 期支路ij上通过的电流; 开关运行的总成本由OLTC的调整成本和CBs的切换成本组成; Kt,ij 是t时期支路ij上的OLTC档位; 是t时期在i节点上的档位数; Xt,i是引入的辅助变量, 用 以表示电压的偏移程度, 其具有以下相关约束: Xt,i≥0    (7) Ut,i是t时期节点i的电压幅值; UEmax和UEmin分别是节点电压安全运行范围的上限和下 限; 另外, 需要满足SOP运行约束如下: 权 利 要 求 书 1/5 页 2 CN 115313403 A 2式(8)‑(10)是SOP的有功功率约束, 和 分别是t时段节点i和节点j的变流器输 出的有功功率; 和 分别是t时段SOP在节点i和节点j的变流器的有功损耗; 和 分别是SOP在节点 i和节点j的变流器的损耗系数; 式(11)‑(12)是SOP的无功功率约束, 和 分别是t时段节点i和节点j的变流器输 出的无功功率; 和 分别是节点i的变流器所能输出的最大无功功率和最小无功功 率; 和 分别是节点j的变流器所能输出的最大 无功功率和最小无功 功率; 需要满足OLTC和CBs约束如下: Ut,i=kt,ijUt,j      (13) kt,ij=kij,0+Kt,ijΔkij             (14) 式(13)‑(16)表示OLTC调节电压与档位的关系和运行约束, Ut,i是t时期节点i上的电 压, kt,ij和Kt,ij是t时期内OLTC的可调比和档位, kij,0和Δkij分别是OLTC的初始可调比和档 位增量; NT是周期之和, NOLTC是一天内投切次数 上限, 是档位变化的最大值; 式(17)‑(19)表示CBs注入无功功率与档位 的关系和运行约束, 表示节点i处CBs的 单位无功功 率容量, 是t时期内节点i上CBs的注入无功功 率, 是t时期内节点i上CBs 的投切数量, 是投切数量的最大值; 除了需要满足SOP、 OLTC、 CBs相关运行约束外, 还需要满足以下约束条件: 权 利 要 求 书 2/5 页 3 CN 115313403 A 3

.PDF文档 专利 一种基于深度强化学习算法的实时电压调控方法

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度强化学习算法的实时电压调控方法 第 1 页 专利 一种基于深度强化学习算法的实时电压调控方法 第 2 页 专利 一种基于深度强化学习算法的实时电压调控方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:55:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。