国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210622508.X (22)申请日 2022.07.22 (71)申请人 浙江领见数智科技有限公司 地址 310000 浙江省杭州市拱 墅区杭州新 天地商务中心1 1幢南楼702室 申请人 杭州领见数字农业科技有限公司 (72)发明人 周祖煜 张浩 陈煜人 张澎彬 林波 白博文 莫志敏 李天齐 刘俊 (74)专利代理 机构 杭州快知 知识产权代理事务 所(特殊普通 合伙) 33293 专利代理师 杨冬玲 (51)Int.Cl. G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 一种基于电量数据污染源排放监测方法及 系统 (57)摘要 本发明提供一种基于电量数据污染源排放 监测方法及系统, 包括: 进行数据获取, 获取训练 组数据和测试组数据; 对获取的数据进行数据处 理, 进行数据合并后编码处理, 处理后的数据进 行切分, 有标签值作为训练集, 无标签值作为测 试集; 数据建模, 将处理后的数据进行调参, 调至 最优参数后得到模型评分, 选用lgbm算法作为最 终模型; 模型验证, 使用混淆矩阵对最终模型的 好坏的程度进行验证; 数据预测, 使用训练好的 lgbm算法进行预测, 识别污染源超限排放的用 户。 本发明解决了现有电力污染源超限排放难以 准确监测的缺陷, 实现低成本、 高效率的电力污 染源超限排放的监测。 权利要求书2页 说明书7页 附图3页 CN 114970731 A 2022.08.30 CN 114970731 A 1.一种基于电量数据污染源排 放监测方法, 其特 征在于, 包括: 进行数据获取, 获取训练 组数据和 测试组数据; 对获取的数据进行数据处理, 进行数据合并后编码处理, 处理后的数据进行切分, 有标 签值作为训练集, 无 标签值作为测试集; 数据建模, 将处理后的数据进行调参, 调至最优参数后得到模型评分, 选用lgbm算法作 为最终模型; 模型验证, 使用混淆矩阵对最终模型的好坏的程度进行验证; 数据预测, 使用训练好的lgbm算法进行 预测, 识别污染源 超限排放的用户。 2.根据权利要求1所述的基于电量数据污染源排放监测方法, 其特征在于, 所述进行数 据获取, 获取训练 组数据和 测试组数据, 具体包括: 所述训练组数据为: 第一用户基本信息表、 第一用户日用电量明细表和第一行业户均 月用电表; 所述测试组数据为: 第二用户基本信息表、 第二用户日用电量明细表和第二行业户均 月用电表; 所述训练组数据和测试组数据中均包括: 用户用电量、 行业编码、 行业平均月度用电 量、 用户所在区县 。 3.根据权利要求1所述的基于电量数据污染源排放监测方法, 其特征在于, 对获取的数 据进行数据处理, 具体过程 为: 根据用户ID列将训练组数据和测试组数据进行合并, 生成第三用户基本信息表、 第三 用户日用电量明细表和第三行业户均月用电表; 对每张表进行缺失值 查看, 对存在缺失值部分进行 数据补齐; 将第三用户日用电量明细表进行分组统计, 根据用户ID列进行求和, 得到月度用电量 总和, 剔除峰谷平电量; 将第三行业户均月用电量进行分组统计, 根据用户所在区域与行业编码进行分组统 计, 分别求出 行业平均月用电量平均值、 中位数、 偏度及总和; 通过用户ID合并第三用户基本信 息表和第三用户日用电量明细表, 得到用户月度用电 明细表; 通过行业编码与用户所在区域 合并用户月度用电明细表与行业表, 得到最终结果表; 对合并后的最终结果表中的文本字段进行编码处理, 使用类别变量编码库进行编码, 并将用户ID列 与用户所在区县列剔除, 数据处 理后进行切分。 4.根据权利要求1所述的基于电量数据污染源排放监测方法, 其特征在于, 所述数据建 模的具体过程 为: 根据处理后的数据进行建模, 对于训练集数据集按7:3的比例进行切分, 70%作为训 练, 30%作为测试。 ; 分别使用lgbm算法与随机森林算法进行拟合, 对算法使用网格搜索、 学习曲线方法进 行调参, 调至最优参数后得到模型评分; 对lgbm算法和随机森林算法评分进行对比, 最终选用lgbm算法为 最终模型。 5.根据权利要求1所述的基于电量数据污染源排放监测方法, 其特征在于, 所述模型验 证具体过程 为:权 利 要 求 书 1/2 页 2 CN 114970731 A 2使用混淆矩阵来验证模型的好坏程度, 混淆矩阵也称误差矩阵, 通过n行n列的矩阵形 式进行表示; 准确率=分类正确的样本数量占总样本数量的百分比。 6.根据权利要求1所述的基于电量数据污染源排放监测方法, 其特征在于, 所述数据 预 测具体过程 为: 使用训练好的lgbm算法模型进行预测, 得到多个超限用户, 计算测试集数准确率, 确定 能够正确识别污染源 超限排放用户的概 率。 7.一种基于电量数据污染源排 放监测系统, 其特 征在于, 所述系统包括: 数据获取模块, 用于进行 数据获取, 获取训练 组数据和 测试组数据; 数据处理模块, 用于对获取的数据进行数据处理, 进行数据合并后编码处理, 处理后的 数据进行切分, 有标签值作为训练集, 无 标签值作为测试集; 数据建模模块, 用于将处理后的数据进行调参, 调至最优参数后得到模型评分, 选用 lgbm算法作为 最终模型; 模型验证模块, 用于使用混淆矩阵对最终模型的好坏的程度进行验证; 数据预测模块, 用于使用训练好的lgbm算法进行 预测, 识别污染源 超限排放的用户。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述基于电量数据污染源排 放监测方法。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处 理器执行时实现如权利要求1至 6任一项所述基于电量数据污染源排 放监测方法。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述基于电量数据污染源排 放监测方法。权 利 要 求 书 2/2 页 3 CN 114970731 A 3
专利 一种基于电量数据污染源排放监测方法及系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 16:56:04
上传分享
举报
下载
原文档
(460.4 KB)
分享
友情链接
DB6501-T 053-2023 智慧水务信息应用系统 乌鲁木齐市.pdf
GB-T 25977-2022 除雪车.pdf
GB-T 38224.1-2019 重金属废水处理与回用技术评价 第1部分:程序和方法.pdf
GB-T 3462-2017 钼条和钼板坯.pdf
GB 17411-2015 船用燃料油.pdf
GB-T 37076-2018 信息安全技术 指纹识别系统技术要求.pdf
T-SCGS 313002—2023 医用内窥镜 内窥镜荧光摄像系统影像质量评价规范.pdf
GB/T 39975-2021 氮化铝陶瓷散热基片.pdf
GB-T 26607-2011 工业用邻苯基苯酚.pdf
GB-T 34690.2-2017 印刷技术 胶印数字化过程控制 第2部分:作业环境.pdf
T-GZBC 36—2020 广东省健康医疗数据脱敏技术规范.pdf
GB-T 22264.4-2022 安装式数字显示电测量仪表 第4部分:频率表的特殊要求.pdf
渗透测试战技101.pdf
GB-T 34946-2017 C#语言源代码漏洞测试规范.pdf
GB-T 35273-2020 信息安全技术 个人信息安全规范.pdf
GB-T 37416-2019 洁净机器人通用技术条件.pdf
GB 31338-2014 工业硅单位产品能源消耗限额.pdf
GB-T 42729-2023 锂离子电池和电池组安全使用指南.pdf
GB-T 18386.1-2021 电动汽车能量消耗量和续驶里程试验方法 第1部分:轻型汽车.pdf
T-GDCKCJH 068—2022 离子风机静电消除器性能要求与检测方法.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(460.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。