国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210829543.9 (22)申请日 2022.07.15 (71)申请人 国家电投集团江西电力工程有限公 司 地址 330096 江西省南昌市南昌 高新技术 产业开发区艾溪湖北路6 6号四楼东 面 (72)发明人 黄必成 张敏 童浪兴 刘勇  吴绍华 杨荣坪 钱大庆 左宇  陈经玮 方涛 王天龙 吴逸鸣  林康玮 黄雪斌 熊磊 吴涛  罗孝峰  (74)专利代理 机构 鹰潭市智埠专利代理事务所 (普通合伙) 36131 专利代理师 周少华(51)Int.Cl. G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 一种基于集成聚类的支柱性产业的判定方 法 (57)摘要 一种基于集成聚类的支柱性产业的判定方 法, 包括: 构建多源电力指标, 明确各指标类型, 对于多源电力指标中的极小型以及区间型指标 进行转换, 对各指标数据进行数据预处理, 对各 指标数据进行降维, 将不同的聚类算法作为个体 学习器分别得到聚类结果, 通过学习法的结合策 略将各个体学习器的输出结果通过聚类算法结 合; 采用DBSCAN密度聚类作为次级学习器以结合 各个体学习器的输出; 进行支柱性产业类簇判 定。 本发明构建多源电力指示, 并根据指标特性, 大致将其分为经济贡献度、 能源消耗、 能源消费 结构、 节能环保四个层面, 对指标进行解析, 通过 熵权法给多源电力指标赋予权重, 结合各聚类簇 产业的多源电力指标数据, 判定出支柱性产业 簇。 权利要求书3页 说明书10页 附图5页 CN 115545090 A 2022.12.30 CN 115545090 A 1.一种基于集成聚类的支 柱性产业的判定方法, 其特 征在于: 包括如下步骤: 步骤一、 构建多源电力指标: 将经济贡献度、 能源消耗、 能源消费结构、 节能环保四个方面指标构建为多源电力指 标; 其中, 所述经济贡献度指标, 包括: 产业总产值S1、 总产值同比增长S2、 利 润总额S3; 所述能源消耗指标, 包括: 用电量S4、 油品消耗 量S5、 燃气消耗 量S6、 万元产值能耗S7; 所述能源消费结构, 包括: 电力占能源比重S8、 煤炭占能源比重S9、 油品占能源比重 S10、 燃气占能源比重S1 1; 所述节能环保指标, 包括: 煤炭消耗 量S12; 步骤二、 明确各指标类型: 产业总产值S1、 总产 值同比增长S2、 利润总额S3、 燃气消耗量S6、 燃气占能源比重S11属 于极大型指标; 油品消耗量S5、 万元产 值能耗S7、 煤炭占能源比重S9、 油品占能源比重S10、 煤炭消耗量 S12属于极小型指标; 用电量S4、 电力占能源比重S 8属于区间型指标; 步骤三、 对于多源电力指标中的极小型以及区间型指标进行转换: 对于极小型指标, 转换为: 对于区间型指标, 转换为: 式(1)(2)中: x代表原始指标数据; 代表转换后的指标数据; [q1, q2]为区间型指标数 据的最佳 稳定区间; M、 m代 表分别为x允许的上 下界; 步骤四、 对各指标 数据进行 数据预处 理: 采用极差标准 化如式(3)所示: 其中, xij代表第i个指标的第j个 数据, xij’代表经过数据预处理后的第i个指标的第j个 数据; 标准化后的新数据, 变量的极大值 为1, 极小值 为0, 其余的数值均在0与1之间; 步骤五、 对各指标 数据进行降维: 使用主成分分析法PCA对数据进行降维, 其降维的核心是正交分解, 通过相互正交的空 间基向量来表示原始数据; 将数量较少的几个重要的的主成分向量作为向量基, 然后用重 构的方法来实现原 始特征的维度降低;权 利 要 求 书 1/3 页 2 CN 115545090 A 2步骤六、 将不同的聚类算法作为个体学习器分别得到聚类结果, 通过学习法的结合策 略将各个体学习器的输出结果通过聚类算法结合; 采用DBSCA N密度聚类作为次级 学习器以 结合各个 体学习器的输出; 步骤七: 进行支 柱性产业类簇判定: 首先求出各多源电力指标 下, 各类簇各样本占整体样本的平均比重: 式中: xijk代表第k类簇的样本, i代表第i个产业样本, j代表第j维多源电力指标; nk为第 k类产业簇的样本数量; n代表所有产业样本的个数; Mjk表示在第j 维多源电力指标上k类簇 中各样本占整体样本的平均比重 。 由于一共有12个多源电力指标, 得到k类簇样本占比矩阵 则M= [M1,M2,...,M12]作为在各维特征属性上各类簇各样本占整体样本的平均比重矩阵, 为k*12 的矩阵。 然后结合特 征权重给给类簇评分: P=M·ω (10) 式中: ω=[ω1,ω2,···,ω12]′是各多源电力指标的权重, 为12*1矩阵; P为各类簇 产业得分, 为 k*1矩阵。 2.如权利要求1所述的一种基于集成聚类的支柱性产业的判定方法, 其特征在于: 所述 步骤五中, PCA降维是指: 找到一个n 维的向量, 然后获取另一个低维的向量空间, 再把想n维 向量映射到获取到的低维向量空间; 关于nD—>kD降维表 示新的向量空间由这k个向量来定 义, 再将样本映射到这个向量空间来; 在具体的操作中, 首先通过奇异值分解方法计算样本数据的协方差矩阵特征值与 特征 向量; 在协方差矩阵中, 所有 特征向量用U表 示, 特征向量用列来表 示, 而且特征值 从大到小 进行降序, U的维度为n*n。 U又叫做降维矩阵, 默认的所有的特征向量都在U的协方差矩阵 中, 若要将样本降至k维, 只需要选取U的前k列便能够将样本降到k个维度。 这时, Uk的维度 就是n*k。 当获得降维之后的矩阵时, 就能够通过 降维矩阵把样本特征对应到低维空间当 中; 降维公式见式(4): Z=X·Uk (4) 式(4)表示对矩阵X进行降维, X为m*n的矩阵, Uk 为n*k的矩阵, 降维后为m*k矩阵; 对于选择降维参数k的值, 即贡献率, 就是降维矩阵中U所包含的特征向量的数量; k越 大, 如果U中的特征向量比较多, 累积贡献率越 大, 包含的原始特征数据信息越多, 那么降维 产生的误差就比较小, 然而可能造成的后果是数据维度仍然过大; 因此具体取值需视实际 情况而定; 算法步骤如下: (1)计算样本的协方差矩阵Σ =XXT;权 利 要 求 书 2/3 页 3 CN 115545090 A 3

.PDF文档 专利 一种基于集成聚类的支柱性产业的判定方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于集成聚类的支柱性产业的判定方法 第 1 页 专利 一种基于集成聚类的支柱性产业的判定方法 第 2 页 专利 一种基于集成聚类的支柱性产业的判定方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:56:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。