(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210829543.9
(22)申请日 2022.07.15
(71)申请人 国家电投集团江西电力工程有限公
司
地址 330096 江西省南昌市南昌 高新技术
产业开发区艾溪湖北路6 6号四楼东 面
(72)发明人 黄必成 张敏 童浪兴 刘勇
吴绍华 杨荣坪 钱大庆 左宇
陈经玮 方涛 王天龙 吴逸鸣
林康玮 黄雪斌 熊磊 吴涛
罗孝峰
(74)专利代理 机构 鹰潭市智埠专利代理事务所
(普通合伙) 36131
专利代理师 周少华(51)Int.Cl.
G06K 9/62(2022.01)
G06Q 50/06(2012.01)
(54)发明名称
一种基于集成聚类的支柱性产业的判定方
法
(57)摘要
一种基于集成聚类的支柱性产业的判定方
法, 包括: 构建多源电力指标, 明确各指标类型,
对于多源电力指标中的极小型以及区间型指标
进行转换, 对各指标数据进行数据预处理, 对各
指标数据进行降维, 将不同的聚类算法作为个体
学习器分别得到聚类结果, 通过学习法的结合策
略将各个体学习器的输出结果通过聚类算法结
合; 采用DBSCAN密度聚类作为次级学习器以结合
各个体学习器的输出; 进行支柱性产业类簇判
定。 本发明构建多源电力指示, 并根据指标特性,
大致将其分为经济贡献度、 能源消耗、 能源消费
结构、 节能环保四个层面, 对指标进行解析, 通过
熵权法给多源电力指标赋予权重, 结合各聚类簇
产业的多源电力指标数据, 判定出支柱性产业
簇。
权利要求书3页 说明书10页 附图5页
CN 115545090 A
2022.12.30
CN 115545090 A
1.一种基于集成聚类的支 柱性产业的判定方法, 其特 征在于: 包括如下步骤:
步骤一、 构建多源电力指标:
将经济贡献度、 能源消耗、 能源消费结构、 节能环保四个方面指标构建为多源电力指
标;
其中, 所述经济贡献度指标, 包括: 产业总产值S1、 总产值同比增长S2、 利 润总额S3;
所述能源消耗指标, 包括: 用电量S4、 油品消耗 量S5、 燃气消耗 量S6、 万元产值能耗S7;
所述能源消费结构, 包括: 电力占能源比重S8、 煤炭占能源比重S9、 油品占能源比重
S10、 燃气占能源比重S1 1;
所述节能环保指标, 包括: 煤炭消耗 量S12;
步骤二、 明确各指标类型:
产业总产值S1、 总产 值同比增长S2、 利润总额S3、 燃气消耗量S6、 燃气占能源比重S11属
于极大型指标;
油品消耗量S5、 万元产 值能耗S7、 煤炭占能源比重S9、 油品占能源比重S10、 煤炭消耗量
S12属于极小型指标;
用电量S4、 电力占能源比重S 8属于区间型指标;
步骤三、 对于多源电力指标中的极小型以及区间型指标进行转换:
对于极小型指标, 转换为:
对于区间型指标, 转换为:
式(1)(2)中: x代表原始指标数据;
代表转换后的指标数据; [q1, q2]为区间型指标数
据的最佳 稳定区间; M、 m代 表分别为x允许的上 下界;
步骤四、 对各指标 数据进行 数据预处 理:
采用极差标准 化如式(3)所示:
其中, xij代表第i个指标的第j个 数据, xij’代表经过数据预处理后的第i个指标的第j个
数据;
标准化后的新数据, 变量的极大值 为1, 极小值 为0, 其余的数值均在0与1之间;
步骤五、 对各指标 数据进行降维:
使用主成分分析法PCA对数据进行降维, 其降维的核心是正交分解, 通过相互正交的空
间基向量来表示原始数据; 将数量较少的几个重要的的主成分向量作为向量基, 然后用重
构的方法来实现原 始特征的维度降低;权 利 要 求 书 1/3 页
2
CN 115545090 A
2步骤六、 将不同的聚类算法作为个体学习器分别得到聚类结果, 通过学习法的结合策
略将各个体学习器的输出结果通过聚类算法结合; 采用DBSCA N密度聚类作为次级 学习器以
结合各个 体学习器的输出;
步骤七: 进行支 柱性产业类簇判定:
首先求出各多源电力指标 下, 各类簇各样本占整体样本的平均比重:
式中: xijk代表第k类簇的样本, i代表第i个产业样本, j代表第j维多源电力指标; nk为第
k类产业簇的样本数量; n代表所有产业样本的个数; Mjk表示在第j 维多源电力指标上k类簇
中各样本占整体样本的平均比重 。
由于一共有12个多源电力指标, 得到k类簇样本占比矩阵
则M=
[M1,M2,...,M12]作为在各维特征属性上各类簇各样本占整体样本的平均比重矩阵, 为k*12
的矩阵。
然后结合特 征权重给给类簇评分:
P=M·ω (10)
式中: ω=[ω1,ω2,···,ω12]′是各多源电力指标的权重, 为12*1矩阵; P为各类簇
产业得分, 为 k*1矩阵。
2.如权利要求1所述的一种基于集成聚类的支柱性产业的判定方法, 其特征在于: 所述
步骤五中, PCA降维是指: 找到一个n 维的向量, 然后获取另一个低维的向量空间, 再把想n维
向量映射到获取到的低维向量空间; 关于nD—>kD降维表 示新的向量空间由这k个向量来定
义, 再将样本映射到这个向量空间来;
在具体的操作中, 首先通过奇异值分解方法计算样本数据的协方差矩阵特征值与 特征
向量; 在协方差矩阵中, 所有 特征向量用U表 示, 特征向量用列来表 示, 而且特征值 从大到小
进行降序, U的维度为n*n。 U又叫做降维矩阵, 默认的所有的特征向量都在U的协方差矩阵
中, 若要将样本降至k维, 只需要选取U的前k列便能够将样本降到k个维度。 这时, Uk的维度
就是n*k。 当获得降维之后的矩阵时, 就能够通过 降维矩阵把样本特征对应到低维空间当
中;
降维公式见式(4):
Z=X·Uk (4)
式(4)表示对矩阵X进行降维, X为m*n的矩阵, Uk 为n*k的矩阵, 降维后为m*k矩阵;
对于选择降维参数k的值, 即贡献率, 就是降维矩阵中U所包含的特征向量的数量; k越
大, 如果U中的特征向量比较多, 累积贡献率越 大, 包含的原始特征数据信息越多, 那么降维
产生的误差就比较小, 然而可能造成的后果是数据维度仍然过大; 因此具体取值需视实际
情况而定;
算法步骤如下:
(1)计算样本的协方差矩阵Σ =XXT;权 利 要 求 书 2/3 页
3
CN 115545090 A
3
专利 一种基于集成聚类的支柱性产业的判定方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:56:12上传分享