这篇文章被收录在了Springer会议论文集,即Intelligent Technology for Power and Energy Systems里,而该论文集是2025 International Symposium on Intelligent Technology for Power and Energy Systems (ITPES 2025) 的论文集,它属于Lecture Notes in Networks and Systems (LNNS),是volume 1815。从会议所确定的位置来进行观察与考量,ITPES格外着重于智能技术在电力以及能源系统里的运用,这其中涵盖了人工智能,还有智能电网,以及能源互联网等诸多方面的指向。
以会议主题来说,这篇论文虽说着重关注的是城市更新里的节能改造风险预测,然而其本质上依旧是归属于“智能技术怎样服务能源系统以及低碳转型”的问题范畴,所以和会议方向是相契合的。
三、这篇文章主要在解决什么问题
这篇文章的核心问题可以概括为:
在城市更新的场景当中,怎样借助多源的 GIS 数据,以及机器学习模型,从而能够更加精准地去预测老旧住宅区节能改造期间的多维风险呢。
作者指出,老旧住宅区节能改造往往面临多种风险交织:
也就是说,并非仅仅是这篇文章在进行如“建筑能耗预测”这般单一的所为,而是在着手处理一个更偏向于决策支持方面的问题:
于大规模城市更新之际,哪些片区改造风险更高,哪些项目改造风险更高,能否于项目推进之前,做出更为细致的识别,做出更为细致的预测。
四、为什么这个问题难做
读下来之后,会发觉,这个问题难以去做之处,并非在于“有没有模型”,而是在于该风险自身其实乃是多维的,并且空间异质性是非常强的。
1. 风险来源不是单一变量,而是多因素叠加
作者着重指出,节能改造里的风险,同时受到地域空间、建筑特性、社会经济还有环境限制的共同作用。比如说,处于同一气候区域内的不一样的社区,有可能由于交通可抵达性、公共服务设施密集程度、人口构成不一样,进而展现出全然不一样的改造风险特性。
2. 传统方法难以捕捉复杂的非线性和空间差异
文章持有这样的观点,传统的统计模型,或者单纯的浅层机器学习方法,当面临复杂的非线性关系,并且遭遇高阶交互作用的时候,常常预测出来的偏差比较大,而且也十分艰难地难以支撑更为细致精细的决策。
3. 单一 GIS 数据也不够
把 GIS 简单当作万能工具这种情况,作者并未如此做。论文指出,单一 GIS 数据在描述空间分布方面更具优势,然而对于建筑物理属性、居民行为等微观机制的描述存在欠缺,所以仅仅依靠空间分布信息,是无法对风险进行完整解释的。
所以,真正难的地方其实是:
不光得把多源异构那种不同类型的数据整合一块儿,还得让模型在表达非线性关系方面有能力,并且能够将空间结构信息留存下来。
五、作者是怎么拆解这个问题的
这篇文章,存在着很值得去学习的一点,这点在于,它并没有将问题直接表述为,“训练一个更强的预测器” ,而是,先把原问题进行拆分,拆分成几个,更容易去操作的子问题。
第一步:先把多源异构数据统一到同一个空间框架里
作者最先着手要解决的,是数据究竟可不可以达成对齐的这一问题。有关论文,将输入数据划分成了四类:
针对要解决数据源不一致的问题,针对要解决尺度不一致的状况,针对要解决时间不一致的情形,针对要解决结构不一致的情况,论文做了三件事:
整体要将涉及的坐标系统一,转换至 CGCS2000 该坐标系,且也要把空间分辨率统一,定到 1m 的空间分辨率这项标准;要借助加权 Voronoi 图来开展空间聚合的操作,是要把宏观的社会经济方面的数据,更精细地分配到建筑或者社区的尺度;还需运用 Kriging 插值去处理环境动态数据,就是要把离散监测点那儿的数据,重建到更具连续性的空间单元之上。
这一步的本质是先回答:
这些不同来源的数据能不能被组织成一个真正可建模的输入空间。
第二步:再构建多维特征库
经过数据统一之后,作者又更进一步去构建了一个多维特征库,该多维特征库覆盖了四类特征,分别是:
论文当中还提及,运用t-SNE这种方式,针对高维特征来开展非线性降维操作,以此去缓和高维特征所引发的计算复杂性问题,以及多重共线性问题。
第三步,要将风险预测涉及的问题,拆解成为“空间分支 ,加上学习分支”这样一种混合的建模相关问题。
作者所提的总体框架,是一个经空间正则化的,RF–DNN混合模型,论文整体将其称作RF–DNN hybrid,然而在方法部分,有一处写成“RF与LSTM的混合架构”,但后续具体展开时,第二分支又被确切写成三层全连接DNN,消融实验里写的也是“remove DNN submodel”。因而,按照论文后续的实现与展开情形来看,最终应该理解为RF加上DNN的混合框架。
这一拆解非常关键:
六、技术框架:这篇文章的方法是怎么搭起来的
从论文的方法部分来看,整个技术框架大致可以理解为四个模块。
1. 多源 GIS 数据融合模块
对此模块而言,其承担着将源于不同地方的数据,予以空间基准方面的统一工作,还要进行尺度匹配操作,以及达成时空对齐任务。在此处运用到的关键技术涵盖了:
这部分予人的感受颇为扎实,缘由在于其并未急于去呈上模型,反而是先行审慎地处置“数据是否能够拼合在一起”的问题。
2. 多维特征构建与降维模块
把论文对于改造风险的理解,视为一个由空间、建筑、经济以及环境共同对其起到决定作用的问题,所以构建了多维特征库,文中所列举的具有代表性的特征涵盖这此些方面:
随后再用 t-SNE 做降维,减少冗余、提高训练效率。
3. 空间正则化 RF–DNN 混合建模模块
这是论文的核心。作者提出的关键做法有三点:
(1)RF 分支加入空间约束
论文对传统随机森林的分裂准则予以了改造,并非仅仅着眼于Gini impurity,还纳入了Moran’s I用以衡量子节点的空间聚集性,并且借助空间正则项一同对分裂目标加以优化。
那就表示,当模型进行学习之际,并非仅仅是一味地追求分类的那种纯度,而且还会有一种倾向,也就是趋向于去形成,那种更加契合地理聚集规律的决策划分。
(2)DNN 分支用于风险量化
文中将 DNN 分支写成一个三层全连接网络,其隐藏层运用 GELU 激活函数,输出层针对技术、经济、环境这三类子风险做加权融合,以此形成最终的综合风险分数,在这当中,三类风险权重分别设定为 0.4、0.35、0.25。
(3)动态权重分配器做模型融合
论文并非将RF与DNN进行简单平均,而是依据验证集的表现,动态计算两个子模型的融合权重,RF分支的权重按照其验证准确率的占比来确定,进而使该模型于不同城市形态、数据分布的情况下,能够自适应地倾向于表现更佳的分支。
4. 实验设计与评估模块
