开发者实战：利用 GIS 与混合模型构建城市级预测系统

2026-03-25 4 纸飞机账号购买

这篇文章被收录在了Springer会议论文集，即Intelligent Technology for Power and Energy Systems里，而该论文集是2025 International Symposium on Intelligent Technology for Power and Energy Systems (ITPES 2025) 的论文集，它属于Lecture Notes in Networks and Systems (LNNS)，是volume 1815。从会议所确定的位置来进行观察与考量，ITPES格外着重于智能技术在电力以及能源系统里的运用，这其中涵盖了人工智能，还有智能电网，以及能源互联网等诸多方面的指向。

以会议主题来说，这篇论文虽说着重关注的是城市更新里的节能改造风险预测，然而其本质上依旧是归属于“智能技术怎样服务能源系统以及低碳转型”的问题范畴，所以和会议方向是相契合的。

三、这篇文章主要在解决什么问题

这篇文章的核心问题可以概括为：

在城市更新的场景当中，怎样借助多源的 GIS 数据，以及机器学习模型，从而能够更加精准地去预测老旧住宅区节能改造期间的多维风险呢。

作者指出，老旧住宅区节能改造往往面临多种风险交织：

也就是说，并非仅仅是这篇文章在进行如“建筑能耗预测”这般单一的所为，而是在着手处理一个更偏向于决策支持方面的问题：

于大规模城市更新之际，哪些片区改造风险更高，哪些项目改造风险更高，能否于项目推进之前，做出更为细致的识别，做出更为细致的预测。

四、为什么这个问题难做

读下来之后，会发觉，这个问题难以去做之处，并非在于“有没有模型”，而是在于该风险自身其实乃是多维的，并且空间异质性是非常强的。

1. 风险来源不是单一变量，而是多因素叠加

作者着重指出，节能改造里的风险，同时受到地域空间、建筑特性、社会经济还有环境限制的共同作用。比如说，处于同一气候区域内的不一样的社区，有可能由于交通可抵达性、公共服务设施密集程度、人口构成不一样，进而展现出全然不一样的改造风险特性。

2. 传统方法难以捕捉复杂的非线性和空间差异

文章持有这样的观点，传统的统计模型，或者单纯的浅层机器学习方法，当面临复杂的非线性关系，并且遭遇高阶交互作用的时候，常常预测出来的偏差比较大，而且也十分艰难地难以支撑更为细致精细的决策。

3. 单一 GIS 数据也不够

把 GIS 简单当作万能工具这种情况，作者并未如此做。论文指出，单一 GIS 数据在描述空间分布方面更具优势，然而对于建筑物理属性、居民行为等微观机制的描述存在欠缺，所以仅仅依靠空间分布信息，是无法对风险进行完整解释的。

所以，真正难的地方其实是：

不光得把多源异构那种不同类型的数据整合一块儿，还得让模型在表达非线性关系方面有能力，并且能够将空间结构信息留存下来。

五、作者是怎么拆解这个问题的

这篇文章，存在着很值得去学习的一点，这点在于，它并没有将问题直接表述为，“训练一个更强的预测器” ，而是，先把原问题进行拆分，拆分成几个，更容易去操作的子问题。

第一步：先把多源异构数据统一到同一个空间框架里

作者最先着手要解决的，是数据究竟可不可以达成对齐的这一问题。有关论文，将输入数据划分成了四类：

针对要解决数据源不一致的问题，针对要解决尺度不一致的状况，针对要解决时间不一致的情形，针对要解决结构不一致的情况，论文做了三件事：

整体要将涉及的坐标系统一，转换至 CGCS2000 该坐标系，且也要把空间分辨率统一，定到 1m 的空间分辨率这项标准；要借助加权 Voronoi 图来开展空间聚合的操作，是要把宏观的社会经济方面的数据，更精细地分配到建筑或者社区的尺度；还需运用 Kriging 插值去处理环境动态数据，就是要把离散监测点那儿的数据，重建到更具连续性的空间单元之上。

这一步的本质是先回答：

这些不同来源的数据能不能被组织成一个真正可建模的输入空间。

第二步：再构建多维特征库

经过数据统一之后，作者又更进一步去构建了一个多维特征库，该多维特征库覆盖了四类特征，分别是：

论文当中还提及，运用t-SNE这种方式，针对高维特征来开展非线性降维操作，以此去缓和高维特征所引发的计算复杂性问题，以及多重共线性问题。

第三步，要将风险预测涉及的问题，拆解成为“空间分支，加上学习分支”这样一种混合的建模相关问题。

作者所提的总体框架，是一个经空间正则化的，RF–DNN混合模型，论文整体将其称作RF–DNN hybrid，然而在方法部分，有一处写成“RF与LSTM的混合架构”，但后续具体展开时，第二分支又被确切写成三层全连接DNN，消融实验里写的也是“remove DNN submodel”。因而，按照论文后续的实现与展开情形来看，最终应该理解为RF加上DNN的混合框架。

这一拆解非常关键：

六、技术框架：这篇文章的方法是怎么搭起来的

从论文的方法部分来看，整个技术框架大致可以理解为四个模块。

1. 多源 GIS 数据融合模块

对此模块而言，其承担着将源于不同地方的数据，予以空间基准方面的统一工作，还要进行尺度匹配操作，以及达成时空对齐任务。在此处运用到的关键技术涵盖了：

这部分予人的感受颇为扎实，缘由在于其并未急于去呈上模型，反而是先行审慎地处置“数据是否能够拼合在一起”的问题。

2. 多维特征构建与降维模块

把论文对于改造风险的理解，视为一个由空间、建筑、经济以及环境共同对其起到决定作用的问题，所以构建了多维特征库，文中所列举的具有代表性的特征涵盖这此些方面：

随后再用 t-SNE 做降维，减少冗余、提高训练效率。

3. 空间正则化 RF–DNN 混合建模模块

这是论文的核心。作者提出的关键做法有三点：

（1）RF 分支加入空间约束