【论文】Simulating urban expansion by incorporating an integrated gravitational field model into a demand-driven random forest-cellular automata model
基于综合引力场模型和需求驱动的随机森林元胞自动机进行城市扩张模拟
成果信息:
Lv, J., Wang, Y., Liang, X. *, Yao, Y., Ma, T., & Guan, Q. (2021). Simulating urban expansion by incorporating an integrated gravitational field model into a demand-driven random forest-cellular automata model. Cities, 109, 103044, DOI: https://doi.org/10.1016/j.cities.2020.103044.
论文50天免费下载链接:
https://authors.elsevier.com/a/1cAswy5jOgrP5
团队成员
吕建军,博士,中国地质大学(武汉)bat365官网登录入口,教授,硕士生导师。主要从事智慧城市、城市计算等方面的研究。
王一凡,硕士生,中国地质大学(武汉)bat365官网登录入口。研究方向为土地利用模拟与优化。
梁迅*(通讯作者),博士后,中国地质大学(武汉)bat365官网登录入口,主要从事地理时空过程模拟、城市计算等方面的研究。
联系邮箱:liangxun@cug.edu.cn
姚尧,博士,中国地质大学(武汉)bat365官网登录入口,副教授,硕士生导师。主要从事时空大数据挖掘、多源时空数据融合、城市计算等方面的研究。
马滕,硕士,中国地质大学(武汉)bat365官网登录入口。
关庆锋,博士,中国地质大学(武汉)bat365官网登录入口,教授,博士生导师。主要从事高性能空间计算、空间计算智能、时空大数据挖掘与模拟等方面的研究。
成果介绍
自改革开放以来,我国城市扩张速度加快,逐渐呈现出集群化的趋势,促进了城市群的形成。城市群的快速扩张带来了一系列问题,比如:资源环境与社会经济发展矛盾、区域发展差距悬殊等。因此,研究城市群中城市扩张的驱动机制和演化规律,有助于帮助制定合理的政策,对我国土地资源合理利用和城市群的可持续发展具有重要意义。
元胞自动机(Cellular automata, CA)模型在进行大规模城市区域扩张模拟时,通常将每个城市视为独立的个体,即仅考虑城市内部的驱动因素,未考虑城市之间空间相互作用的影响。因此,有研究者提出可以采用引力场模型(Gravitational field model, GFM)来量化城市间的空间相互作用,并将其纳入CA模型的转换规则中,模拟城市群区域的城市扩张。现有研究表明,城市空间相互作用可以提高城市群土地利用变化的模拟精度。尽管目前已有许多学者开展了GFM结合CA的研究,但这些研究还存在如下三点不足:
(1)这些研究仅采用人口流动或信息流动来量化城市空间相互作用,指标不够全面,不能反映出城市间复杂的空间相互作用;
(2)这些研究通常采用简单的线性回归算法来挖掘土地利用的转换规则,未能很好的探索城市扩张与驱动因素(包括城市空间相互作用)之间复杂的非线性关系;
(3)这些研究多采用基于阈值的CA模型。在阈值CA的模拟结果中,土地利用的数量会随阈值的变化而变化,无法保证对比模型获得具有相同城市用地数量的模拟结果。这在验证对比模型的模拟精度时,不清楚模拟精度的提高是由于考虑了空间相互作用,还是由于城市用地数量的变化。因此,这些研究在验证对比模型的模拟精度时,没有做到控制变量,不能保证结论的严谨性。
因此,本研究拟解决的科学问题为:城市空间相互作用在城市群内城市扩张中扮演着怎样的角色?如何更加全面地量化城市空间相互作用,并结合元胞自动机模型,挖掘城市空间相互作用影响下城市群扩张的驱动机制和演化规律?
本研究的整体框架如图1所示。
图1 研究框架
本研究构建的IGFM-RF-CA模型一共分为三个部分:
(1) 综合引力场模型(IGFM)
首先,从统计年鉴中选取与经济、社会、科教、基础设施建设和环境五个方面相关的20个指标,构建综合指标体系,采用因子分析法计算出城市综合竞争力指数;然后,对OSM路网进行分级设速,计算时间成本距离;最后,通过设置百度指数的搜索关键词和用户所在区域,构建信息流强度矩阵,分别以信息流出强度和信息流入强度作为权重,对引力场模型进行加权。
(2) 需求驱动的随机森林元胞自动机(RF-CA)
首先,基于土地利用数据和各类驱动因素构建空间变量数据集,放入随机森林算法中,获取城市发展的初始概率;然后,整合邻域影响、限制因素、自适应惯性系数获得城市发展的总概率;最后,采用轮盘赌竞争机制决定元胞最终发展的用地类型,当满足城市用地总量的需求时,停止迭代,完成模拟(图2)。
(3) 模拟精度验证
我们建立了多个对比模型,采用Kappa和FoM两个精度评价指标进行对比模型的模拟精度验证,并基于随机森林算法的袋外数据进行变量重要性的分析。
图2 需求驱动的随机森林元胞自动机
本研究构建了四种不同的模型进行模拟精度的对比:IGFM-RF-CA、GFM-RF-CA、GFM-LR-CA和RF-CA。IGFM-RF-CA 为本研究所提出的模型;GFM-RF-CA采用了He等人在2013年提出的引力场模型,该引力场模型仅采用人口和GDP构建;GFM-LR-CA采用了基于阈值和Logistic回归算法的传统CA模型;RF-CA模型未考虑城市空间相互作用。
表1为四种对比模型的模拟精度,可以看出,本研究所提出的IGFM-RF-CA模型具有最高的模拟精度,FoM指数为0.204,Kappa系数为0.644,OA为0.922。
表1 模拟精度对比
|
OA |
Kappa |
FoM |
RF-CA |
0.919 |
0.626 |
0.186 |
GFM-LR-CA |
0.913 |
0.617 |
0.193 |
GFM-RF-CA |
0.921 |
0.635 |
0.198 |
IGFM-RF-CA |
0.922 |
0.644 |
0.204 |
图3为2000-2015年京津冀城市群城市扩张模拟结果和真实情况对比,图4选取了北京、天津、保定和张家口四个城市进行局部地区模拟结果的对比。可以看出,RF-CA的模拟结果中,新增的城市斑块在原有城市斑块附近分布的比较分散。而GFM-LR-CA、GFM-RF-CA和IGFM-RF-CA的模拟结果中,城市扩张得更为紧凑和集中,这与2015年土地利用现状更为相似。而且,这种现象在IGFM-RF-CA模型的模拟结果中更为明显。
图3 2000-2015年京津冀城市群城市扩张模拟结果和真实情况对比:(a)2015年现状;(b)IGFM-RF-CA模拟结果;(c)GFM-RF-CA模拟结果;(d)GFM-LR-CA模拟结果;(e)RF-CA模型模拟结果
图4 2000-2015年京津冀城市群城市扩张模拟结果和真实情况对比(局部地区):(a)2015年现状;(b)IGFM-RF-CA模拟结果;(c)GFM-RF-CA模拟结果;(d)GFM-LR-CA模拟结果;(e)RF-CA模型模拟结果
我们还计算了每个城市模拟精度的提升程度,如图5所示,在IGFM-RF-CA的模拟结果中,有9个城市的模拟精度有提升,其中,3个城市的模拟精度提升超过15%。图6为模拟精度提升程度的空间分布,结果表明,城市空间相互作用有助于提高北京、天津等发达城市的模拟精度,而对张家口、承德等这些欠发达城市的模拟精度影响不大;当城市空间相互作用被信息流强度加权后,更有利于提升京津冀外围地区欠发达城市(如:张家口、承德和衡水)的模拟精度。
图5 GFM-RF-CA和IGFM-RF-CA相较于RF-CA的模拟精度(FoM)提升程度
图5 IGFM-RF-CA模拟精度(FoM)提升程度的空间分布:(a)相较于RF-CA;(b)相较于GFM-RF-CA
基于马尔科夫链模型,我们预测出在2030年,京津冀城市群的城市用地面积将达到39, 782.15km²。应用IGFM-RF-CA 模型模拟2015-2030年京津冀的城市扩张,发现新增的城市斑块更倾向于分布在现有的大面积城市斑块附近,呈现出集中式扩张的趋势(图6)。
图6 2030年京津冀城市扩张模拟:红色栅格为IGFM-RF-CA与RF-CA模拟结果一致的区域;黄色和绿色栅格分别表示IGFM-RF-CA和RF-CA模拟结果不一致的区域
基于随机森林算法的袋外数据,我们计算出RF-CA、GFM-RF-CA和IGFM-RF-CA三个模型中各个变量的重要性,如图7所示。图7(a)表明,RF-CA模型中,高程和坡度这两个因素排在前两位,占总重要性的近30%。也就是说,在不考虑城市空间相互作用时,自然条件在城市扩张中起着至关重要的作用。
图7(b)表明,在GFM-RF-CA模型中,与居民生活相关的POI密度(医院、餐馆和商场)排在前三位,超过了自然条件。城市空间相互作用排在第八位,作为一个潜在的影响因素,它的出现改变了各驱动因素原有的重要性顺序。
图7(c)表明,IGFM-RF-CA模型的驱动因素重要性顺序与GFM-RF-CA类似,生活类POI密度仍维持在前三位。值得一提的是,信息流入强度加权的城市空间相互作用对城市扩张的影响大于信息流出强度加权的城市空间相互作用。由于信息流入强度代表了其他城市对某个城市的关注程度,因此,该结果表明,受关注度高的城市有更多的发展机会。图7(b)和(c)共同表明,城市空间相互作用在所有变量中排列于中间的位置,是城市群模拟中不可忽视的驱动因素。
图7 驱动因素的重要性:(a)RF-CA;(b)GFM-RF-CA;(c)IGFM-RF-CA
综上所述,本研究提出的IGFM-RF-CA模型在对比模型中具有最高的模拟精度。IGFM-RF-CA模型不仅可以提升整个京津冀地区的模拟精度,还可以提升大多数局部城市地区的模拟精度,特别是相对发达的城市(如:北京和天津);此外,信息流强度的加入,更有利于提高一些欠发达城市的模拟精度(如:张家口和承德)。经变量重要性分析,城市空间相互作用在14个驱动因素中排名第7,对城市群扩张具有比较重要的贡献。而且,信息流入强度对城市扩张的影响大于信息流出强度,因此,我们建议像张家口、承德这些欠发达城市可以提高在网络方面的影响力,以促进经济和城市的发展。