用户名
密码
(30天内有效)
注册
注册
首页 > 案例资料 >

如何结合手机大数据与智能体模型来量化研究居民通勤?

我要收藏
2021-04-21

作者简介

吴昊、刘凌波、彭正洪、余洋,武汉大学城市设计学院。


文章导读

研究进行了一个结合大数据与智能体模型来量化研究居民通勤的尝试,希望能提取城市空间与居民间互动机制中的深层信息,回溯分析拥堵成因,将来可对不同的城市空间优化方案做出预测与评估。


1618991048631220.jpg



研究背景

以人为本是城市规划中贯穿始终的核心原则之一,而随着我国的城镇化建设主要目标从增量用地转向存量用地,可以预期在已有的城市建成区上规划与建设也会越来越审慎,在这样的大背景下,通过科学的手段去对城市空间的优化措施进行评估,预测不同方案可能带来的人与城市空间环境的交互影响,将是以实用为导向的城市规划技术演进方向之一。


当前大数据技术是城市规划研究中的热点,但总体而言,早期的研究多半处于通过数据描述城市现象的阶段,只有较少研究更进一步,通过大数据来发掘居民出行与城市运行机制之间的关联,将其用于城市空间优化的预测与评价。


各类大数据尤其是手机数据的应用,使得从微观视角准确描述城市居民行为已成为可能。另一方面,随着城市规模的扩张以及机动车保有量的增长,交通拥堵已逐渐成为越来越严重的城市问题,而潮汐式的城市居民通勤交通被认为是交通拥堵的主要成因之一, 交通拥堵不仅带来能源浪费、环境污染,还被认为对城市居民健康有着较大影响,因此改善城市交通拥堵也是当前城市空间优化的重要目标之一。


综合以上背景,本研究尝试结合大数据与智能体模型来量化研究居民通勤,进而回溯分析拥堵成因,提取城市空间与居民间互动机制中的深层信息,对不同的城市空间优化做出预测与评估。当然,由于笔者能力有限,研究更多是一种技术上的探索与尝试,以期为后续研究能提供一些有益的思路。



数据与方法

2.1 手机数据处理

本次研究中采用的为手机话单数据,由于各种用户的生活工作习惯不一,获取到的通信行为也是一种时间分布不均匀的数据,但通常而言大部分通勤人群在出行上具备一定的时空规律性,在基于一个月的数据来综合统计后,可一定程度上弥补由于非匀质化时间分布所导致的轨迹精度问题。目前主流的用户位置识别方法主要是利用手机通话过程中基站的切换这一空间变换性质,认为在特定时段内出现的最高频率的基站点为这一时段内的空间定位点。无论哪种手机数据,其用户的空间定位与通信基站的空间分布直接相关,通常而言城市中心城区的基站分布密度远大于远城区,在中心城区的定位精度可达到100至300米。


手机话单数据的原始数据为案例城市约700万用户的一个月的话单数据(见表1),分工作、非工作日的24个时段进行通话基站的频次统计,得到每个用户ID在每个时段归属的最高通话频次基站编号(基站ID),视为其当时所在的空间定位依据(表2)。数据清洗后约为380万有效用户ID。


表1   手机话单数据样例

1618991094787064.png


表2   用户分时归属基站统计样例

1618991121637637.png


2.2 智能体模型

在智能体模型中,各类智能体会按预设的行为规则运行且彼此之间会产生交互,最终产生从单体到全局的动态变化,城市中人与人、人与空间的互动类似于这样的过程,因此智能体模型被认为是理解城市运行机制的最佳工具之一。


本次模型主要在Repast S平台上完成,其外部环境设置以及智能体移动设定等都参考了开源模型RepastCity(Malleson,2012)。由于研究主要考虑的是居民出行这一单一行为,因此对城市环境的建模可以简化成出行空间单元地块(即出发地与目的地)以及城市道路。


模型的基本运行原理为:

(1)系统生成各类智能体,其中居民智能体在各出行单元中根据统计出的分时OD矩阵生成,生成后具备OD标识、出发时间与路径算法、速度获取等预设的行为规则;

(2)居民智能体在预设的出行时间段从一个空间单元(出发地)去往另一个空间单元(目的地),然后独立计算各自出行路径;

(3)居民在道路上运行的时候,会由于拥堵规则这一交互行为降低自身移动速度(见表3)。


表3   居民Agent行为规则

1618991142498799.png


2.3 出行单元分割与数据统计

选取了研究区域以后,在用地空间单元的生成上结合航拍图以及矢量电子地图、基于现状道路对地块进行切割。以手机数据这样巨大的数据集为对象时分时统计的时段量、地块数量会对统计总量有着几何倍数的影响,因此除了研究区域以外的城市空间用地划分将尽量进行简化减少空间单元的总数量。最终生成36个空间单元(见图1),基于这些空间单元进行了工作日早高峰通勤时段的四个小时的统计。其中1至27号地块为核心研究对象,主要获取该区域中居民通勤时间出行的特征数据,其余地块不做精细划分无法获取其准确出行路径,因此仅作为出行目标区域而不作为出发地。


1618991167174525.png

                   a 原始地块划分及路网                                b 简化后的用地空间单元及路网环境

图1   城市空间单元分割图


选择了每周周一至周五作为统计居民通勤行为的时间区间,获取了居民通勤出行的时间特征库。正常的通勤行为中,早高峰出行方向为从居住地去往工作地,晚高峰则相反。在空间单元划分中为了降低数据量级而简化了工作地的用地划分,因此本次模拟中只考虑早高峰的情况,即早6点至9点这四个时段中的居民出行行为。分别依托手机用户在6、7、8、9点四个时段的基站所在地块编号及11点所在的地块编号,经统计生成居民分时分地块出行数量及OD矩阵(表4)。统计出的26个地块在这四个时段的出行人口为9.2万人,详细的分布情况见图2。比较四个时段出行数量为7点>8点>6点>9点,这也与我们日常感受一致:中国多数机构实施朝九晚五工作制,7点至8点出门即使遇上通勤高峰也可为抵达工作地预留足够通勤时间,因此成为最受居民青睐的出行时段。


表4   分时分地块居民出行统计样表

1618991197826505.png

1618991215625944.png

图2   各空间单元分时段出行通勤人数


2.4 模型假设与参数设定

就模型中的居民Agent产生及其行为,提出假设如下:

第一,模型中假定每个居民出行都视为一辆私人小汽车,其初始行进速度为机动车行驶速度。

第二,每个模拟地块都会生成特定数量的居民Agent,该数量为统计初始值加上运营商占比、用户机动车出行比率进行换算后取值。

第三,交通拥堵的产生基于同一路段存在特定数量的居民Agent,并且拥堵产生后居民行进速度会由于拥堵状况的级别不同而变化。

第四,居民出行会选择通往目的地的最近路径,并且在抵达目的地过程中不会发生路径改变。


针对研究区域的城市居民通勤出行模型中主要的参数变量有三处:

(1)源于分时OD出行矩阵的各地块居民通勤出行数据,以及所对应的Agent出行数量设置。最终生成的Agent数量为1比10,即一个Agent代表10个出行居民。

(2)道路车速设置。道路车速共分为两个级别,其中快速路正常速度设置为50公里/小时,城市干路设为30公里/小时,对应读取的速度参数分别为13.9米/秒以及8.3米/秒,居民Agent即每个运行周期(模拟中为1tick)等于现实时间的1秒。

(3)道路拥堵设置。严重拥堵道路占有率为0.5~1,较拥堵为0.3~0.5,其余为畅通。道路交叉口缓冲区半径为100m,推算出200m路段上车辆数为300时速度衰减为标准时速的0.2倍,车辆数为150至290时衰减为0.5倍,车辆数量为90至150时衰减为0.8倍,90以下为正常时速。



研究结果

截取模型运行的几个时间节点的实时图像如图3所示,但可视化界面难以肉眼判断量化的交通特征,因此对道路交叉口进行了编号,然后获取每个运行周期中道路交叉口的Agent数量,以准确定位其交通拥堵产生时间段及拥堵级别,道路交叉口编码如图4所示。


1618991243445469.png

图3   模型仿真运行分时截屏


1618991264167195.png

      a.道路优化前节点编码                          b.道路优化后节点编码

图4   道路交叉口编码


以90秒为周期对研究区域内各路口进行数量统计,得到图5。四个时段的通勤居民总数量、各地块的的居民出行数量及目标都有差异,但生成的四时段折线图总体上保持一致。细分到各道路交叉口来看,折线图的波峰代表产生的最大车流数量,而持续时长才代表着拥堵产生。因此可以推断出产生拥堵最为明显的路口为10号路口,其余较为明显的路口包括6号、9号、37号路口等。


1618991286183184.png

表一  2005年世界主要国家和地区城市能源使用状况


结合可视化界面中各路口的拥堵产生过程,再结合各地块分时段出发的居民数量(表4),即可分析出各路口的拥堵成因。


为了测试模型对不同方案的模拟结果,结合对拥堵成因的分析,根据武汉市总体规划对研究区域的道路进行了优化(图4b),对优化前后的道路通行状况进行了对比。仿真中采用的数据是7点出发的通勤人口最多的时段。对比前后两种方案的仿真结果(图6),可以看到优化后的方案好于优化前的方案:首先是道路路口的交通压力被分散到了多个路口,而不是优化前方案一样主要集中于一个路口;其次总体上交通拥堵的持续时间有所缩短,这里设定路口堆积通行Agent数量100为界定拥堵的阈值,对路口进行定量比较:道路优化后产生过严重拥堵的路口为12个,总拥堵时长(即行车数量大于100时的持续时间)合计42分钟,优化前方案拥堵路口为15个,总拥堵时长则达到了112.5分钟。


1618991312407000.png

表一  2005年世界主要国家和地区城市能源使用状况



讨论与结论

基于高德地图交通路况预测提取了研究对象区域四个时间节点的交通路况如图7所示。由于路况预测是基于历史数据所生成,因此可视作是基于过去历年各条道路的最高概率会出现的道路交通状况,也可用来一定程度上验证模型仿真的结果。


1618991339233472.png

表一  2005年世界主要国家和地区城市能源使用状况


此外,就手机数据在判别人群出行特征的有效性方面,研究也从另一个侧面进行了校核,根据居民出行的OD统计后得到全武汉市内的单程平均通勤距离为8.2km,平均通行时长为31.5分钟,其与百度地图出品的中国城市交通报告(2018年度第三季度)相比略微偏低,考虑到百度地图主要采集使用百度产品的用户数据,由于短程出行居民较少使用地图服务,因此去除用户中日常平均通勤距离小于1km的群体,再进行统计时发现与百度提供的结果类似,说明数据具有较高的准确性。具体对比如表5所示。


表一  2005年世界主要国家和地区城市能源使用状况

1618991361817046.png

在既有的一些研究中,虽然也逐步应用大数据来进行居民出行OD矩阵的生成并在真实的城市路网中进行道路压力预测,但仍存在以下问题:其一,研究对象多半为整个城市的宏观尺度,进而往往忽略道路通行能力这一指标,而这一指标对交通拥堵缓解有着重要作用;其二,将所有通勤人口视作同时出发而忽略了不同时段的差异性,在中微观尺度的交通状况预测上会存在较大误差。在本次研究中,分时统计的居民出行OD矩阵在一定程度上体现了不同时段的交通拥堵情况的不同,也考虑到了不同等级的道路所具备的交通拥堵疏导能力,可为城市居民的通勤研究提供更多观察视角。


由于研究还处于进展阶段,仍存在有待完善的地方:

第一,手机话单数据在记录城市居民行为轨迹上属于一种相对较为稀疏的数据,难以通过统计分析得出居民出行的交通方式(速度),因此不能直接获取通勤车辆与手机用户之间的真实转换参数,也未设置公交车、轨道等细分交通形式;


其二,在模型的构建上,未对道路进行车道及流向划分,在拥堵设置上也仅考虑获取特定范围的车辆密度而忽略车辆重叠问题,这些与真实的交通环境都有所出入,导致仿真结果不能在更为精细的层级进行过程推演;


最后,由于并未对研究区域做实地的问卷调研也缺乏相关数据来交叉比对,仿真的结果仅能提供一定参考,在真实场景数据的校核上仍存在不足。以上这几点也是后续研究中需要加以完善的。


这个模型仿真的实验,也实践了一个相对完整的从数据采集分析、关键信息提取到导入模型仿真模拟、方案评估的技术流程,为城市规划中的大数据与仿真模型融合应用提供了一个尝试。在各类城市空间大数据越来越丰富的今天,作为城市规划与研究者遇到的问题可能越来越多的将是数据如何用而并非数据从哪里来,从这个角度来说智能体模型将是一个较好的契合点,联系城市空间与人、分析城市的现在与预测未来。


本文转载自微信公众号:城市数据派,如需转载请联系城市数据派。

本站声明

本文仅代表作者观点,不代表城市数据派立场;
本文系作者授权城市数据派发表,未经许可,不得转载;
本网站上的所有内容均为虚拟服务,一经购买成功概不退款,请您理解。

点赞0

全站浏览排行

TOP ARTICLES