集智科学家董磊Nature刊文,揭示人类出行的普遍模式
导语
城市中的人口流动,一方面促进了社会、经济和文化的交流,塑造了城市的形态,另一方面也产生了交通拥堵和空气污染等一系列问题,同时还加速了流行病的传播。Nature 杂志5月26日在线发表的一项研究,利用大规模城市人口出行数据,发现了任何地点的访客数量与其到访距离和访问频率的平方成反比。这项工作通过将人口流动进行频谱分解,揭示了人类移动过程的“距离-频率”普遍性规律,增进了对人类出行模式的理解。同时,该研究利用人口流动数据和模型阐释了经典城市地理学理论(如中心地理论,Zipf’s Law),对城市规划、交通规划、流行病建模等领域的研究均有启发。
论文通讯作者兼共同第一作者董磊博士,毕业于清华大学,曾任北京大学和麻省理工学院博士后,是集智科学家社区成员。
郭瑞东、刘培源 | 作者
邓一雪 | 编辑
论文题目:
The universal visitation law of human mobility 论文地址: https://www.nature.com/articles/s41586-021-03480-9
1. 过往对人类出行规律的研究
预测人们在城市内和城市间的移动模式、出行规律,对于交通设计、城市规划和流行病建模等各研究领域都非常重要。物理学家、圣塔菲研究所前任所长Geoffrey West认为,我们面临的所有问题,特别是气候变化,都是在城市里产生的,因为那里有人。因此,了解城市以及人们是如何在城市中活动,对于这个星球上生命的未来有着根本性的影响。
给定两个地点,如何预测两地间会有多少人出行?对于这个问题,科学界早有关注。早在1885年,地理学家 Ernst Ravenstein 就凭经验指出,有两个关键因素可以解释两地之间往来的个体数量:两地间的距离、来源地和目的地的社会经济属性。例如,出行者的数量往往随着距离的增加而减少,而人口密集(更有社会经济活力)的地方吸引了更多的人前往。
这一经验此后被归纳为人类出行的“引力模型”(gravity law),其表达式类似于万有引力公式,即两个城市之间旅行者数量与两个城市的人口数的乘积成正比,与两地之间的距离的平方(或其他幂律以及指数函数形式)成反比。此后在引力模型的基础上,还发展出了介入机会模型(intervening opportunities model)、辐射模型(radiation model)、矢量场模型(field model)等。
近年来随着大数据的积累,数据的空间和时间分辨率变得越来越精细,通过手机GPS可以收集到实时的出行轨迹数据,为我们研究出行规律提供了数据基础。与此同时,利用人口移动数据支持流行病防控和城市基础设施规划等方面的需求也在不断提高。在上述背景下,人类出行规律的研究一直是过去十多年的研究热点,在新冠疫情期间更为明显。
5月26日,由MIT、北京大学、圣塔菲研究所等多个研究机构组成的科研团队,在 Nature 杂志发表文章,利用大规模人口流动数据,揭示了城市人群出行的一个新的“距离-频率”法则(distance-frequency law)。论文通讯作者及共同第一作者董磊博士,毕业于清华大学,曾任北京大学和麻省理工学院博士后,是集智科学家社区成员。
2. 到访频次和距离之间存在普遍模式
与以往的人类出行模式研究主要分析距离、人口规模等因素不同,该文章将一个长期被“忽视”的重要因素——到访频率(visitation frequency)纳入了分析框架。作者们问了一个简单的问题:对居住在 A 地的居民而言,一个特定时间 T 内,一共有多少人会访问 i 地 n 次。
图1. 人数出行的频率和距离的普遍模式
通过对全球五个不同地区的超过 800 万名匿名手机用户的位置数据进行分析,作者们发现,一个地点的访问人数与居民的居住地到该点的距离的平方成反比 r-2,同时与访问频率的平方成反比 f-2。进一步,我们可以将两点间的访问人数用如下公式表示:
(1)
其中, ρi(r, f) 代表到 i 地居住地距离为 r 的居民一定时间内访问 i 地 f 次的人数,系数 μi 代表一个地点的吸引力(attractiveness)。通过对多个城市的大规模数据集的分析,可以得到 η≈2(图2)。
为了确保结果的普遍性,研究人员收集了2006-2013年间五个不同的手机数据集来进行验证。使用的手机数据集涵盖了四大洲的7个城市:波士顿(北美洲)、新加坡(亚洲)、达喀尔(非洲)、阿比让(非洲),以及葡萄牙的里斯本、波尔图和布拉加(欧洲)。这些城市人口、地理位置、文化、气候等条件差异很大,但分析结果全都指向了相似的规律(图3)。
论文共同作者之一Geoffrey West从“能量守恒”的角度评论该发现:人们选择出行的距离和出行的次数,其实是在做最优化。人类在出行中分配的平均能量是相同的,即便他们尝试了不同的距离或频率。
作者们进一步分析了地点吸引力的空间分布。通过使用简单的城市聚类算法(city clustering algorithm),作者们发现,城市中地点吸引力的大小分布符合 Zipf 法则,也就是说,城市中会有一个大的中心组团,还会有许多小的组团,这些组团的面积分布是一条斜率为 -1 的直线(图4)。
为了解释上述发现,作者们在经典的偏好返回模型(exploration and preferential return, EPR)中加入了“偏好探索”机制,提出了一个新的模型 PEPR(preferential exploration and preferential return)。简单来讲,在新的机制下,人们之间的出行行为不是独立的,而是相互影响,人们倾向于探索其他访问者都喜欢的地方。通过 PEPR 模型,作者们成功的复现了“距离-频率”规律,同时也得到了符合 Zipf 法则的城市空间结构。详情的建模过程与模拟参数可参考论文原文。
3. 对城市人口出行模式预测的意义和应用
在应用层面,该文提出了名为 rf-scaling(距离-频率标度)的分析框架。利用该框架,站在大都市的任何一个广场上,都可预估眼前人群中有多少人来自1、2或10公里以外,有多少人每个月来1次、2次或10次。
根据该论文的研究,任何地点的访问者数量,都与他们的访问频率和出行距离乘积的平方呈反比关系,访问频率提高或出行距离增加,相应访问者数量就会减少。这与引力模型有相似之处。就像大行星的引力一样,一个拥有精美博物馆和著名商店的城市广场,会吸引更多来自更远地方的游客。这些“外地游客”的往来尽管不像家住附近的游客那么频繁,但其数量比例是由模型决定的(图5)。
试想一下,在面临因新冠而封城时,该研究得出的规律将有助于政策制定者预估不同选择所带来的社会和经济影响,不同地区对人流管控的强度(比如可以控制出行距离,也可以控制出行频率),也应有相应区别。
该研究还可以帮助实现“15分钟城市”的概念——重组适于步行的社区周围物理空间。因为按照出行模式,我们可以知道15分钟的步行范围内,人们出行的距离、频率、空间分布之间的相互关系,这有助于我们针对性的进行社区空间的规划与设计。
“频率是人类出行规律的关键因素,这是该研究带来的主要启发”。值得注意的是,该文提出的出行规律是针对居住地为“锚点”进行分析的,对于任意两点(如远郊区、甚至是城市之间的出行)这一规律是否存在,尚有待更高时空分辨率的数据进行验证。
图7. 其中山峰高度代表特定地点的吸引力
图6、图7来源见可感知城市实验室针对本论文制作的可视化网站:
https://senseable.mit.edu/wanderlust/
相关数据和代码:
https://github.com/leiii/VisitationLaw
1. https://www.vice.com/amp/en/article/epnzkm/millions-of-peoples-location-data-revealed-a-universal-pattern-in-study
复杂科学最新论文
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅: