地理流的空间模式:概念与分类

编者按

地理流已经成为研究位置之间地理对象流动特征的重要概念模型和分析工具。本文提出四元组正交模型以及对应的极坐标模型对流进行表达,并在此基础上定义了流的距离,推导出了流的r邻域体积、流的密度等测度表达式。针对流可能出现的各种空间模式,本文根据流的极坐标模型中不同变量之间随机性、排斥性与异质性的组合将其进行系统划分,并给出了随机、丛集、聚散、社区、并行以及等长6种常见模式的表达形式与主要特征。相对于时空点集,由于流具有时空高维、特殊时空结构的特点,其模式远比点模式复杂,且类型更多,从而衍生出一系列多元模式和复合模式。也正基于此,流的模式挖掘也才具有宽广的研究空间。

本文的研究结果可用于分析城市中的人流、交通流、信息流,也可以作为人文地理中“流空间”的理论分析工具

(点击文末阅读原文,可进入学报官网下载全文。)

《地球信息科学学报》

一个系统中物质、信息、能量等在不同空间位置之间的移动或交换形成地理流(Geographical Flow),如城市区域之间的职住流、手机用户之间通话的信息流以及不同位置商业实体之间的资金流等。网络时代的到来,位置之间各种流的出现与强化,改变了以距离衰减效应为基本规律的传统空间认知,距离不再是解释空间相关的唯一测度(例如,因为轨道交通,与某人住处关系更紧密的可能是远处的工作地,而非周围的场所)。各种流的存在重新塑造着地理空间格局,并成为推动地理系统演化的关键因素。

英国伦敦出租车OD流

(来源https://uclab.fh-potsdam.de/)

地理流(后文简称为流)可抽象为包含起点(O)和终点(D)的概念模型。相关研究多从空间统计的角度对流的模式展开讨论,但仍然局限于以位置为基础、欧氏距离为测度的位空间中(即位置空间,位空间的基础单元是点),其不足之处在于:①流在研究中仍然被当作是欧氏空间的点对,因而在计算中难以形成统一的计算体系;②对流的模式仅有异质性与随机性的讨论,而由于流的多维属性、时空耦合等特征,其模式较点更为复杂,应该进行详细的分类,形成系统的研究体系。

针对地理流的研究有助于理解地理系统的格局与功能,弄清地理系统演化的动力学机制,故而将成为地理格局与机理分析的新视角。为此,本文突破传统的理论框架,试图构建新的流空间概念与分析框架,并对流模式分类进行较为系统的探讨。

现有的空间统计模型大多基于欧氏空间及其概念,难以直接用于流数据的分析与计算。例如,AB两地之间的交通流量大是指拥有相同起、终点(即AB两地)的交通流形成聚集,而并非只是起点聚集或终点聚集或二者之和,故必须构造一个新的空间,将流作为整体对象进行研究。因此,本文首先给出流空间的定义,再对流模式的概念进行阐述,并对其进行分类与描述。

如果仅考虑空间信息,流可以用由起点(O)和终点(D)组成的有序点对多元组表达。令O点坐标为(x(O),y(O)),D点坐标为(x(D),y(D)),则流F可表示为(x(O),y(O)),(x(D),y(D))。因此,流可看作为一个四维对象,而以流作为基本元素构成的空间则称为流空间。流空间是一个四维空间,但由于流的O点和D点有明确的地理含义,即流事件发生的起点和终点,因而不能简单把流空间看成四维欧氏空间。为了方便对流空间的四维特征进行刻画,同时又不割裂流的地理内涵,可用两个二维平面的笛卡尔积(R2×R2)的形式定义流空间。

流空间中流及其邻域

根据流及流空间的定义,可以定义流的距离、流的方向、流的邻域的体积和流的密度等用于描述流的空间分布特征的基本指标。其中,流的距离由流的O点和D点之间的距离(图3)组合(如加和、平均等)确定,流的方向指从流的O点到D点的有向连接的方向,流的邻域的体积指以一条流为中心、半径为r的邻域在流空间中对应的体积,而流的密度指流空间中单位体积内流的数目。

流之间的距离

空间点的分布模式主要可分为3种:丛集、随机和排斥。一个空间点集必定是上述3种模式的组合。如果采用起点、角度、长度的方式表达流,则其中3个因子也同理分别可以表现为以上3种模式,而3个因子的3个模式组合可以得到27种流模式。在这27种模式中,具有地理意义且较为常见的模式有以下6种:随机(起点随机、方向随机、长度随机)、丛集(起点丛集、方向丛集、长度丛集)、聚散(终点或起点丛集、方向随机或排斥、长度任意)、社区(起点丛集、方向任意、长度丛集)、并行(起点随机、角度丛集、长度任意)与等长模式(起点随机、角度随机、长度丛集)等。流的模式分类为流的空间分析提供了理论框架,在流模式挖掘时,可以这6种模式为目标进行模型设计(限于篇幅,下文仅对前4种进行说明)

流空间模式分类
流的随机模式是指流的O点和D点呈随机分布,且OD点之间的连接随机(上图(a))。目前针对流的随机性的判别方法包括K函数和流向量相关性等方法。当流不满足随机性时,则表现为异质性,而异质性的模式较多,接下来进行具体描述。
流的丛集模式是流异质性模式中一种常见的情形,表现为O点和D点同时聚集(上图(b))。通过识别流的丛集模式可以发现地理对象共同的移动特征以及地理位置之间的密切交互关系,如城市中不同功能区之间的通勤流等。流的丛集模式可以通过流聚类方法发现。流聚类方法的思想是对传统点过程数据聚类方法的扩展。通过重定义流的距离、密度等指标,实现流的聚类。目前流的聚类方法大体可以分为流的层次聚类、流的密度聚类以及流的时空统计聚类方法。
聚散模式包括汇聚模式和发散模式。汇聚模式可定义为流的终点丛集而角度随机或排斥;而发散模式则相反,如上图(c)所示。在现实世界中,这种模式通常对应着人流、物流、信息流、资金流等向某一区域集中流入或者从某一区域溢出。挖掘这种模式有助于发现局部城市中心、交通异常区域、公共资源服务范围等模式,从而为城市规划、公共设施选址等应用提供支撑。流聚散模式的挖掘方法主要可以分为2大类:①将流聚合到一定节点单元(如栅格、小区)中,然后根据其流入、流出量进行判断;②将流作为独立的个体,然后根据其O点和D点的分布特征判断其模式。
流的社区模式是指流集中分布在不同的局部区域内,不同局部区域之间无交互或交互较少的规律性空间分布如上图(d)。社区流模式可以体现在不同的尺度上,在大尺度上,通常表现为人口的流动,其社区通常与行政边界吻合度较高;在小尺度上,城市内部出租车的OD分布也会表现出一定的社区特点,出租车司机的运营范围通常会与其住址密切相关。目前流社区模式的挖掘主要采用复杂网络的分析方法。

前述均为流的单一模式,而单一模式相互组合还可以产生混合模式。例如,丛集模式与聚散模式组合,形成丛集—聚集模式或者丛集—扩散模式。这种模式的典型例子是交通枢纽及不同枢纽之间的出租车OD流(丛集模式由交通枢纽之间的出租车OD流形成,而聚散模式又由交通枢纽与周边区域的客流形成)。

社区模式与聚散模式可以形成社区—聚散模式。这种模式可以表现为学区内的学生产生的家庭—学校的上下学流。

丛集模式也可以和社区模式结合,形成丛集—社区模式,该模式可以表现为城市功能区内部热点之间的出租车流。

当不同类型的流共存时,可能形成多元流模式。以数据中存在2种类型的流为例,它们之间的模式主要表现为3种:相关模式、排斥模式和独立模式。

相关模式是指在一定空间邻域范围内2种流频繁成组出现的现象。流的相关包括正相关和负相关。其中,流的正相关是指成对出现的流的O点与O点邻近、D点与D点邻近,流的负相关则相反。

排斥模式是指一种流的局部范围内不存在或者较少存在另一种流的模式。

独立模式是指两种流之间的分布独立,即任意一种流在局部范围内的出现不以另一种流的出现为先决条件。

对于多元流的相关、随机与排斥模式,均可以采用从点的cross K函数扩展而来的流的cross K函数进行判别。

实例:流的丛集模式提取

针对上述流模式中的丛集模式,相关研究提出了流密度域分解的概念,并以此为基础提出了一种对任意形状的流丛集进行聚类的方法。该方法的思想是:针对一个流数据集,首先计算其中流的k接邻近距离,得到流的k阶邻近距离的直方图,随后根据期望最大化(EM)算法得到不同流簇的分布参数,最后将这些参数作为密度聚类算法DBSCAN的输入,对流数据集进行聚类,以提取流数据集中的丛集模式(模型流程图如下)。

流的密度域分解模型

将此模型用于北京市出租车OD流丛集模式的提取,结果如下图所示。根据流O、D点的时间和所在位置的城市功能等信息,图中的流丛集可以分为三类,即通勤流丛集(下图a和b)、返程流丛集(下图c和d)、节假日出行流丛集(下图e中的国庆旅游出行流和f中的清明节八宝山扫墓出行流)。

北京市六个不同研究区出租车OD流丛集

此实例详细内容已发表,引用格式为:

Song C, Pei T, Shu H. Identifying flow clusters based on density domain decomposition[J]. IEEE Access, 2019, 8: 5236-5243.

原文请到中国知网下载

作者简介

中国科学院地理科学与资源研究所研究员,博士生导师,资源与环境信息系统国家重点实验室副主任,中国科学院大学岗位教授,近年来主持国家重点研发项目等10余项,研究兴趣为地理大数据挖掘。

《地球信息科学学报》是由中国科学院地理科学与资源研究所和中国地理学会联合主办,由中国科学院资源与环境信息系统国家重点实验室、虚拟地理环境教育部重点实验室(南京师范大学)、三维信息获取与应用教育部重点实验室(首都师范大学)共同协办的学术期刊。学报为月刊,是中国科学引文数据库(CSCD)核心期刊、中国科技核心期刊、全国中文核心期刊、北大《中文核心期刊要目总览》来源期刊。《2018年版中国科技期刊引证报告(核心版)》显示,《地球信息科学学报》影响因子位列测绘科学技术期刊第3名,综合评价总分位列第4名。

欢迎国内外学者踊跃赐稿,欢迎国家重大科研项目、国内外学术会议组织专辑专栏。

官网网址

http://www.dqxxkx.cn/CN/1560-8999/home.shtml

联系电话

010-64888891

邮 箱

dqxxkx@igsnrr.ac.cn

策划创意:耿艳辉

编辑:耿艳辉,舒华

制作:D+工作室

校对:黄光玉,蒋树芳

(0)

相关推荐

  • 综述 | Trends in Microbiology:微生物生态学的空间、时间和系统发育的尺度

    编译:Frank,编辑:小菌菌.江舜尧. 原创微文,欢迎转发转载. 导读 生物群落在疾病.生物地球化学循环.农业和生物修复中起主要作用.但是,确定控制微生物群落组装的生态过程并明确这些过程的相对影响具 ...

  • 能源的概念和分类

    风力发电 一.能源的概念 自然资源(能源)指在一定时期和地点,在一定条件下具有开发价值.能够满足或提高人类当前和未来生存和生活状况的自然因素和条件,包括气候资源.水资源.矿物资源.生物资源和能源等. ...

  • 【地理技巧】高考地理微专题答题模式-风向、风力、风能

    【地理技巧】高考地理微专题答题模式-风向、风力、风能

  • 层析技术(色谱法,Chromatography)概念、分类和操作

    层析技术概述 引言 层析法又称色层分析法或色谱法(Chromatography),它是在 1903~1906年由俄国植物学家M. Tswett首先提出来的.他将叶绿素的石油醚溶液通过CaCO3管柱,并 ...

  • 不懂就问!殡葬业相关基本概念及分类

    不懂就问!殡葬业相关基本概念及分类

  • 检出限的概念、分类、计算方式及影响因素!

    检出限是分析测试的重要指标,对于仪器性能的评价和方法的建立都是重要的基本参数之一.在日常检测过程中,检出限为具体量度指标,特别是在痕量分析中,痕量分析误差与样品含量相对于检出限的倍数相关联.检出限的确 ...

  • 闲聊 | 基建投融资模式的四大分类

    说起基建投融资的模式,那真是琳琅满目,BT.PPP.特许经营.EOD.综合开发.F EPC.REITS.ABO.政府购买服务.基金认购......其实很多时候都是混用了的,比如,ABO真的是一种投融资 ...

  • 高中地理许多组易混概念辨析

    易混概念一 天体与天体系统 天体--宇宙中各种物质存在的形式,如恒星.行星.小行星.流星体.彗星.星云等都属于天体. 天体系统--运动着的天体之间相互吸引和相互绕转所构成不同等级,构成天体系统至少要有 ...

  • 低吸模式的技术细节分类

    低吸作为一种交易模式,是相对于追涨及打板而言. 这几种交易模式总体来说没有高低之分.就如刀和剑一样.本身没有高下之分.差别只体现在用刀用剑的人手里.剑在萧秋水.刀在傅红雪手中,就是惊天地泣鬼神.风云变 ...

  • 曹宏鑫等:农业模型概念、分类和建立过程

    本文节选自: 曹宏鑫, 葛道阔, 张文宇, 张伟欣, 曹静, 梁万杰, 宣守丽, 刘岩, 吴茜, 孙传亮, 张玲玲, 夏吉安, 刘永霞, 陈昱利, 岳延滨, 张智优, 万倩, 潘月, 韩旭杰, 吴菲. ...