文章快速检索     高级检索
  人文地理  2019, Vol. 34 Issue (3): 108-117  DOI: 10.13959/j.issn.1003-2398.2019.03.015
0

引用本文  

赖建波, 潘竟虎. 基于腾讯迁徙数据的中国“春运”城市间人口流动空间格局[J]. 人文地理, 2019, 34(3): 108-117. DOI: 10.13959/j.issn.1003-2398.2019.03.015.
LAI Jian-bo, PAN Jing-hu. SPATIAL PATTERN OF POPULATION FLOW AMONG CITIES IN CHINA DURING THE SPRING FESTIVAL TRAVEL RUSH BASED ON "TENCENT MIGRATION" DATA[J]. Human Geography, 2019, 34(3): 108-117. DOI: 10.13959/j.issn.1003-2398.2019.03.015.

基金项目

国家自然科学基金项目(41661025);西北师范大学青年教师科研能力提升计划(NWNU-LKQN-16-7)

作者简介

赖建波(1993-), 男, 四川眉山人, 硕士研究生, 主要研究方向为空间经济分析。E-mail:ljb2244@yeah.net

通讯作者

潘竟虎(1974-), 男, 甘肃嘉峪关人, 博士, 教授, 主要研究方向为空间经济分析。E-mail:panjh_nwnu@nwnu.edu.cn

文章历史

收稿日期:2018-09-26
修订日期:2019-01-01
基于腾讯迁徙数据的中国“春运”城市间人口流动空间格局
赖建波 , 潘竟虎     
西北师范大学 地理与环境科学学院, 兰州 730070
提   要:“腾讯迁徙”大数据基于位置服务,实时、动态、完整、系统地描述了用户日常出行活动的轨迹。通过采集“腾讯迁徙”数据平台中2018年春运期间中国346个地级及以上城市之间的逐日人口流动数据,分“节前、节中、节后”3个时间段,利用复杂网络分析方法,从人口流动的集散层级、集散体系分层集聚特征、人口流动空间格局、网络空间特征等角度分析各时间段城市间的人口流动特征与空间格局。结果表明,腾讯迁徙大数据直观地揭示了春运期间中国城市间人口流动空间格局,3个时段人口的净流入均呈现十字形骨架支撑的菱形分布,人流集散中心主要集中在京津冀、长三角、珠三角和成渝4大城市群,与城市等级有较强的一致性。人口流动集散体系呈明显的分层集聚,城市行政级别的高低与人口流动影响力存在一定的正相关关系,大部分城市人口流动处于“相对平衡”状态。人口流动网络呈现东密西疏的分布特征和东部并联、西部串联的网络关联特征。人口流动网络局部具有较明显的“社区”结构特征,聚为3个大区级、5个跨区域级和1个地区级社区。
关键词人口流动    网络分析    腾讯迁徙    城市网络    春运    
SPATIAL PATTERN OF POPULATION FLOW AMONG CITIES IN CHINA DURING THE SPRING FESTIVAL TRAVEL RUSH BASED ON "TENCENT MIGRATION" DATA
LAI Jian-bo , PAN Jing-hu     
College of Geography and Environmental Science, Northwest Normal University, Lanzhou 730070, China
Abstract: The big data of "Tencent Migration" is attained based on LBS(Location Based Services) technology that records the daily flow trajectory of the population between cities in a full, dynamic, instant and intuitive manner. Through collecting daily mobility data of 346 cities during the 2018 Spring Festival travel rush on the "Tencent Migration" data platform, the three time periods. i.e. "travel period, journey period and return period" are marked, and via the complex network analysis methods, from the perspectives of the distribution level of population flow, this paper analyzed the layered clustering of the distributed network system, the spatial pattern of the population flow and the spatial characteristics of the network, the daily flow characteristics and spatial pattern of the population in different time periods. The main conclusions are as follows:"Tencent migration" big data clearly discovers the temporal-spatial pattern of population mobility and structural characteristics of city network in China during the period of Spring Festival travel rush. The net inflow of population showed a diamond shaped with cross frame support in each period, the four nodes of the diamond contain Beijing, Shanghai, Guangzhou and Chengdu-Chongqing.
Key words: population mobility    network analysis    Tencent migration    urban network    Spring Festival travel rush    
1 引言

网络是抽象描述复杂联系而又相互交织的客观世界的一种载体,通常使用“网络图”来表达网络内容,网络图由抽象的节点(nodes)和连接节点的边(edges)组成,借助网络的定义,事物之间繁杂零乱的结构关系被抽象化、简单化处理[1]。随着研究理论、研究方法的发展,网络和(或)网络化的研究视角纷纷被引入到地理学研究中。伴随着全球化和信息化的深入推进,城市不再被视为孤立的个体,城市间的网络关系渗透到原有的地理空间结构中,在不同空间尺度下重构了不同等级城市相互联系的网络型空间组织结构,由行政区划主导的城市等级空间趋向于转变为关系网络化的功能空间[2-4]。城市网络是大、中、小城市间构成的水平和非层级性的联系,以及相互流动的网络体系[5]。城市联系从静态空间跨越到“流空间”,城市愈来愈多地深度参与大区域网络内的要素迁移,“城市网络”的概念由此应运而生,体现为突破行政界限的新型功能关系,这大大扩展了城市地理学和经济地理学的研究视野。

在实体的基础设施与虚拟的网络交织下,催生出“流动空间”这种新形式,而“地方空间”与“流动空间”的共存便推动了地域空间由等级化发展为网络化,引致城市(区域)空间形态乃至功能和发展模式的变革,促使城市空间组织形式从静态、闭塞、强行政等级的中心地模式转变为多中心、扁平化、强流动性的网络结构[2]。在上述新形势下,秉持规模、等级分布中心思想的传统中心地理论显然难以诠释,城市地理、经济地理的研究范式不可避免地寻求“网络化”转向,学者们从关注城市等级规模体系逐渐转变为聚焦多尺度城市网络的结构、功能及联系。卡斯特尔(Castells)和泰勒(Taylor)等相继提出了“流空间”和“中心流”的理论,试图补充完善传统中心地理论的不足[6, 7]。人口流动被认为是生产要素重新在空间上进行配置的一种活动,人口在特定空间范围内迁徙和移动,一定程度上推动了社会、经济要素的重新集聚与扩散[8]。人口流动带动着社会经济、城市交通、地域文化等要素在空间上进行流通,是一个社会和民族的生机与活力所在,流动人口的产生与增长在加快城乡经济发展、促进城市化进程、推动产业结构升级、优化劳动力资源的地域配置等方面发挥了重要作用。随着中国改革开放政策的实行和城市化的快速推进,人口在东中西区域间大规模迁移,成为中国乃至世界范围内意义最为深远的地理过程之一。从网络的角度来看,若将城市视为网络中的节点,那么人口的迁移恰似网络的流要素载体,通过人口的流动,在各城市间传递物质流、资本流、信息流和技术流,推动了区域内生产要素在网络中快速流动和优化,基于城市视角的人口流动网络研究,可以借助复杂网络中的多种指标来评测人口流动网络,进而分析人口迁徙的模式与机制。已有人口流动网络体系研究多采用静态数据,如人口普查数据与人口抽样调查数据等,这些数据虽然可以表明城市节点对于整个网络的重要性,但是无法体现区域间人口的日常大规模流动,更无法以流空间的视角分析城市间日益复杂的相互作用关系[9],在时效上自然也会出现滞后性问题。进入移动互联网时代,随着遥感RS、全球定位系统GPS、基于位置的服务LBS、位置分享服务LSS等技术愈加成熟,可以通过这些技术挖掘用户的地理位置、个性偏好、出行路径、活动痕迹、社交方式等信息,揭示用户的日常时空行为,网络大数据日益成为反映大众从事社会活动的重要手段。常用的大数据源大致分为3类:一是基于网络数据挖掘获得的含有位置信息的社交网络数据,如国外的Twitter、Four Squares社交网站签到数据,国内的新浪微博签到、点评网、百度贴吧等[10-12];二是借助GPS(Global Positioning System)、LBS(Location Based Services)等设备以及移动通信数据,采用网络日志或GIS采集和分析居民空间行为数据;三是通过政府部门公开的数据平台获取的数据,如12306网站的购票信息、公交系统的刷卡数据、航班运输数据等交通出行行为大数据。这些地理行为大数据来源多样,实时性强,较为客观,便于分析预测,恰恰弥补了常规调查手段(如问卷、抽样、普查等)的缺陷,可为人口流动研究提供充足和较高时空精度的实测流数据。

中国春运由于其流动规模的特殊性,堪称“全球罕见的人口流动”,是人类历史上的规模最大的、周期性明显的大迁徙。春运这一现象是中国特有的传统文化与社会结构共同作用的结果,具有显著的规律性、集中性、广泛性。2018年春运期间(官方时间段为2018年2月1日至2018年3月12日,共计40天)全国旅客发送量约29.7亿人次,春运时段长、流动人口结构复杂(学生流、返乡流、务工流、旅游流)、流动规模庞大。Wei、蒋小荣、刘望保、赵梓渝、赵落涛、Li等学者利用百度迁徙数据研究了春节期间人口的流动特征[13-18]。魏冶等通过百度迁徙的春运人口流动分析了转型期的中国城市网络特征[19]。赵梓渝等利用百度迁徙获取的春运人口流动网络,研究了中国城市网络的转变中心性与控制力[20, 21]。本文采用腾讯位置服务获取到2018年春运期间346个行政单元的人口流动数据,建立人口流动分析网络,采用网络分析手段研究了中国人口流动的特征和空间格局,弥补了仅凭宏观统计数据无法揭示人口在流出、流入地区之间集聚与扩散结构特征、空间差异等缺陷,为研究人口流动提供了新的视角。同时,本文采用的腾讯大数据较之百度等人口迁徙数据,具有样本量更大、数据多源、精度更高和分析预测性强等优势,丰富了城市人口流动网络方面的研究;实践上,本文可为引导人口合理流动和区域城镇体系的规划提供科学参考。

2 数据来源与研究方法 2.1 数据来源及研究对象

LBS是指借助网络运营商提供的无线电通讯网络,或者通过外部定位方式,采集移动终端用户的空间位置(如地理坐标),向用户提供与位置服务相关的增值业务。在智能手机日益普及的背景下,当人们允许各类平台的手机应用程序APP调用LBS服务时,即可通过定位信息刻画出用户的移动轨迹。个体在地理空间中的移动表面看似无规律可循,如果在一个较大规模的人群中分析,其迁徙却可能隐含着某种特定的模式。来自2017年《中国移动互联网发展报告》的统计,截止2016年末,全国正在使用的手机号码数多达12.47亿,活跃的智能手机达23.3亿部。现今,智能手机遍及全国,每个持有智能手机的用户都可以看作一个感知社会的移动传感器,实时地收集着海量的个体迁徙信息。

中国著名的互联网公司(百度、新浪、腾讯等)目前都向用户提供空间定位服务。本文数据即取自腾讯公司数据平台。腾讯被认为是中国最有影响力的互联网公司之一,其业务涵盖游戏、社交、通信等多个领域,根据腾讯公布的2018年第一季度财报,截至2018年3月31日,其微信的月活跃用户数达10.4亿,QQ和QQ空间的月活跃用户数则分别为8.05亿和5.62亿,腾讯的微信、QQ、京东、摩拜共享单车、滴滴出行、新美大等多个产品均提供位置服务,每天接受多达550亿次的定位调用请求,几乎覆盖了所有的智能手机用户。基于此,腾讯位置大数据在进行人口流动研究方面具有典型的代表性。2015年春运期间,腾讯发布了腾讯全国春运出行热度数据平台(https://hot.qq.com/qianxi),2016年该平台网址更换为(https://heat.qq.com/qianxi.php,下文简称为腾讯迁徙)。数据精度可以达到个人层级,弥补了铁路、公路、航空、水运等单一运输模式所带来的数据和结果的片面性,可以得到城市间人口流动的综合判断。

本文以中国346个地级及以上行政单元(下文简称地级市)为研究对象,由于数据缺失,台湾省所辖城市和海南省三沙市未纳入分析。通过腾讯迁徙获取到40天346个城市前十位迁入、迁出的人口流动数据,作为构建城市网络的依据。为了分析在春运不同时间段人口流动规模和结构的差异,本文将研究时段划分为节前、节中和节后3个阶段。行政区界线、城市位置等数据获取自国家基础地理信息中心1 : 400万数据库,文中地图基于原国家测绘地理信息局标准服务网站下载的审图号为GS(2016)2885号标准地图制作,底图无修改。

2.2 研究方法

利用复杂网络分析方法,构建表征人口一日内流动的双向矩阵L =(Lij),Lij为城市i到城市j的人口流强度,基于腾讯迁徙数据构建40个346×346的有向加权非对称矩阵:

(1)

如果用总流动规模TF测度某个城市人口集散的总强度,用净流入规模JI测度接受和输出人口规模的差异,那么城市i在一天内人口的总流动和净流入值可计算如下:

(2)

式中:Ri为人口的城际流动矩阵,RiTRi的转置矩阵。

本文借助复杂网络分析方法来研究城市网络特征。复杂网络是一种具有小世界性以及无尺度(scale-free)性的网络,介于完全规则网络与完全随机网络之间。现实世界中的人口迁移网络常常也具有小世界性和无尺度性的特征,常用的网络分析指标如下[22]

(1)度:度即表征网络结构中与某节点相连通的边的数量,在有向网络中度分为出度(out-degree)与入度(indegree)两个概念。

(3)

式中,Wm_i表示城市m在研究时段内总入度值,Rm_ij表示第j天内其他城市与城市m产生流入关系的路径的值。

(4)

式中,Wm_o表示城市m在研究时段内总出度值,Rm_oj表示第j天内城市m与其他城市产生流出关系的路径的值。

(2)聚类系数:描述节点的互联水平。当某些节点关系特别紧密时,即可结成一个网络社团。计算式为:

(5)

式中,Ci为聚类系数,Bi为节点到其mi个相邻节点间的路径条数。

(3)特征路径长度:路径长度指网络中任意节点对之间连接的最少边数,两节点直接连接时,路径长度为1。特征路径长度C定义为所有节点对的路径长度的平均值,常用来描述网络的全局特征:

(6)

式中,n为节点个数,aij为城市i与城市j之间的最短路径长度。

(4)PageRank:PageRank被称为网页排名,通过网络中复杂的超链接关系来评估网页等级,说明某特定网页相对于网络中其他网页的重要性程度。常应用于各类网络中寻找关键节点,如学术论文重要性排序、社会关系网等。一个网页的PR值计算式为:

(7)

式中,N为网页总数,z为阻尼系数,取值0—1,表示用户继续点击链接而不是打开其他网页的概率,Mpj是所有对pi网页有出链的网页集合,L(pj)为网页pj的出链数目。

3 结果与分析 3.1 人口流动的总体特征 3.1.1 人口净流入规模时序

由于研究对象数量多且数据量大,统一分析不利于数据和结果展示,为了便于分析,选取中国直辖市、省会城市以及香港和澳门为单元(共计33个城市),这些城市行政等级高,有着较为完善的基础设施,对人口的吸引力大,从而体现出的特征更为明显,更具代表性。绘制出2018年春运期间逐日的人口净迁入量的时间序列分布图(图 1)。由于春运周期较长,因此为更细化地分析不同时段春运的人口流动结构与特征,结合国家法定放假时间(2018年春节法定放假时间为2月15日至2月21日)、人们出行习惯(存在大部分人选择在家过完元宵节再外出工作)及净流入规模序列图揭示出的特性(在2月15日至3月2日大部分主要城市仍表现为人口净流入,即这一阶段的人口流动特征并未发生改变)等因素,将2月1日至3月12日共分为3个时间段,定义2月1日至2月14日为“节前”,2月15日(除夕)至3月2日(元宵)为“节中”,3月3日至3月12日为“节后”。分析图 1发现如下的人口流动特征:①城市人口净流入规模呈现出随时间序列的变化而发生较为规律性的变化,部分城市(如北京、上海、广州、成都、杭州、乌鲁木齐、南京、天津、福州等)在从2月1日至2月15日(除夕)时段内,净流入规模均为负值,为人口流出城市,并且这些城市人口净流入规模转为正值的时段集中在2月16日左右,称这些城市为“先减后增型”城市;另一部分城市(如重庆、贵阳),该时段内表现出人口净流入由正到负的显著转换特征,分水岭时间在2月15日左右,称这些城市为“先增后减型”城市,多为典型的劳务输出城市。②城市人口净流入和净流出峰值的出现日期有所不同。“先减后增型”城市在节前人口净流出规模呈现出逐渐增大且在达到一定峰值后逐渐降低的趋势,这些城市人口流出规模的峰值的时间各有差异,北上广人口流出规模大且持续周期长,在2月10日左右便出现人口流出峰值,而乌鲁木齐、南京、成都等区域核心城市峰值出现在2月14日前后,重庆、贵阳人口净流入强度峰值分别出现在2月9日与2月4日,这些城市人口流入峰值时间处于节前期的早中期。③大多数城市在3月2日(元宵节)左右人口净流入都出现一个“小高潮”现象,即短期内净流入增加显著。④极个别城市人口流动强度时序呈现独特的特性,如澳门在整个春运期间多数时段均处于人口流入状态,人口流出时段则分布在节中、节后期,而且各时段人口流出极值分别出现在2月14日(除夕前夕)、3月2日(元宵节)、3月11日,这一特性是由于澳门作为节假时期人们旅游、购物的重要出行目的地,极值时间也符合中国的传统文化背景与工作时间安排。

图 1 2018年春运期间各主要城市人口净流入强度时间序列图 Fig.1 Time Series Chart of Net Inflow Intensity of Major Cities During the Spring Festival Transport Season in 2018

图 2为春运期间地级及以上城市人口日均净迁入量的分级图,人口流入的方向借助图中的箭头示意,线条的粗细和颜色代表人口净流入的大小差异。图 2直观地反映了春运期间全国人口流动的总体格局:①春运期间的节前、节中和节后3个时段人口的净流入量在7.5万以上的路线在空间上呈现倒三角形的格局,三角形的三个顶点分别是拉萨、哈尔滨和广州。其中,净流入量在24万以上的路线在节前和节中空间上呈现出十字形骨架支撑的菱形分布,菱形的4个顶点分别是京津冀、长三角、珠三角和成渝4大城市群,以武汉为中心,两条纵贯南北和横贯东西的轴连接了菱形的4个顶点。有两条路线突破了菱形范围,一条是兰州—乌鲁木齐的西北线路,另一条是北京—沈阳—长春—哈尔滨的东北线路。在节后则表现为“丰”字形结构的三横一纵特征。②全国和区域尺度下均表现出了明显的核心—边缘结构,主要的人口流动路线均分布在“胡焕庸线”的东南一侧,人口流动网络呈现出东密西疏的特征,分界线以西的人口流动网络关联多表现为串联型结构,多数城市依赖于特定的门户城市与人口流动网络进行关联,而分界线以东的网络则更多为并联型结构,城市间人口流动的互通性高,总体上映射出城市空间结构呈现由极核向扁平化发展态势。③节前的人口流动强度第一层级路线总体呈现出由京津冀、长三角、珠三角等城市群的核心城市向外发散式辐射的状况。其中,京津冀城市群的辐射范围北至哈尔滨、长春等城市,南抵成都、重庆、武汉、长沙等城市,长三角城市群向西辐射至重庆、西安、贵阳等城市,珠三角城市群向西辐射至成都、重庆、昆明、西安等城市。在节中与节后期流动路线则发生了全面反转。

图 2 春运期间城市间人口流动的路线和强度 Fig.2 Route and Strength of Urban Net Immigration Flow in SFTR 注:根据原国家测绘地理信息局标准地图服务网站审图号为GS(2016)2885号的1:2200万标准地图制作,底图无修改。
3.1.2 人口集散的主要城市和主要流动路线

表 1是汇总得到的春运各时段人口集散总规模排在前10位的城市与流动路线。由表 1可知:①各时段总集散规模前十的城市所承载的集散总人数均占所有城市的集散规模之和的30%左右,较为均衡,其中节前、节中和节后的相应比重分别为30.38%、28.19%和30.34%,仅10个城市便承担着全国近三分之一的人口流动,足可见这些城市在全国的地位。②每个时段均进入前十的城市有北京、上海、重庆、深圳、广州、成都、武汉,全部是直辖市或副省级城市。这些城市行政级别高,经济发达,基础设施建设完善,是最主要的人口流动集散中心。这与刘望保等[15]利用百度迁徙人口流动数据(时间段为2015年2月7日至5月16日)确定的全国性人口集散中心大体一致。但略有差别,如本文统计的西安、成都、郑州多位于前10之列,而刘望保等统计的人口日均集散量排前10位的城市中并无这几个城市,天津在本文的3个时间段内也均未进入前10(3个时段分别位列20,18,17)。此外,在刘望保等人的研究中佛山等城市在集散排序中因为重要的中转功能多次位于前10名,但是本次研究中未进入前10名(排名16、21和18)。③单就人口流动前十路线而言,主要发生在空间跨度较大的区位上,如上海与重庆、北京与重庆、深圳与成都、北京与上海之间,由于腾讯迁徙数据更新周期为一天,一天之中完成的位置迁徙才会被采集到,这些空间跨度大的路线产生凭借的是近年来高铁、机场等设施的大力发展,未来传统的空间距离必将不再是阻碍人口流动的重要因素。④人口集散城市中东莞、苏州、贵阳、佛山、咸阳、温州等具有重要中转性和外出务工目的地的城市,承担了农民工流动的主要职能,具有很重要的集散功能,其集散层级甚至高于大部分行政等级高的城市。

表 1 春运各时间段人口流动集散层级排名前10位的城市和流动路线 Tab.1 The Top 10 Cities and Flow Routes at the Level of Population Flow and Distribution
3.1.3 人口流动集散城市分级及空间格局

图 3为各时间段中国城市人口流动集散层级空间分布,可以看出,3个时段属于集散层级最高(日均集散人口>180万)的城市数量分别是9、9和10,除成都、西安、重庆外,全部分布在中东部地区,集散人口的城市等级分布也有着明显的菱形结构,各顶点城市为人口集散重要中心城市。第二层级城市(日均集散人口82—180万)的数量3个时段分别是12、14和13,除苏州、东莞、佛山外,均为各自省份的省会城市。第三层级城市(日均集散人口28—82万)的数量在3个时段分别有80、102和61个,数量变化明显,节中相较节前数量大幅上升,其中最明显的为云南省,节前仅有昆明市为第二层级城市,而节中云南省有3个城市(大理、昭通、曲靖)进入了第三层级;江苏省增加了5个(宿迁、淮安、泰州、扬州、镇江),四川省增加了3个(宜宾、资阳、德阳),广东省增加了3个(揭阳、汕头、韶关)。节后相较于节中第三层级城市又大幅下降,其中广东省减少了7个(揭阳、汕头、韶关、清远、肇庆、茂名、湛江),江苏省减少了6个(宿迁、淮阴、盐城、泰州、扬州、镇江)。

图 3 春运各时间段中国城市人口流动集散层级分布 Fig.3 Spatial Patterns of Urban Population Flow Levels 注:根据原国家测绘地理信息局标准地图服务网站审图号为GS(2016)2885号的1:2200万标准地图制作,底图无修改。
3.2 人口流动网络结构特征分析 3.2.1 首位流分析

网络中首位流的路线表征的是网络中的一种主导关系,以牺牲数据量的方法来揭示整个网络的显著空间结构特点,反映出某城市在宏观尺度上的网络地位。统计所有城市的首位流入与首位流出路线,绘制图 4。发现以下特征:①节前,北、上、广、深、渝5个城市表现出全局控制力,这些城市的控制力和关联性已经突破了地理空间距离的限制。其中,属于高度流出的城市为北、上、广、深,以北京为例,在所有城市首位流入路线中,以北京为出发城市的有34条,而在所有城市首位流出路线中,以北京为目标城市的仅有9条。东莞、杭州、苏州、成都、佛山、宁波属于区域控制力强的城市。高度流出与较高度流出城市中除成都外,均位于京津冀、长三角、珠三角3大城市群,且均为吸纳全国流动劳动力的主要城市。值得注意的是,在丁金宏、臧玉珠等学者关于省际之间人口流动研究中,四川省往往是劳务输出大省[23, 24],而本文发现成都市在全国网络中对其他城市有着很强的吸引力。节前的高度流入城市仅有重庆市,流进重庆的首位流达到了23条,其覆盖区域包括北京、上海、杭州、宁波、福州、厦门、达州等,体现了典型的劳务输出城市特征。总体来看,中国区域中心城市的辐射强度与关联广度似乎已超越行政界线,其空间虹吸效应投射到全国;相反,有些核心城市的关联数量和强度却没有表现出与现实地位所应有的控制力,如关中城市群的核心、西北第一大城市西安,长江中游城市群的核心城市武汉,东北的门户沈阳,以及中原城市群的郑州等。②节中、节后时段内,净流入与净流出城市发生了反转,随着大量人口开始外出务工,重庆成为净流出城市,北京、上海、广州、深圳、东莞、杭州、佛山、成都、宁波、苏州等成为净流入城市,以北京为例,节中与节后以北京作为目标城市的首位流出路线为21条与16条;与此同时,中东部的许多城市由较高净流入变为流入与流出相对持平。

图 4 春运期间各城市首位流(流出、流入)与净流入规模 Fig.4 The First Flows (outflows, inflows) and Net Inflow Intensity Between Cities 注:根据原国家测绘地理信息局标准地图服务网站审图号为GS(2016)2885号的1:2200万标准地图制作,底图无修改。
3.2.2 度值分析

人口流动的方向性是人口研究中的一个重要特征,区域间进行的有向流动与区域间的交通方式、地理位置以及经济情况等都存在密切的关系。明确网络中人口流动的方向性,得到节点之间的拓扑关系是复杂网络分析的重要部分。人口在城市之间的流动存在入度与出度区别,出度值与入度值可体现出不同节点在网络中的重要性程度。整个春运期间总共存在14062条人口流动路线,承载着23.5亿人次流动,其中总流动规模超过200万人次的路线共有102条,这些路线承载的人口强度占总强度的14.6%。通过复杂网络分析软件Gephi计算出346个城市的人口流动网络度值,并得到出入度值的空间分布(图 5,采用自然断裂分级)。就总度值而言,排序第一的北京总度值为15310,排序最后一位为儋州,其总度值仅为469,即使排序第二位的重庆的总度值与北京也相差3961。所有城市总度值排序中,城市行政级别与总度值有着密切联系,网络中若某节点的总度值高,则其在网络中的地位就高。总体而言,网络总度值呈现直辖市>副省级城市>普通省会城市>其他地级市的趋势。4个直辖市总度值的均值(10360)是副省级城市均值(4348)的2.4倍,是普通省会城市均值(2048)的5.1倍,是普通地级市均值(985)的10.5倍,网络地位的优势十分显著。中心城市在网络中表现出强烈的垄断效应和强势的网络管制特征。

图 5 人口流动网络的入度与出度分级 Fig.5 Classification Map of In-degree and Out-degree of Population Flow Network 注:根据原国家测绘地理信息局标准地图服务网站审图号为GS(2016)2885号的1:2200万标准地图制作,底图无修改。

为得到人口流动网络的复杂性特征,通过对城市节点的入度与出度的累计概率分布进行幂数拟合分析,幂数拟合下R2=0.9464和R2=0.9324,表明具有高的拟合度,说明该网络符合幂率分布,进一步得到入度与出度的标度指数分别为γ=1.881和γ=1.838(见图 6),低于一般复杂网络的标度指数(2—3),因此该网络节点度值具有更高的不均匀分布性(长尾分布),证实了基于人口流动的城市网络为一种典型的复杂网络,且具有无尺度性。综合出度值与入度值来看,二者有着显著的正相关关系,通过统计,有289个城市入度值与出度值之差的绝对值≤40,占总数的82.66%,这从一定程度上表明城市节点的入度与出度相对平衡,人们在城市间的流动相对自由,限制人口流动的单向障碍在多数城市并不存在。同时也有少数城市存在出度与入度的不平衡,出度盈余较大的城市有天津、哈尔滨、长春、南京、北京、南昌、温州、桂林、大连、毕节等,出度与入度值之差超过100,但是这些城市在春运期间最终都表现为人口净流入;入度盈余较大的城市有成都、深圳、重庆、广州、昆明、郑州、武汉、贵阳、杭州、海西州等,入度与出度值之差超过100,其中成都、重庆、昆明、贵阳、杭州、海西州在春运期间最终人口总体表现为净流出。由此可见若仅以度值来区别某城市在对人口流动是表现为吸引作用还是辐射作用是不全面的,人口流动强度应该被考虑进网络流动方向性中,而且人口流动强度在不同城市之间具有较大差异,最终可能会形成度值上的出度盈余城市表现为人口净流入,入度盈余城市表现为人口净流出。

图 6 人口流动网络的入度、出度累计概率分布 Fig.6 Rank Scatter Diagram of In-degree and Out-degree of Population Flow Network

春运期间全国城市人口流动的层次、等级关系较为突出,结合各城市节点总度值与其春运期间总集散人口分析,将总度值与总集散人口的平均值作为阈值,划分为高集散人口且高度值(图 7的第一象限,HH型城市)、低集散人口且高度值(第二象限,DH型城市)、高集散人口且低度值(第三象限,HD型城市)、低集散人口且低度值(第四象限,DD型城市)共4种城市等级(图 7)。第一象限城市共50个,不仅包括北京、上海、重庆、广州、深圳、成都、武汉、天津等特大城市,也包含绵阳、毕节、阜阳、周口等中小城市,这些城市或凭借交通优势、或凭借劳动力市场优势在春运期间呈现出十分重要的网络地位。第二象限城市包括哈密、西宁、吐鲁番、恩施、拉萨、呼和浩特,这些城市多为边疆、民族地区城市,并且多为区域性交通枢纽,虽然与其有联系的城市较多,但城市间人口流动强度较小。第三象限城市包括惠州、太原、达州、玉林、遵义、衡阳、廊坊、珠海、清远、三亚等,其中一些城市为HH型城市之间的重要桥接城市,线路较为单一,但是人口集散量却较为可观。三亚极为特殊,虽然位于交通网络的边缘,但由于其为冬季热门旅游城市,在春运期间吸引了大量游客。第四象限城市共有268个,约占总数的77.5%。

图 7 春运期间中国城市总度值与总集散规模散点图 Fig.7 Scatter Plot of Total Value and Total Aggregate Size of Chinese Cities
3.2.3 网页排名(PageRank)分析

在考虑人口流动强度的前提下,将PageRank算法应用于城市之间的人口流动网络计算各城市的PR值,阻尼系数为0.85,PR值高的城市在网络中重要程度高。从春运期间全国城市PR值分级统计结果来看(图 8),PR值较大的节点主要集中在东部发达地区和中西部省会城市,与Xu等利用腾讯迁徙数据研究城市发展差异中得到的城市等级较为一致[25]。具体到城市上,进入PR值第一层级的为北京、上海、重庆、成都、广州、深圳、武汉等,这些城市都为主流的一线城市;PR值第二层级的城市大致分为两类,一类为省会城市,如昆明、哈尔滨、长春、沈阳、南宁、兰州、乌鲁木齐、贵阳、长沙、济南、合肥、郑州、杭州等,另一类为分布在第一层级城市周边的城市或城市群的次核心城市,如长三角的苏州、珠三角的东莞、佛山。成都、重庆一家独大,周边缺少第二层级城市,甚至第三层级城市也较少,出现所谓的“灯下黑”现象,这一方面揭示出如成都这样的核心城市具有极强的控制力,另一方面也凸显出城市网络发展出现了“断层”,缺乏起到反磁力中心的中间节点,其结果必然导致中心城市持续膨胀,出现难以治愈的大城市病,而邻近中小城市壮大的机遇、资源持续被掠夺,成长潜力受限。

图 8 春运期间中国各城市人口流动PR值分级图 Fig.8 Classification Map of Urban PR Value 注:根据原国家测绘地理信息局标准地图服务网站审图号GS(2016)2885号的1:2200万标准地图制作,底图无修改。
3.2.4 人口流动网络的区域效应

平均聚类系数反映了网络中节点抱团的总体趋势,揭示节点嵌入邻近点的程度,聚类系数反映网络的局部特征;特征路径长度则是两节点间的平均网络距离,是网络的全局特征。依据公式(5)计算各个城市的网络聚类系数,得到全国城市间人口流动网络的平均聚类系数为0.44,说明网络具有较高的聚集度。采用公式(6)计算得到整个网络的特征路径长度为1.903,反映出整个网络节点不用通过第三方节点而直接相连的线路与仅需一个中介节点就能相连的线路占总线路的绝大部分,网络在整体上易达性与运行效率较高。计算各节点的聚类系数,发现聚类系数与度值之间存在一定的反向关系,如北京、成都、上海、重庆等拥有高度值的城市,其聚类系数都处于低值,而澳门、东营、滨州、阳江等低度值的城市,其聚类系数均处于高值。由此可知网络中低度值节点更倾向于与高度值节点相连,致使自身的聚类系数亦趋于高值。

复杂网络中通过聚类系数与特征路径长度共同评判是否网络中存在小世界特性。如果网络的平均聚类系数显著高于相同数量节点生成的随机网络,并且网络的特征路径长度与随机网络接近,那么此网络被认为具有小世界特性[26]。本文得到的网络平均聚类系数为0.44,远高于同节点数量下随机网络的聚类系数,同时其特征路径长度(1.903)与随机网络下的路径长度(1.871)较为接近,从而表明城市之间人口流动网络具备小世界特性。由于网络中存在集群特性,可以利用Gephi的Modularity功能来划分社区。利用Fast Unfolding聚类算法进行社区界定,Fast Unfolding通过迭代不断划分社区,其目标是划分后网络的整体模块度持续增大,直到网络中的结构不再改变,终止迭代[27]。模块度值越大,则表明社区的划分效果越好。本文在进行多次设置解析度后,最终选取模块度值最大情况下的社区划分结果,得到春运期间人口流动网络共包含9个社区结构,尽量保持省级行政区的完整性。根据社区所含城市数量及空间覆盖情况,可将社区类型分为3个大区级(由4个及以上空间相连接的省区构成)、5个跨区域级、1个地区级社区。大区级社区包括由北京、天津、沈阳、呼和浩特等78个城市构成的北方社区,由广州、深圳、南宁、长沙等51个城市构成的南方社区,以及由兰州、西宁、银川、乌鲁木齐等41个城市构成的西北社区。5个跨区域级社区包括西南—海南社区、湖北—云南社区、晋陕—福建社区、浙赣—贵州社区、苏皖—重庆—港澳社区。相同社区内城市之间联系较为密切。由图 9可知,春运期间基于人口流动的城市紧密性仍然受制于地理空间效应。此外,这些“社区”边界与省界吻合度非常高,体现了省区内城市联系紧密的行政特征。但也有部分例外,在空间上呈跳跃性分布,同时分布在多个独立空间内,但彼此的联系较为紧密。这种情况说明春运期间基于人口流动的城市紧密性虽然也受制于地理空间效应,但是由于人口出行目的、交通方式的多样化,城市之间的人口流动已显现出克服空间摩擦的趋势。随着高铁、机场等大量基础设施的建设和普及,传统意义上的时空距离已被大大地压缩,跨越大尺度地域空间的高强度人口流动必然将成为未来发展的趋势。河南省则独立形成一个社区,其对内对外网络特征值得进一步关注。

图 9 中国城市网络社区结构图 Fig.9 City Network Community Structure in China 注:根据原国家测绘地理信息局标准地图服务网站审图号为GS(2016)2885号的1:2200万标准地图制作,底图无修改。
4 结论与讨论

“腾讯迁徙”大数据基于LBS技术,全程、动态、即时、直观地记录了城市之间的人口日常流动轨迹。通过采集“腾讯迁徙”数据平台中2018年春运期间国内346个城市之间的逐日人口流动数据,分“节前、节中、节后”3个时间段,利用复杂网络分析方法,从人口流动集散层级、集散网络体系的分层集聚、人口流动空间格局、网络空间特征等角度分析各时间段网络结构特征。主要结论如下:“腾讯迁徙”平台数据可揭示春运期间人口迁徙的规律、特征、格局,人口流动呈现出随时间演变而出现规律性变化的特征。人口净流入网络呈现菱形分布,“胡焕庸线”两侧人流路线与强度差异明显,城市网络呈现出东密西疏的分布特征和东部并联、西部串联的网络关联特征。节前与节中、节后的人口流动方向具有对称性。各时间段的人口流动集散中心有较高的一致性,各城市间在人口流动网络中的地位差异较大,城市行政级别越高,其在网络中的度值亦越高。城市之间的人口流入和流出相对自由,人口流动较为平衡。春运期间人口迁徙城市网络具有无尺度性与小世界性,根据这种集聚特性得到9个明显的“社区”结构。

本文在分析时存在一些不足,表现在:受地理行为大数据本身生成和获取的限制,在分析城市间人口日常流动时不可避免地存在有偏性、精度较低、数据不连续等缺陷。例如,尽管腾讯产品用户数以亿计,但仍存在大量未接入腾讯QQ、微信、QQ空间和第三方用户的群体,其日常流动行为可能没有被记录下来。大部分的出行路径可能被拆解,无法完整地识别用户的出行。为保护隐私等,腾讯数据本身不显示流动人口的社会属性(职业、性别、年龄),也无法获知其流迁的目的和逗留时间,尽管在春运期间以探亲为主体流动行为,但旅游、商务等其他行为无法界定开来。多源数据融合,解决网络社交性数据的有偏性和精度较低等缺陷,挖掘有用的知识,应当是下一步地理大数据深入应用的重要研究方向。本文所得到的春运期间中国人口流动城市网络结构与已有的基于其他数据(百度等)、途径(人口统计)、时段所得到的结果不尽一致,获取更多时段的案例比较,也是今后研究的视角。本文仅尝试性地探索了基于人口流动宏观特征和空间格局的城市网络结构,客流没有区分不同的交通方式。进一步探寻区域人口流动网络结构与空间组织形式,识别精细尺度的城市结构体系、剖析城市网络的内在关联模式,揭示中国城市网络的自组织等级结构特征,应当是下一步研究的重点。

参考文献
[1]
Berry B J L. Cities as systems within systems of cities[J]. Papers in Regional Science, 1964, 13(1): 147-163.
[2]
Castells M. Globalisation, networking, urbanisation:Reflections on the spatial dynamics of the information age[J]. Urban Studies, 2010, 47(13): 2737-2745. DOI:10.1177/0042098010377365
[3]
Camagni R, Capello R. The City Network Paradigm:Theory and Empirical Evidence[M]. Netherlands: Elsevier BV, 2004: 508-520.
[4]
蒋小荣, 杨永春, 汪胜兰, 等. 基于上市公司数据的中国城市网络空间结构[J]. 城市规划, 2017, 41(6): 18-26. [Jiang Xiaorong, Yang Yongchun, Wang Shenglan, et al. Spatial structure of Chinese intercity network based on the data of listed companies[J]. City Planning Review, 2017, 41(6): 18-26.]
[5]
Capello R, Nijkamp P. The city network paradigm:Theory and empirical evidence[J]. Contributions to Economic Analysis, 2004, 266: 495-529. DOI:10.1016/S0573-8555(04)66016-0
[6]
Castells M. Grassrooting the space of flows[J]. Urban Geography, 1999, 20(4): 294-302. DOI:10.2747/0272-3638.20.4.294
[7]
Taylor P J, Hoyler M, Verbruggen R. External urban relational process:Introducing central flow theory to complement to central place theory[J]. Urban Studies, 2010, 47(13): 2803-2818. DOI:10.1177/0042098010377367
[8]
De Haas H. Migration and development:A theoretical perspective[J]. International Migration Review, 2010, 44(1): 227-264. DOI:10.1111/j.1747-7379.2009.00804.x
[9]
Liu X, Neal Z, Derudder B. Featured graphic:City networks in the United States:A comparison of four models[J]. Environment and Planning A, 2012, 44(2): 255-256.
[10]
甄峰, 王波, 陈映雪. 基于网络社会空间的中国城市网络特征:以新浪微博为例[J]. 地理学报, 2012, 67(8): 1031-1043. [Zhen Feng, Wang Bo, Chen Yingxue. China's city network characteristics based on social network space:An empirical analysis of Sina micro-blog[J]. Acta Geographica Sinica, 2012, 67(8): 1031-1043.]
[11]
郑思齐, 张晓楠, 宋志达, 等. 空气污染对城市居民户外活动的影响机制:利用点评网外出就餐数据的实证研究[J]. 清华大学学报:自然科学版, 2016, 56(1): 89-96. [Zheng Siqi, Zhang Xiaonan, Song Zhida, et al. Influence of air pollution on urban residents' outdoor activity:Empirical study based on dining out data from the Dianping website[J]. Journal of Tsinghua University (Scoial & Technol), 2016, 56(1): 89-96.]
[12]
邓楚雄, 宋雄伟, 谢炳庚, 等. 基于百度贴吧数据的长江中游城市群城市网络联系分析[J]. 地理研究, 2018, 37(6): 1181-1192. [Deng Chuxiong, Song Xiongwei, Xie Binggeng, et al. City network link analysis of urban agglomeration in the middle Yangtze River basin based on the Baidu Post Bar data[J]. Geographical Research, 2018, 37(6): 1181-1192.]
[13]
Wei Y, Song W, Xiu C L, et al. The rich-club phenomenon of China's population flow network during the country's Spring Festival[J]. Applied Geography, 2018, 96: 77-85. DOI:10.1016/j.apgeog.2018.05.009
[14]
蒋小荣, 汪胜兰. 中国地级以上城市人口流动网络研究——基于百度迁徙大数据的分析[J]. 中国人口科学, 2017(2): 35-46. [Jiang Xiaorong, Wang Shenglan. Research on China's urban population mobility network:Based on Baidu migration big data[J]. Chinese Journal of Population Science, 2017(2): 35-46.]
[15]
刘望保, 石恩名. 基于ICT的中国城市间人口日常流动空间格局——以百度迁徙为例[J]. 地理学报, 2016, 71(10): 1667-1679. [Liu Wangbao, Shi Enming. Spatial pattern of population daily flow among cities based on ICT:A case study of "Baidu Migration"[J]. Acta Geographica Sinica, 2016, 71(10): 1667-1679.]
[16]
赵梓渝, 魏冶, 庞瑞秋, 等. 中国春运人口省际流动的时空与结构特征[J]. 地理科学进展, 2017, 36(8): 952-964. [Zhao Ziyu, Wei Ye, Pang Ruiqiu, et al. Spatiotemporal and structural characteristics of interprovincial population flow during the 2015 Spring Festival travel rush[J]. Progress in Geography, 2017, 36(8): 952-964.]
[17]
赵落涛, 曹卫东, 魏冶, 等. 泛长三角人口流动网络及其特征研究[J]. 长江流域资源与环境, 2018, 27(4): 705-710. [Zhao Luotao, Cao Weidong, Wei Ye, et al. A study on population flow network and its characteristics in Pan-Yangtze River Delta[J]. Resources and Environment in the Yangtze Basin, 2018, 27(4): 705-710. DOI:10.11870/cjlyzyyhj201804002]
[18]
Li J, Ye Q, Deng X, et al. Spatial-temporal analysis on Spring Festival Travel Rush in China based on multisource big data[J]. Sustainability, 2016, 8(11): 1184. DOI:10.3390/su8111184
[19]
魏冶, 修春亮, 刘志敏, 等. 春运人口流动透视的转型期中国城市网络结构[J]. 地理科学, 2016, 36(11): 1654-1660. [Wei Ye, Xiu Chunliang, Liu Zhimin, et al. Spatial pattern of city network in transitional China based on the population flows in "Chunyun" period[J]. Scientia Geographica Sinica, 2016, 36(11): 1654-1660.]
[20]
赵梓渝, 魏冶, 王士君, 等. 有向加权城市网络的转变中心性与控制力测度——以中国春运人口流动网络为例[J]. 地理研究, 2017, 36(4): 647-660. [Zhao Ziyu, Wei Ye, Wang Shijun, et al. Measurement of directed alternative centricity and power of directed weighted urban network:A case of population flow network of China during "Chunyun" period[J]. Geographical Research, 2017, 36(4): 647-660.]
[21]
赵梓渝, 魏冶, 庞瑞秋, 等. 基于人口省际流动的中国城市网络转变中心性与控制力研究——兼论递归理论用于城市网络研究的条件性[J]. 地理学报, 2017, 72(6): 1032-1048. [Zhao Ziyu, Wei Ye, Pang Ruiqiu, et al. Alter-based centrality and power of Chinese city network using inter-provincial population flow[J]. Acta Geographica Sinica, 2017, 72(6): 1032-1048.]
[22]
汪小帆, 李翔, 陈关荣. 复杂网络理论及其应用[M]. 北京: 清华大学出版社, 2006: 3-42. [Wang Xiaofan, Li Xiang, Chen Guanrong. Complex Network:Theory and Application[M]. Beijing: Tsinghua University Press, 2006: 3-42.]
[23]
丁金宏. 中国人口省际迁移的原因别流场特征探析[J]. 人口研究, 1994, 18(1): 14-21. [Ding Jinhong. A study on the characteristics of inter-provincial migration fields by reasons[J]. Population Research, 1994, 18(1): 14-21.]
[24]
臧玉珠, 周生路, 周兵兵, 等. 1995-2010年中国省际人口迁移态势与空间格局演变——基于社会网络分析的视角[J]. 人文地理, 2016, 31(4): 112-118. [Zang Yuzhu, Zhou Shenglu, Zhou Bingbing, et al. The volume changes and spatial pattern dynamics of China's interprovincial migration:A perspective of social network analysis[J]. Human Geography, 2016, 31(4): 112-118.]
[25]
Xu J, Li A Y, Li D, et al. Difference of urban development in China from the perspective of passenger transport around Spring Festival[J]. Applied Geography, 2017, 87: 85-96. DOI:10.1016/j.apgeog.2017.07.014
[26]
Zhu D, Wang D, Hassan S U, et al. Small-world phenomenon of keywords network based on complex network[J]. Scientometrics, 2013, 97(2): 435-442. DOI:10.1007/s11192-013-1019-3
[27]
Newman M E J. Modularity and community structure in networks[J]. Proceedings of the National Academy of Sciences, 2006, 103(23): 8577-8582. DOI:10.1073/pnas.0601602103