2. 东北大学 江河建筑学院, 沈阳 110819;
3. 长春大学 管理学院, 长春 130022;
4. 美国伊利诺伊大学香槟分校 地理与地理信息科学系 IL61801
2. College of Jangho Architecture, Northeastern University, Shenyang 110169, China;
3. Management College, Changchun University, Changchun 130022, China;
4. Department of Geography and Geoinformation Science, University of Illinois Urbana-Champaign, IL61801, USA
人口流动扮演着城市间物质流、信息流、资本流与技术流等重要的载体作用,研究人口流动问题对促进社会稳定和区域经济的协调发展具有非常重要的意义。近年来学者们纷纷围绕人口流动的空间格局、动力机制与影响因素、调控政策、对输出地与输入地的影响、与经济发展与城镇化过程互动,以及流动人口的组成等多个方面对其展开了深入研究,取得了较为丰硕的成果[1-7]。人口流动是人类个体行为组成的一种群体结果,和其他流动一样具有明确的起讫点和流经途径,这些起讫点、流动途径和其间的人口流动构成一种复杂网络,即人口流动网络。借助于人口流动网络这一抽象模型,许多网络分析的工具被引入到人口流动研究中来,并取得了一些耳目一新的研究成果,拓展了人口流动的研究范畴。例如陈锐等利用网络的中心性、凝聚性、结构洞以及小世界特性等工具来分析中国省际人口流动的空间格局[8],赵梓渝等利用有向加权城市网络的转变中心性与控制力来分析春运人口流动中各城市的角色与作用[9],钟斌青等运用空间化PageRank算法来测度人口流动的集聚性[10],成果丰富,不一而足。参考以上研究,本文引入复杂网络分析中的富人俱乐部方法来研究人口流动网络的结构特征和集聚性问题,希冀获得较为新颖的结果。在人类社会中,有影响力的人相互之间是朋友并形成集团的现象被称富人俱乐部现象[11]。富人俱乐部现象也是复杂网络的一种重要结构属性,在网络中体现为富节点倾向于与富节点连接,实际上很多网络中都存在着富人俱乐部现象,例如航空网络[12]、人脑连接组(human connectome)[13],甚至是班级同学的关系网络等[14]。富人俱乐部系数是度量富人俱乐部现象的有效工具,最早是由Zhou and Mondragon在互联网背景下提出的[11],后来Colliza发现最初提出的系数不能准确识别富人俱乐部现象,因此通过引入随机网络变量解决了这一问题[15]。但该系数仍旧基于无向无加权网络,富节点的定义依靠对外连接的度来衡量,而是否具有富人俱乐部效应,也是通过富节点之间是否存在连接来验证。显然对于加权网络而言,这样的系数忽视了最有价值的权重(连接强度)信息。而实际应用中对于许多网络而言,连接强度往往是非常核心的信息。因此Opsahl等提出加权富人俱乐部系数,无论从富节点的选择上,还是富节点之间的相互关系界定上,都较好考虑了权重问题,最终以适应加权网络的分析[16]。城市间人口流动网络显然是一种典型的有向加权网络,适宜展开加权富人俱乐部系数的分析,并且该分析具有非常明确的可预见价值:①有助于实现人口流动网络的优化目标。中国人口流动网络结构的优劣可以影响到交通设施网络、区域平衡发展、城镇化质量等诸多问题,其优化目标无怪乎两点:一是“有序流动”,即人口流动井然有序、流量稳定,不发生大规模的“涌入”和“抽离”现象,给输入地和输出地城市造成突变压力;二是“合理分布”,即人口流动与经济发展高度耦合,人口并不是稀缺资源,应从就业容纳能力小的地区流出,向真正能够容纳劳动力的地点流入,防止人口过度膨胀和人口过度流失现象的发生。②有助于分析人口流动网络的安全问题。富人俱乐部系数涉及到网络的模块化,而模块化对应功能,对于中国来说,富人俱乐部的富节点不仅是推动中国经济增长的主力,更是经济增长外溢效应的核心区,也是中国人口流动梯度发展过程的最高阶梯[17]。为此,无论是这些富节点还是富节点对外联系发生改变,都会影响整个人口流动网络的模块化结构,进而影响其功能。
本文将城市间的人口流动数量作为权重,将中国城市人口流动网络抽象为有向加权网络模型,并在此基础上利用加权富人俱乐部系数和归一化不平衡性系数来进行分析,最后得出分析结论,并针对论文的潜在价值和中国人口流动网络的优化措施进行讨论。
2 数据与方法 2.1 数据来源本文数据来源于百度搜索引擎的“百度地图春节人口迁徙大数据”(简称“百度迁徙”)平台。百度迁徙是百度针对春运期间推出的基于定位服务(location based service,简称LBS)的人口迁徙大数据项目,能够实现全面、实时地反映人群迁徙状况,反映出城市间的人口联系[18]。虽然有学者提出该数据存在一些缺陷[19],但不可否认百度迁徙数据是一个大样本量、符合信息时代特征且具有革命性意义的数据源,对于十年一次的人口普查数据显然是一个有益的补充,尝试和探索其应用潜力具有显著的理论和实践意义。
春运是转型期中国特有的社会经济现象,隐匿在大量客流运输背后的是深层次的人口与区域经济发展不均衡,由于人口分布与经济活动的空间不协调导致了人口与就业空间分异,东部沿海发达地区和大城市竞争力及吸引力远高于广大中、西部落后地区,因此人们在择业时会选择经济更发达、就业机会更多的大城市,而“回家过年”这一根深蒂固的文化传统,驱使春节前大量流动人口从工作地回到家乡过节,形成“返乡流”,春节后又从家乡返回工作地,形成“返城流”,春运大客流因此产生。由此,春运人口流动实际上是一个长时间尺度的中国人口迁移的一个缩影,理论上可通过春运的人口流动网络的分析,实现对长时间尺度人口迁移网络的解读,以弥补普查数据时效性差的不足。
本文采集春运期间中国大陆4个直辖市及333个地级行政区(其中包括292个地级市、30个自治州、8个地区和3个盟,未含三沙市),共计337个城市之间的人口相互流动数据。中国春运官方定义周期一般为40天,发生在春节前15天至春节后25天。2015年中国春运时间从2月4日至3月16日,由于数据获取原因,本文研究时间为2月7日到3月18日,计40天。基础数据为337个城市之间春节期间每天的来往人次,数据结构为40个337×337有向加权矩阵。
基于百度迁徙数据,发现中国的春节法定假期对人口流动的方向具有显著影响。2015年中国春节国家法定假日共七天,从2月18日(农历除夕)到2月24日(农历初六),2月25日为第一天工作日。23日前主要是返乡流,23日后会迎来返城流高峰,对某个城市而言,以此时间进行分割,前后流动是双向高度对称的(R2=0.914,P=0.01)。为此在这里进行约定,2月7日—23日为节前,2月24日—3月18日为节后。鉴于春节期间人口流动大体上是一个对称的往返过程,因此为减少数据冗余和杜绝数据对称带来的信息干扰,本文的分析将只针对节前数据,下同。图 1为基于节前人口流动数据生成的城市人口流动网络图。
对于加权网络,富人俱乐部系数的计算公式为[16]:
(1) |
式中,Wl, rank为第l个权重最大两边的权重值。
首先定义节点强度大于一定数值的节点作为“富节点”(rich nodes或prominence nodes),然后计算这些节点之间的所有连边强度之和(即W> r)。再计算同样数量权重最大边的权重之和为
(2) |
这里以r来界定富节点有两种方式:一种是当r = k (link)时,即以节点的度作为判断富节点的依据,这时我们在检验对外高度连接的节点是否在控制着网络中资源的相互交换;另一种是当r = s (strength)时,即以节点对外联系的总强度作为判断富节点的依据,此时我们在检验对外参与度高的节点是否在控制着网络中整体的活动性[19]。本文的富人俱乐部系数计算通过R软件实现。
2.2.2 加权网络的局部富人俱乐部系数全局富人俱乐部系数可以描述整个网络的富人俱乐部特征,却难以描述单个节点的富人俱乐部特征,为此引入局部富人俱乐部系数。如公式(3)所示,根据Opsahl的设计,当给定富人俱乐部名单后,每个网络节点的局部富人俱乐部系数φlo cal为所有与富节点连边的权重之和∑w1同所有与非富节点连边的权重之和∑w0的比值,当某节点只和富节点或非富节点连接时,该数值设定为1。局部富人俱乐部系数可用于分析各节点与富人俱乐部之间的关系。
(3) |
当φlo cal大于1时,说明该节点更倾向于与富节点发生关系;φlo cal小于1时,说明该节点更倾向于与非富节点发生关系。φlo cal等于1时为特例,说明该节点只能与富节点和非富节点中一种发生关系,但这种情况在本文研究中并不常见。
2.2.3 归一化不平衡性系数为了对富人俱乐部富节点间的关系作出更明确的判断,提出一种归一化不平衡系数,其计算公式如下:
(4) |
式中,NUBij为i城市与j城市间人口流动的归一化不平衡系数,
从图 2可以看出,无论是ρw(k)还是ρw(s),整个曲线数值皆大于1,并且大体呈上升趋势,证实中国春运人口流动网络中存在明显的富人俱乐部现象。该结果并不意外,新经济迁移理论强调,家庭成员外出或迁移主要根据家庭预期收入最大化和风险最小化的原则,不但寻求更多的财富,也寻求更高的社会地位。城乡与区域隔离制度的放开和手机、互联网技术的普及,使得求职者可以在全国范围内自由地进行职业选择。抛开城乡关系,把每个城市作为全国劳动力市场的一个节点,那么劳动力就会在这些节点之间自由流动,但由于节点的吸引力相差悬殊,在缺少有效的外力调控的条件下,虹吸效应和马太效应不断作用,最终导致了富人俱乐部现象的产生。
在图 2中也可清晰发现,无论ρw(k)还是ρw(s)的曲线变化趋势都具有显著的“两阶段”特征:在图 2(a)中,k=200是一个重要的分界点,当k < 200时,曲线持续上升;当k > 200时,曲线开始偏离原来稳定的趋势。同样,在图 2(b)中,s=1.9×106是一个重要的分界点,在此之前曲线持续上升,而在此之后曲线开始失掉稳定性。根据这些分界点即可识别春运人口流动网络的富人俱乐部城市:如果以k > 200作为遴选条件,那么选择的城市为11个,分别为北京、上海、深圳、苏州、广州、天津、杭州、东莞、南京、宁波与西安;如果以s > 1.9×106作为遴选条件,那么提取的城市为6个,分别为北京、上海、深圳、广州、东莞、苏州。因此两种遴选结果取交集,遂将北京、上海、深圳、广州、东莞、苏州等6个城市界定为顶级城市(prominence nodes),组成中国春运人口流动网络的“富人俱乐部”,根据对基础数据的核算,该俱乐部成员所有对外联系,占整个网络联系总量的49.57%,是名副其实的富人俱乐部。必须提及的是,张耀军等基于普查数据对于中国人口空间流动格局进行了研究,发现省外流入人口规模前6位的城市分别为上海、北京、深圳、东莞、苏州与广州[20],这与本文的研究结论不谋而合,说明春节人口流动大数据与传统普查数据之间具有一定的契合性,在一定程度上可以对普查数据进行有益的补充。另外在地理分布上,6个城市分别位于京津冀、长三角、珠三角等三个重要的人口流入集聚区,符合近年来我国人口流动的大趋势[21]。
3.2 局部富人俱乐部系数分析结合以上6个全局富人俱乐部节点、利用公式3计算各城市的局部富人俱乐部系数,并将计算结果分为 > 1与≤1两种类别,如图 3所示。第一类城市倾向于与富节点发生联系,而第二类城市则倾向于与非富节点发生联系。第一类城市数量占总数量的77.66%,第二类城市占总数量的22.34%,受到富人俱乐部影响的城市占绝大多数,切实反映了富人俱乐部城市在中国春运人口流动网络中的核心作用。同时不难发现,这些城市的分布具有显著的地理分异规律:第一类城市主要分布在西部地区,第二类城市主要分布在东部地区。广东省的情况较为特殊,大部分城市都属于第一类,但这不一定意味着广东省各城市受到富人俱乐部城市的影响小——百度迁徙数据缺乏省内城市间的人口流动数据,这使得广州、深圳、东莞与广东省其他城市间的联系未能考虑进来,可能造成了结果的偏差,具体还需要省内流动数据的进一步印证。
虽然已证实中国大部分城市与富人俱乐部城市之间有密切的相互关系,但并不明确这种关系是对等还是附属关系。因此根据公式4,分别对俱乐部6个城市与其他城市的人口流动的不平衡系数进行了测算,并依据不平衡系数的大小将城市间的人口流动关系分成两类:如果两个城市间人口流动的不平衡系数在0—0.5范围内,认为其人口流动是大体平衡的,在0.5—1范围内,则认为是不平衡的。对计算结果统计发现,在6城市所有对外的人口联系中,平衡的联系占总人口联系数量的12.82%,其余87.18%皆为不平衡联系。其中北京、上海、广州、苏州、深圳与东莞的平衡联系分别占到19.16%、14.83%、17.08%、9.58%、12.64%与3.60%。从以上数值来看,富人俱乐部城市与其他城市间的联系多数为不平衡联系,进一步印证了富人俱乐部城市在人口流动网络中的主导地位,同时也显示出富人俱乐部城市与其他城市的不对等关系。
已有研究证实,就中国目前的经济发展水平、地区收入差距水平和人口流动规模而言,人口流动总体上削弱了输出地的人力资本积累[22]。相对于不平衡的人口流动,显然平衡的人口流动更值得推崇——两城市之间的人口流动倾向是相互的,二者在人口流动关系中具有大体平等的地位,而非一边倒式的人口流失与人口流入,平衡的人口流动有助于两城市经济、社会、文化、科技等全面的交流。表 1列举了所有与富人俱乐部城市具有平衡关系的城市。
从平衡联系城市的组成结构看,直辖市、省会城市占据了一定的比例,说明城市的规模和行政级别在平衡关系中起到了一定的作用。平衡联系城市的空间分布较为均匀,未表现出明显的区域分异或地理邻近特征,说明地理要素对俱乐部城市人口流动不平衡性的影响并不明显。富人俱乐部城市中北京、上海、广州的平衡联系城市数量最多、占比也最大。同时各富人俱乐部城市之间的人口流动皆属于平衡状态(除广东三市),说明在富人俱乐部城市这一层级内,城市间的人口流动是大体平衡的,不平衡主要发生于富人俱乐部城市与其他城市之间。这一结果充分证实了人口流动网络的层级特点和层级之间的不平等关系。
4 结论与讨论 4.1 结论(1)中国春运人口流动网络中存在明显的富人俱乐部现象。利用加权网络的富人俱乐部系数方法,验证了中国春运人口流动网络中存在明显的富人俱乐部现象,并利用曲线的自然断裂提取了6个顶级城市,来组成中国春运人口流动网络的“富人俱乐部”,这一俱乐部集中了网络中49.57%的人口流动,是中国人口流动网络的主要控制力量,俱乐部城市主要分布在京津冀、长三角与珠三角三个人口流动集聚区,与普查数据的研究结果具有契合性。
(2)77.66%的城市更倾向于与富人俱乐部城市发生人口联系,并且这些城市主要分布在“胡焕庸线”以东的人口密集区,反映了富人俱乐部城市在春运人口流动网络中占绝对主导地位。
(3)在富人俱乐部城市与其他城市的人口联系中,87.18%的联系皆为不平衡联系,反映了人口流动网络中各城市的不平等性。较高的城市行政级别和规模对平衡联系有一定的促进作用,俱乐部城市之间的人口联系基本保持平衡状态。
4.2 讨论(1)在以往的人口流动网络研究中,对加权富人俱乐部现象与不平衡性的关注较为鲜见,引入这些方法和视角,不仅有助于丰富方法论体系,也有助于发现新问题和新结论。例如已有研究能够识别人口流动集聚区的位置,却难以识别集聚区之间的关系和集聚区与非集聚区之间的关系,而富人俱乐部系数和不平衡性的结合分析,则有助于克服这一局限。另外本文通过提出归一化不平衡指数和数据的时空分割,为利用百度迁徙数据用来度量春运人口流动的实质方向和映射长时间序列的人口迁移问题提供了解决方案,是探索运用网络大数据来分析人口流动问题的一次有益尝试。
(2)利用百度迁徙数据所获得的富人俱乐部城市与普查数据所识别的人口流动集聚区具有一定的契合性,说明春运人口流动大数据在一定意义上可以对普查数据进行有益的补充。由于百度迁徙数据本身缺乏省内城市间的人口联系,研究过程受到了一定程度的制约,未来随着数据源的进一步优化,人口流动大数据将得到更为广泛的应用。
[1] | 刘盛和, 邓羽, 胡章. 中国流动人口地域类型的划分方法及空间分布特征[J]. 地理学报, 2010, 65(10): 1187-1197. [Liu Shenghe, Deng Yu, Hu Zhang. Research on classification methods and spatial patterns of the regional types of China's floating population[J]. Acta Geographica Sininca, 2010, 65(10): 1187-1197. DOI:10.11821/xb201010004] |
[2] | 张耀军, 岑俏. 中国人口空间流动格局与省际流动影响因素研究[J]. 人口研究, 2014, 38(5): 54-71. [Zhang Yaojun, Cen Qiao. Spatial patterns of population mobility and determinants of inter-provincial migration in China[J]. Population Research, 2014, 38(5): 54-71. ] |
[3] | 阮荣平, 刘力, 郑风田. 人口流动对输出地人力资本影响研究[J]. 中国人口科学, 2011(1): 83-91. [Ruan Rongping, Liu Li, Zheng Fengtian. Effects of brain drain on human capital accumulation in labor emigrating regions[J]. Chinese Journal of Population Science, 2011(1): 83-91. ] |
[4] | 张航空. 人口流动对中国不同省份人口老龄化的影响[J]. 人口学刊, 2015, 37(1): 95-107. [Zhang Hangkong. The influence of population floating on the region aging of China[J]. Population Journal, 2015, 37(1): 95-107. ] |
[5] | 郑真真. 中国流动人口变迁及政策启示[J]. 中国人口科学, 2013(1): 36-45. [Zheng Zhenzhen. The changes of temporary migrants in China and policy implication[J]. Chinese Journal of Population Science, 2013(1): 36-45. ] |
[6] | 赵民, 陈晨, 郁海文". 人口流动"视角的城镇化及政策议题[J]. 城市规划学刊, 2013(2): 1-9. [Zhao Min, Chen Chen, Yu Haiwen. On urbanization driven by rural-urban migration and its policy implications[J]. Urban Planning Forum, 2013(2): 1-9. ] |
[7] | 谌新民, 吴森富. 流动人口的结构特征与影响因素研究——以广东省为例[J]. 中国人口科学, 2003(1): 58-64. [Zhan Xinmin, Wu Senfu. Structural features of floating population and their determinants:A case of Guangdong province[J]. Chinese Journal of Population Science, 2003(1): 58-64. ] |
[8] | 陈锐, 王宁宁, 赵宇, 等. 基于改进重力模型的省际流动人口的复杂网络分析[J]. 中国人口·资源与环境, 2014, 24(10): 104-113. [Chen Rui, Wang Ningning, Zhao Yu, et al. Complex network analysis of inter-provincial mobile population based on improved gravity model[J]. China Population, Resources and Environment, 2014, 24(10): 104-113. DOI:10.3969/j.issn.1002-2104.2014.10.015] |
[9] | 赵梓渝, 魏冶, 王士君, 等. 有向加权城市网络的转变中心性与控制力测度——以中国春运人口流动网络为例[J]. 地理研究, 2017, 36(4): 647-660. [Zhao Ziyu, Wei Ye, Wang Shijun, Pang Ruiqiu. Measurement of directed alternative centricity and power of directed weighted urban network: A case of population flow network of China during "Chunyun" period[J]. Geographical Research, 2017, 36(4): 647-660.] http://www.geog.com.cn/CN/abstract/abstract39170.shtml |
[10] | 钟斌青, 刘湘南. 基于空间化PageRank算法的人口流动空间集聚性分析[J]. 地理与地理信息科学, 2011, 27(5): 82-86. [Zhong Binqing, Liu Xiangnan. A spatialized page rank algorithm for migration spatial agglomeration analysis[J]. Geography and Geo-Information Science, 2011, 27(5): 82-86. ] |
[11] | Zhou S, Mondragon R J. The rich-club phenomenon in the Internet topology[J]. IEEE Communications Letters, 2004, 8(3): 180-182. DOI:10.1109/LCOMM.2004.823426 |
[12] | Colizza V, Pastor-Satorras R, Vespignani A. Reaction-diffusion processes and metapopulation models in heterogeneous networks[J]. Nature Physics, 2007, 3(4): 276-282. DOI:10.1038/nphys560 |
[13] | Mp V D H, Sporns O. Rich-club organization of the human connectome[J]. Journal of Neuroscience the Official Journal of the Society for Neuroscience, 2011, 31(44): 15775-15786. DOI:10.1523/JNEUROSCI.3539-11.2011 |
[14] | Vaquero L M, Cebrian M. The rich club phenomenon in the classroom[J]. Scientific Reports, 2013, 3(1): 268-277. |
[15] | Colizza V, Flammini A, Serrano M A, et al. Detecting rich-club ordering in complex networks[J]. Nature Physics, 2006, 2(2): 110-115. DOI:10.1038/nphys209 |
[16] | Opsahl T, Colizza V, Panzarasa P, et al. Prominence and control:The weighted rich-club effect[J]. Physical Review Letters, 2008, 101(16): 3958-3964. |
[17] | 杜鹏, 张文娟. 对中国流动人口"梯次流动"的理论思考[J]. 人口学刊, 2010(3): 25-29. [Du Peng, Zhang Wenjuan. On the laddering migration of China's floating population[J]. Population Journal, 2010(3): 25-29. ] |
[18] | 魏冶, 修春亮, 刘志敏, 等. 春运人口流动透视的转型期中国城市网络结构[J]. 地理科学, 2016, 36(11): 1654-1660. [Wei Ye, Xiu Chunliang, Liu Zhimin. Spatial pattern of city network in transitional China based on the population flows in "Chunyun" period[J]. Scientia Geographica Sinica, 2016, 36(11): 1654-1660. ] |
[19] | 刘望保, 石恩名. 基于ICT的中国城市间人口日常流动空间格局——以百度迁徙为例[J]. 地理学报, 2016, 71(10): 1667-1679. [Liu Wangbao, Shi Enming. Spatial pattern of population daily flow among cities based on ICT:A case study of "Baidu Migration"[J]. Acta Geographica Sininca, 2016, 71(10): 1667-1679. ] |
[20] | 张耀军, 岑俏. 中国人口空间流动格局与省际流动影响因素研究[J]. 人口研究, 2014, 38(5): 54-71. [Zhang Yaojun, Cen Qiao. Spatial patterns of population mobility and determinants of inter-provincial migration in China[J]. Population Research, 2014, 38(5): 54-71. ] |
[21] | 蒋小荣, 汪胜兰, 杨永春. 中国城市人口流动网络研究——基于百度LBS大数据分析[J]. 人口与发展, 2017, 23(1): 13-23. [Jiang Xiaorong, Wang Shenglan, Yang Yongchun. Research on China's urban population mobility network based on baidu LBS big data[J]. Population and Development, 2017, 23(1): 13-23. ] |
[22] | 阮荣平, 刘力, 郑风田. 人口流动对输出地人力资本影响研究[J]. 中国人口科学, 2011(1): 83-91. [Ruan Rongping, Liu Li, Zheng Fengtian. Effects of brain drain on human capital accumulation in labor emigrating regions[J]. Chinese Journal of Population Science, 2011(1): 83-91. ] |