文章快速检索     高级检索
  人文地理  2018, Vol. 33 Issue (3): 137-144  DOI: 10.13959/j.issn.1003-2398.2018.03.017
0

引用本文  

赵莹, 张朝枝, 金钰涵. 基于手机数据可靠性分析的旅游城市功能空间识别研究[J]. 人文地理, 2018, 33(3): 137-144. DOI: 10.13959/j.issn.1003-2398.2018.03.017.
ZHAO Ying, ZHANG Chao-zhi, JIN Yu-han. HOW RELIABLE ARE CELLULAR POSITIONING DATA IN TOURISM ENVIRONMENTS? AN EXPLORATION OF FUNCTIONAL REGIONS[J]. Human Geography, 2018, 33(3): 137-144. DOI: 10.13959/j.issn.1003-2398.2018.03.017.

基金项目

国家自然科学基金项目(41501172);广东省自然科学基金项目(2014A030310143)

作者简介

赵莹(1985-), 女, 吉林通化人, 讲师, 主要研究方向为旅游地理学、行为地理学。E-mail:zhaoy233@mail.sysu.edu.cn

文章历史

收稿日期:2017-07-20
修订日期:2017-12-25
基于手机数据可靠性分析的旅游城市功能空间识别研究
赵莹1, 张朝枝1,2, 金钰涵1     
1. 中山大学 旅游学院, 广州 510275;
2. 伊利诺伊大学-中山大学 国家公园(张家界)国际联合实验室, 广州 510275
摘要:随着移动通信和移动互联网的普及,带有地理空间信息的“大数据”受到人文地理学者的关注。本文关注手机移动数据的旅游研究价值,以张家界市武陵源区、慈利县为例,首先分析了通信公司漫游用户数、基站网流量和话务量代表实际游客量的可靠性程度,然后探讨了漫游用户数波动对大尺度行政区的功能空间反映,最后挖掘了网流量波动对小尺度基站区的功能空间识别。结果显示,漫游用户数仅在旅游区对实际游客量具有可靠性,基站网流量比话务量的可靠性更强;漫游用户数在旅游区的波动幅度更大;基站网流量的空间因子分析识别出日常居住区、重点旅游区等功能空间。
关键词手机数据    基站网流量    基站话务量    可靠性    功能空间    
HOW RELIABLE ARE CELLULAR POSITIONING DATA IN TOURISM ENVIRONMENTS? AN EXPLORATION OF FUNCTIONAL REGIONS
ZHAO Ying1, ZHANG Chao-zhi1,2, JIN Yu-han1     
1. School of Tourism Management, Sun Yat-sen University, Guangzhou 510275, China;
2. UIUC-SYSU International Joint Lab for National Park Research(Zhangjiajie), Guangzhou 510275, China
Abstract: Following the wide use of mobile communications and mobile Internet, human geography scholars have paid considerable attention to big data with geospatial information. This research focuses on the value and exploration of cellular positioning data in tourism research and has detected functional regions in a tourism-oriented city. This empirical case study is based on Wulingyuan district and Cili county in Zhangjiajie city. The dataset contains not only the aggregated records at the cell tower level from China Mobile and at the administrative area level from China Unicom, but also the real tourist numbers from government offices. The empirical study first explores the reliability of roaming user numbers, and Internet and call traffic volumes. The results show that roaming user numbers are only reliable in tourism areas and Internet traffic is better than call traffic if comparing their correlation levels with actual tourist numbers. This finding might be associated with personal cellular phone use habits. The study then analyzes the temporal rhythm of roaming user numbers to find the characteristics and differences between tourism and residential areas. The results show significant differences; i.e., roaming user numbers increase sharply around holidays in tourism areas while the changes are relatively slow in residential areas. According to the reliability discussion on Internet traffic volume, the final part of the study applies an exploratory factor analysis to the seasonal tourism spaces in Zhangjiajie city based on these data sources, which could allow deep explorations at small spatial scales. The functional regions discovered by cellular positioning data are mostly correlated with physical space characteristics, which shows that the exploration is probably valid and reliable.
Key words: cellular positioning data    Internet traffic volume    call traffic volume    reliability    functional region    
1 引言

中国快速发展的互联网经济和正在进行的智慧城市建设,促使我们日益处于一个被“大数据”热潮所包围的环境之中。大数据提供了丰富的、详细的、实时的信息,有助于社会科学家更加全面、大尺度、精细化地研究各类社会科学问题,为社会科学研究提供了新范式的转型机遇[1]。大数据为城市研究和城市规划带来的新机遇包括两方面:①宏观层面上,大数据为区域间人口流、信息流等分析提供了丰富的数据来源;②在城市层面上,大数据为动态实时掌握城市发展和运行的情况,为预防和解决城市问题提供了新的方法和手段[2, 3]

大数据所表现的人口空间集聚规律能够揭示城市功能空间的分布特征,使其成为一种极具潜力的城市规划辅助工具[4-6]。基于浮动车GPS跟踪数据,陈世莉等[7]结合周末/工作日每小时的流量特征、到达/离开每个功能区的热点图,以人群移动规律推测功能区类型,从而辨别出成熟居住区、科教文化区、商业娱乐区等明显特征功能区;郝新华等[8]利用GPS起讫关联居住地交通产生和分布特征,分析了出行距离的衰减规律和城市的职住空间关系。基于公交刷卡数据,龙瀛等[9]探索了识别通勤行为、识别职住地的方法,并挖掘了三大典型居住区和六大典型办公区的通勤交通流特征。基于手机基站数据,Zhao等[10]认为能够较好反映大尺度、长时间的人类移动规律信息,Girardin等[11]尝试利用通话流量反映人流集散,Gao等[12]基于服务用户数量反映区域内部联系等。

数据的挖掘分析绕不开对数据可靠性的讨论。陈世莉等[7]将广州功能分区结果与城镇用地现状、百度地图信息进行比照,判断识别结果的合理性。郝新华等[8]将出租车GPS所识别的通勤距离、空间分布与传统问卷统计进行对比,表示新数据源在揭示通勤方面有一定的可靠性。龙瀛[9]将公交刷卡数据进行反复识别清理后,与传统居民出行调查的出行时间和距离进行对比,显示有较强的相似性。Zhao等[10]科学认识基站、话单和信令数据的特征,认为个体手机数据评估人类移动程度会出现高估或低估的情况,这可能与个人手机使用行为、移动行为的规律相关联[13]。可见,上述数据源为代表的被动采集型数据,既面临着行业对数据资本价值的重视和数据潜力挖掘的现实需求[14],又需要研究者科学审慎的分析和挖掘,不断反思不同的研究主题和研究对象如何选择最为合适和科学的数据基础[10]

在旅游研究与规划领域,大数据对旅游行为的分析价值受到关注[15-18]。旅游行为的本质特征是大量个体时空行为的总和,大数据分析技术使得隐藏在数据背后人的行为时空模式与规律得以浮现,有助于研究者认识旅游者的行为规律,为旅游景区时空优化、旅游者时间管理、旅游市场变化研究等提供科学依据[19]。旅游领域的数据挖掘通常围绕着旅游行为的时间节奏展开,如Ahas等基于爱沙尼亚的手机话单数据对国外旅游者季节性波动的影响因子进行了讨论[6, 20];后续又开展了旅游目的地识别和旅游流迁移研究[21];方家等利用手机信令数据分析了上海顾村公园樱花节开幕后节假日的“大客流”规律,提出了在园人数预测的预警方案[22];唐佳等[23]基于微博大数据分析了国内游客与日常用户的分时签到规律及重要旅游节点的日内时间分布模式。这些研究极大地推动了被动型数据源的旅游价值研究,但数据可靠性的讨论多遵循“大部分可靠,允许混杂”的基本原则,在实证分析前对研究数据进行了定性化的清理和筛选。以手机数据为例,由于旅游目的地居民与游客的混杂特征,已有研究均认识到了手机数据与实际游客量存在一定的差异。因此,大数据与常规数据的结合分析是认识数据代表性的重要途径,旅游者行为所受的影响因素相对简单可控,基于旅游地域的被动采集的手机移动数据和自动获取的实际游客量的对比分析,更容易了解该类数据源的可靠性特征[10, 20, 24]

以手机数据为基础,以张家界市武陵源区和慈利县为案例地,讨论漫游用户数、基站话务量、基站网流量三项指标对旅游城市反映游客量变化的可靠程度,并利用手机数据在三个月内的波动规律识别城市功能空间的分布特征。

2 研究案例与数据

张家界市是中国最重要的旅游目的地之一,辖两区两县,其中武陵源区常住人口6万人,区内有世界自然遗产地武陵源风景名胜区、黄龙洞、宝峰湖等景区,2014年全区接待国内外游客1539.8万人次;慈利县常住人口61.05万人,境内有张家界大峡谷等景区,是近年来张家界旅游发展新增长点。选择这一区域主要考虑两方面因素:①张家界市是一个典型的旅游城市,其手机移动数据的波动与游客量的变化相关性极大;②武陵源区和慈利县的功能空间特征差异明显。武陵源区为景点型区域,常住人口较少;而慈利县为传统农业大县,兼具旅游地和居住地的共同特征。两区相邻且空间特征相对一致,易于开展对比研究。

手机数据可细分为三种形式:一是以手机基站为单元的汇总性手机通话或上网流量的数据,它可以按照小时、天、周等不同的时间尺度进行划分,能够反映城市活动、人口分布和交通流动的时空结构特征[25-28];二是用于话费结算的用户话单数据,它包含每次拨打电话时的主叫、被叫邻近的基站位置信息,能够一定程度反映个体的移动信息[10, 29];三是手机用户切换基站、位置更新等等事件时所产生的信令数据,它相对客观地记录了手机用户日常的位置变换信息,能够反映微观个体的行为规律[10, 30, 31]。这三种数据在可靠性上各有优劣:基站数据具有混杂性,难以区分流量数据产生的主体身份[26, 32];话单数据仅在通话时产生,与行为主体的手机使用频率和习惯具有较大关联[10];信令数据的时间粒度较低,难以反映较小时空尺度的规律[22];其中,后两种数据形式均涉及个人隐私保护等问题。

作者于2014年6月前往张家界景区管理部门及联通公司采集相关数据,因涉及个人隐私的数据形式难以获取,最终获得了三方面数据:①从联通通信公司采集武陵源区、慈利县按天计算的漫游用户数量,时间范围为2014年1月至6月;②从移动通信公司采集武陵源区、慈利县境内347个基站按天计算话务量与网流量信息,时间范围为2014年3月至6月;③从张家界国家森林公园管理处门票科、武陵源区旅游局门票科、武陵源旅游产业公司门票分公司获得景区游客日流量报表,时间范围为2014年3月至6月。数据集分别代表区域汇总性手机移动信息、区域非汇总手机移动信息及实际游客量信息,并实现了时间范围的高度一致。

除原始数据的清洗外,研究数据处理主要包括基站流量的汇总与到访游客量的汇总。在蜂窝通信网中,基站设于小区的中心,采用三副120度扇形辐射的定向天线,分别覆盖小区三分之一的区域。因此,本文以位置为基准,同一位置的三副扇形辐射的流量加总,最终生成该基站的流量值。其中,话务量采用厄兰(Erlang)单位,表示一段时间间隔内一台设备的平均占线时间,代表平均话务强度;网流量采用GPRS的兆字节(Mbit),代表数据传输强度。实际游客量为避免将分散景点售票人数直接加总的重叠统计,兼顾武陵源景区自2000年实行一票制,本文涉及景区总游客量的数值采用7个景区门票检票口人次加总,内部索道或观光车的购票数量不重复计算。由于休假安排对旅游地游客量的影响显著[33],研究时间范围内包含了除双休日外的4个国家法定假日。

3 手机数据的可靠性分析 3.1 漫游用户数

漫游用户的数值变化是认识旅游区域人口流动性规律的重要依据。漫游是指手机在非归属地区域使用的情况,即手机号码的属地位置与访问位置不相匹配,手机服务公司存储这一信息用于资费收取,旅游业更看重其对旅游区域人口变化的代表意义。调研获得了联通通信公司县区尺度的漫游用户数量,开展了与当天张家界景区进园游客数量的相关性分析,见表 1

表 1 县区漫游用户数与景区游客量相关性分析表 Tab.1 Correlativity Between Internet Traffic and Actual Visitors

漫游用户数与景区游客量的相关性在慈利县存在较弱的正相关,在武陵源区存在显著的正相关。慈利县作为居住区兼具旅游腹地的特征,非归属地用户的存在并不能完全反映游客的变化特征,相关系数为0.17,在10%的置信水平下显著。武陵源区汇集了大部分张家界景区的景点,漫游用户数的波动与入园游客量的相关性较强,相关系数为0.711,在1%的置信水平下显著。通过归属地区分外来游客和本地居民的方法广泛用于多种旅游大数据分析[23]及数据分析系统建设[34],本研究所揭示的强相关性仅存在于典型的旅游区范围内。同时,漫游用户统计的空间单元多为行政区划,基站尺度的数据难以直接获取,一定程度上制约了此数据指标的应用潜力。

3.2 基站网流量

基站尺度的数据详细记录了每天网流量和话务量的信息,反映了小空间尺度的变化。本文通过景点所在位置的基站数据与该景点门票游客数据对比,挖掘三个月有效数据期内两者的相关性。

从基站网流量与实际游客量的相关分析结果看(表 2),大部分景点出入口型和交通型景区均呈现显著相关,相关系数大于0.5,且在1%的置信水平下显著。表明手机基站的网流量对景区游客量和交通工具的使用量具有代表性。

表 2 基站网流量与景区游客量相关性分析表 Tab.2 Correlativity Between Internet Traffic and Actual Visitors

同时,部分景点也存在与网流量不相符或不相关的情况。其中,黄龙洞景区和杨家界索道的相关系数较小,且显著性水平不高。游客进入黄龙洞后,手机无法接收信号,抑制了游客的手机使用需求,这一特征与手机自身技术相关,并普遍存在于GPS、社交媒体等其他数据源。杨家界索道于2014年5月12日开始试运营,与研究期有一定交集但不完全,因此相关分析的样本仅为31个,影响了显著性。溪布街的相关系数为负且不显著,这一结果与溪布街的知名度与地理位置相关。溪布街作为武陵源景区打造的特色休闲街区,其暂未形成较强的知名度,对游客的吸引力仍有待提升;同时,溪布街周边有一个大型安居小区,其临近基站可能主要承担了本地居民手机服务。

3.3 基站话务量

本文同样对基站话务量与实际游客量进行了相关性分析(见表 3)。结果表明,话务量与部分景点的实际游客量存在显著相关,但整体相关程度不及网流量。除网流量相关性分析中三个不显著相关的景点外,话务量相关性在百龙天梯、杨家界门票站也不显著。

表 3 基站话务量与景区游客量相关性分析表 Tab.3 Correlativity Between Telephone Traffic and Actual Visitors

综上,手机数据能够一定程度上反映游客量的变化,但不同数据指标的可靠性存在差异。漫游用户数在旅游区对游客数量的代表性较强、在居住区代表性较弱或无关联,且数据统计空间单位局限于行政管理区划。基站网流量比话务量与景区实际游客量的关联性更强,这一结果有悖于以往大量研究基于基站话务量的移动性分析[2, 6, 25, 29]

随着智能手机的普及,游客在旅游过程中对移动上网的依赖性更强,GPRS网流量数据的重要性提升。同时,根据张家界景区现场游客的访谈与观察,游客通常在景区交通口或集散点使用手机通话功能和旅伴保持联系或处理紧急事务;而利用手机网络在社交媒体上分享旅游经历则贯穿于整个游览过程,其中排队或休息等待中的手机网络使用尤其频繁。游客手机使用行为习惯,可能影响了基站数据在景区不同区域的可靠性差异,值得进一步讨论。

4 基于漫游用户数的功能空间识别

漫游用户数在慈利县和武陵源区对实际游客量的代表性具有差异,这一数据的时间波动规律直接表现了两大功能空间的特征。从漫游用户数2014年1—6月的波动情况(图 1)可见,武陵源联通网络漫游用户服务处于很低的水平,如1月大部分处于接近0的水平,进入3月后出现缓慢上升,进入4月后开始出现周末的小高峰。漫游用户数的波动主要集中在4个法定假日期间,假期开始阶段上升明显,假期结束阶段恢复到原有水平。这种变化趋势与武陵源典型的旅游功能空间特征相关,波动主要来源于以旅游目的为主的外来流动人口。慈利县的漫游用户总量长期高于武陵源区,其波动规律与法定假日存在关联,但假期前后有缓冲期存在。以春节假期为例,慈利县漫游用户高峰呈现出将近一个月缓慢增长与缓慢回落,最高数值达到3.5万人。虽然汇总性漫游用户数难以区分游客和居民身份,但这一波动特征与务工人员春节返乡可能存在关联。慈利县作为劳动力输出型的农业人口大县,2011年底的外出务工人员达到18.1万人。按照联通通信公司平均20%的市场占有率,3.5万联通漫游用户大约代表了17.5万全部通信公司的漫游用户存在,与全县外出务工人员规模基本一致。这间接说明了居住区漫游用户的波动主要归因于外出人口返乡等居民因素。

图 1 2014年1—6月慈利县与武陵源区联通网络漫游用户数量对比 Fig.1 The Numbers of Unicom Roaming User in Cili County and Wulingyuan District
5 基于基站网流量的功能空间识别

基站流量数据突破了行政边界,允许针对小空间单元开展功能空间的识别。在认识网流量重要性的基础上,本文进一步挖掘了研究区域内部功能空间的时间波动规律,理解大数据所折射的人口分布、土地利用、交通组织的空间分布规律。具体而言,针对2014年3—6月单个基站网流量的变化规律进行探索性因子分析,并剖析因子载荷的空间分布及平均网流量的波动特征。

在数据方面,对原有347个基站的网流量数据进行清理,剔除不完整样本,最终得到195个基站作为变量数据。每个基站所代表的区域采用ArcGIS泰森多边形方法,形成其邻近度最强的区域。经因子分析后,共发现30个因子,但仅有三个较为显著。旋转后的三个因子,分别解释了34.10%、18.14%、6.79%的原始数据方差。

5.1 日常居住区

因子一反映了日常居住区的网流量波动规律。观察因子一载荷量空间分布(图 2)可以发现:

图 2 因子一(日常居住区)因子载荷量空间分布 Fig.2 Spatial Correlations of the First Factor-Daily Life Areas

最高的区域主要分布在慈利县,并与农田区、林区、乡村聚落区域相重合,结合该因子对总体原始数据的方差的解释力度(34.10%)可以判断,该因子反映的是研究区域内日常居住区的网流量波动。进一步整理该因子所包含的基站的每日平均网流量在整个研究时间范围内波动起伏(图 3),四个主峰值分别为3月8日、4月5日、5月1日、5月31日,与妇女节、清明节、劳动节、端午节、四个节假日相吻合;次峰值对应周末时间;主峰与次峰的差值不大,约2500Mbit。由此判断,该因子解释了当地常住居民的手机使用行为,即周末与节假日闲暇时间大量使用手机上网的现象。

图 3 因子一(日常居住区)网流量变化趋势 Fig.3 Factor No.1 Describing Daily Life Flows
5.2 重点旅游区

因子二与重点旅游区的游客游览行为关系密切。42个基站覆盖区在因子二的载荷超过0.5,共解释了18.14%的原始数据方差。观察因子载荷量空间分布(图 4)可以发现,载荷较高的区域主要分布在三个区域:①武陵源风景名胜区,包括了张家界、天子山、索溪峪的范围,可靠性分析中的门票站基本全覆盖,仅黄龙洞景区所在基地的因子载荷较小;②慈利县城周边的景点区域,包括五雷山、万福温泉等;③慈利县各乡镇的旅游景点区域,包括江娅温泉、张家界大峡谷、朝阳地缝等。这表明因子二的载荷区域与重要的旅游区域高度重合。此外,武陵源区与慈利县境内每日平均网流量波动上升(图 5),波动范围比因子一更大;4月张家界景区由淡季转入旺季后伴随出现周末小高峰;劳动节期间达到最高值(16000Mbit),体现了旅游地域短时外来游客激增的现象。

图 4 因子二(重点旅游区)因子载荷量空间分布 Fig.4 Spatial Correlations of the Second Factor-tourism Areas
图 5 因子二(重点旅游区)网流量变化趋势 Fig.5 Factor No.2 Describing Tourism Flows
5.3 其他波动区

因子三解释了6.79%的原始数据方差,它反映的功能空间相对混杂,部分包含有旅游服务设施、旅游交通空间的区域。从因子载荷空间可见(图 6),载荷较高的区域分别在两类区域:①武陵源、慈利的城区空间,这里分布有较多的旅游食宿服务设施;②北部S304省道、中部龙阳公路、南部长张高速的沿路区域的部分基站。网流量的波动变化较缓,长期维持在20000—25000 Mbit的较高水平区段(图 7),日均网流量基本与周末、节假日等无关联,法定节假日甚至出现低谷值。这一因子具有较为混杂的特征。

图 6 因子三(旅游服务区)因子载荷量空间分布 Fig.6 Spatial Correlations of the Third Factor-Tourism Service Areas
图 7 因子三(旅游服务区)网流量变化趋势 Fig.7 Factor No.3 Describing Tourist Transportation Flows
5.4 识别空间与实体空间的关联

经因子分析得到的3个显著反映张家界旅游季节性的空间因子进一步与实体空间的物质环境特征进行对比分析,本文通过提取各样本基站位置及泰森多边形覆盖区域,用是否有林区、是否有景区及是否有道路穿过三个虚拟变量指标进行刻画,并对三类因子归属的基站实体空间指标进行了方差分析(表 4)。其中,是否有景点、是否有道路穿过均表现出明显的组间差异,因子二的景点比例最高回应了重点旅游区的判断,因子三的道路穿过比例最高回应了旅游服务设施区域的判断;是否有林区未表现出显著差异,各因子组间的平均值相差也不大,可能的原因是张家界作为自然型风景名胜区,无论居民点、景点、设施点等都覆盖有森林区域,难以实现空间识别。

表 4 识别空间因子的实体空间特征方差分析 Tab.4 ANOVA of Each Factors' Spatial Features
6 结论与讨论

大数据时代下的人文地理学冷思考认识到其对城市规划、旅游管理等领域的扩展与影响[1, 35]。本文基于张家界市一区一县的手机移动数据,在认识手机数据可靠性的基础上,探讨了漫游用户数波动对大尺度行政区的功能空间反映,挖掘了网流量波动对小尺度基站区的功能空间识别。实证分析表明:①漫游用户数仅在旅游区对实际游客量具有可靠性,基站网流量比话务量的可靠性更强;②漫游用户数的波动在旅游区与居住区具有不同特征:旅游区的波动幅度较大,法定假期均有高峰出现,并在旅游旺季出现有周末小高峰;而居住区的漫游用户波动相对平缓,假期的小高峰通常在假前假后有一定缓冲时间。③基于基站网流量的空间因子分析识别出日常居住区、重点旅游区、其他波动区等功能空间,与已有研究中手机数据挖掘人口流动与土地利用等特征相呼应[36]

本文的研究将为手机数据资产的挖掘提供科学参考。业界对通信服务公司已有数据集的挖掘中,旅游行为分析是重要主题之一,包括游客画像、游客流动、游客预测等。这一过程绕不开两个内容:①数据是否能够代表游客特征?如何辨别外来人口和常住人口?漫游用户数代表游客的可靠性怎样[37]?②数据能否反映旅游空间的特征?小尺度旅游空间有哪些特殊性?深入思考和架构分析过程才能够使数据资产发挥其应有的价值,本文运用较为严谨科学的办法提供了汇总性手机数据做功能空间挖掘的可能途径。

大数据为旅游统计的改革和创新提供了契机。首先,尽管大数据具有体量大、变化快、无抽样的特征,但大数据所表示的“总体样本”是杂乱而无序的,例如本研究中的漫游数、网流量和话务量均可看作代表“总体样本”,但其实质为“有偏的总体样本”,表现为不同程度的局限性;智慧旅游建设中运用酒店身份证登记信息识别游客数量及客源地组成,身份代码的归属地以出生地定义,但人口流动中的出生地与常住地不一致非常普遍,由此估计的客源地依然存在混杂和有偏。因此,旅游统计分析应当重视数据的可靠性、科学性和代表性评价[1]。其次,大数据研究需要新的分析思维加以适应。大数据研究需面临先有数据储备、后有研究问题的处境,因此需要旅游研究学者从已有的统计指标中发掘大数据可提供或可补充的信息,将新数据源与传统数据源相结合;同时,大数据提供的“是什么”特征,为科学研究中解答“为什么”提供预判和假设,两者相辅相成[38]。多源数据的相互整合和相互验证将是旅游统计的必然趋势[39, 40]

本文也存在一些不足之处。首先,手机数据缺失现象较为严重。同一基站的数据信息可能出现不同程度的缺失,所涉及的门票站、交通站对应基站也存在此现象。其次,受到个人隐私保护、不同部门间“数据鸿沟”的限制,本文所采集的手机数据是以基站为单元的汇总信息,并未涉及个体用户的层面。第三,功能空间的识别可进一步与城市兴趣点(POI)信息叠加,理解服务需求与设施供给间的矛盾[41]

注释:

① 武陵源区常住人口及2014年接待游客人数、慈利县常住人口数据参照《2014年湖南省统计年鉴》。

② 慈利县外出务工人数参考国家发展和改革委社会发展研究所课题组,2013。

③ 案例区域分布有江垭林场、杉木林场、白果庙林场、茅家界林场、苗市村林场、星子山林场、三丝村林场、保安林场、阳和乡梭底湾林场、锣鼓村林场、太平山林场、柳林乡林场、杨柳村林场、二坊坪乡林场、新建村林场、金湾村林场、潭口村林场共17个林场。

致谢: 感谢中国移动张家界分公司、中国联通张家界分公司在数据调研阶段给予的帮助;感谢中山大学旅游学院本科生陈颖钧参与部分数据分析。
参考文献
[1] 甄峰, 王波. "大数据"热潮下人文地理学研究的再思考[J]. 地理研究, 2015, 34(5): 803-811. [Zhen Feng, Wang Bo. Rethinking human geography in the age of big data[J]. Geographical Research, 2015, 34(5): 803-811. ]
[2] Reades J, Calabrese F, Ratti C. Eigenplaces:Analysing cities using the space-time structure of the mobile phone network[J]. Environment and Planning B:Planning and Design, 2009, 36(5): 824-836. DOI:10.1068/b34133t
[3] Liu Y, Wang F, Xiao Y, et al. Urban land uses and traffic 'sourcesink areas':Evidence from GPS-enabled taxi data in Shanghai[J]. Landscape & Urban Planning, 2012, 106(1): 73-87.
[4] 秦萧, 甄峰. 大数据时代智慧城市空间规划方法探讨[J]. 现代城市研究, 2014(10): 18-24. [Qin Xiao, Zhen Feng. The spatial planning methods of smart city on big data era[J]. Modern Urban Research, 2014(10): 18-24. DOI:10.3969/j.issn.1009-6000.2014.10.005]
[5] Eagle N, Pentland A S. Eigenbehaviors:Identifying structure in routine[J]. Behavioral Ecology and Sociobiology, 2009, 63(7): 1057-1066. DOI:10.1007/s00265-009-0739-0
[6] Ahas R, Aasa A, Yuan Y, et al. Everyday space-time geographies:Using mobile phone-based sensor data to monitor urban activity in Harbin, Paris, and Tallinn[J]. International Journal of Geographical Information Science, 2015, 29(11): 2017-2039. DOI:10.1080/13658816.2015.1063151
[7] 陈世莉, 陶海燕, 李旭亮, 等. 基于潜在语义信息的城市功能区识别——广州市浮动车GPS时空数据挖掘[J]. 地理学报, 2016, 71(3): 471-483. [Chen Shili, Tao Haiyan, Li Xuliang, et al. Discovering urban functional regions using latent semantic information:Spatiotemporal data mining of floating cars GPS data of Guangzhou[J]. Acta Geographica Sinica, 2016, 71(3): 471-483. ]
[8] 郝新华, 周素红, 柳林. 广州市高峰小时居住用地交通产生与分布——基于出租车GPS起讫关联的分析[J]. 人文地理, 2016, 31(6): 109-114. [Hao Xinhua, Zhou Suhong, Liu Lin. Traffic generation and distribution of residential land of Guangzhou in commuting peak hour:Based on the analysis of o-d associated data of taxi GPS[J]. Human Geography, 2016, 31(6): 109-114. ]
[9] 龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行[J]. 地理学报, 2012, 67(10): 1339-1352. [Long Ying, Zhang Yu, Cui Chengyin. Identifying commuting pattern of Beijing using bus smart card data[J]. Acta Geographica Sinica, 2012, 67(10): 1339-1352. DOI:10.11821/xb201210005]
[10] Zhao Z, Shaw S-L, Xu Y, et al. Understanding the bias of call detail records in human mobility research[J]. International Journal of Geographical Information Science, 2016, 30(9): 1738-1762. DOI:10.1080/13658816.2015.1137298
[11] Girardin F, Vaccari A, Gerber R, et al. Quantifying urban attractiveness from the distribution and density of digital footprints[J]. International Journal of Spatial Data Infrastructures Research, 2009, 4(1): 175-200.
[12] Gao S, Liu Y, Wang Y, et al. Discovering spatial interaction communities from mobile phone data[J]. Transactions in GIS, 2013, 17(3): 463-481. DOI:10.1111/tgis.12042
[13] Lu S, Fang Z, Zhang X, et al. Understanding the representativeness of mobile phone location data in characterizing human mobility indicators[J]. International Journal of Geo-Information, 2017, 6(1): 7-26. DOI:10.3390/ijgi6010007
[14] 张明慧, 张宝峰. 要素资本理论下大数据时代的企业价值[J]. 商业会计, 2016(24): 96-97. [Zhang Minghui, Zhang Baofeng. The enterprise value at the big data era:The factor capital theory perspective[J]. Commercial Accounting, 2016(24): 96-97. DOI:10.3969/j.issn.1002-5812.2016.24.034]
[15] 柴彦威, 张文佳, 张艳, 等. 微观个体行为时空数据的生产过程与质量管理——以北京居民活动日志调查为例[J]. 人文地理, 2009, 24(6): 1-9. [Chai Yanwei, Zhang Wenjia, Zhang Yan, et al. The production and quality management of disaggregated space-time data of individual's behaviors:A case study of activity-diary survey in Beijing[J]. Human Geography, 2009, 24(6): 1-9. ]
[16] 黄潇婷, 柴彦威, 赵莹, 等. 手机移动数据作为新数据源在旅游者研究中的应用探析[J]. 旅游学刊, 2010, 25(8): 39-45. [Huang Xiaoting, Chai Yanwei, Zhao Ying, et al. On the application analysis of mobile data source in the study of tourists[J]. Tourism Tribune, 2010, 25(8): 39-45. ]
[17] Versichele M, De Groote L, Bouuaert M C, et al. Pattern mining in tourist attraction visits through association rule learning on Bluetooth tracking data:A case study of Ghent, Belgium[J]. Tourism Management, 2014, 44(13): 67-81.
[18] Zoltan J, McKercher B. Analysing intra-destination movements and activity participation of tourists through destination card consumption[J]. Tourism Geographies, 2015, 17(1): 19-35. DOI:10.1080/14616688.2014.927523
[19] 柴彦威, 赵莹, 马修军, 等. 基于移动定位的行为数据采集与地理应用研究[J]. 地域研究与开发, 2010, 29(6): 1-7. [Chai Yanwei, Zhao Ying, Ma Xiujun, et al. Mobile positioning method for spatial-temporal behavioral data collection and its geographical applications[J]. Areal Research and Development, 2010, 29(6): 1-7. ]
[20] Ahas R, Aasa A, Roose A, et al. Evaluating passive mobile positioning data for tourism surveys:An Estonian case study[J]. Tourism Management, 2008, 29(3): 469-486. DOI:10.1016/j.tourman.2007.05.014
[21] Raun J, Ahas R, Tiru M. Measuring tourism destinations using mobile tracking data[J]. Tourism Management, 2016, 57: 202-212. DOI:10.1016/j.tourman.2016.06.006
[22] 方家, 王德, 谢栋灿, 等. 上海顾村公园樱花节大客流特征及预警研究——基于手机信令数据的探索[J]. 城市规划, 2016, 40(6): 43-51. [Fang Jia, Wang De, Xie Dongcan, et al. Research on dynamic change and early warning of large tourist flow based on mobile signal data analysis:A case study of Gucun park sakura festival in Shanghai[J]. City Planning Review, 2016, 40(6): 43-51. DOI:10.11819/cpr20160608a]
[23] 唐佳, 李君轶. 基于微博大数据的西安国内游客日内时间分布模式研究[J]. 人文地理, 2016, 31(3): 151-160. [Tang Jia, Li Junyi. A study of the temporal distribution pattern of domestic tourists in Xi'an by hours based on the microblog big data[J]. Human Geography, 2016, 31(3): 151-160. ]
[24] 黄潇婷. 基于时间地理学的景区旅游者时空行为模式研究——以北京颐和园为例[J]. 旅游学刊, 2009, 24(6): 82-87. [Huang Xiaoting. A study on temporal-spatial behavior pattern of tourists based on time-geography science:A case study of Summer Palace, Beijing[J]. Tourism Tribune, 2009, 24(6): 82-87. ]
[25] Ratti C, Frenchman D, Pulselli R M, et al. Mobile landscapes:Using location data from cell phones for urban analysis[J]. Environment and Planning B, 2006, 33(5): 727-748. DOI:10.1068/b32047
[26] Reades J, Calabrese F, Sevtsuk A, et al. Cellular census:Explorations in urban data collection[J]. IEEE Pervasive Computing, 2007, 6(3): 30-38. DOI:10.1109/MPRV.2007.53
[27] Yuan Y, Raubal M. Analyzing the distribution of human activity space from mobile phone usage:An individual and urban-oriented study[J]. International Journal of Geographical Information Science, 2016, 30(8): 1594-1621. DOI:10.1080/13658816.2016.1143555
[28] 杨喜平, 方志祥, 赵志远, 等. 城市人群聚集消散时空模式探索分析——以深圳市为例[J]. 地球信息科学学报, 2016, 18(4): 486-492. [Yang Xiping, Fang Zhixiang, Zhao Zhiyuan, et al. Exploring urban human spatio-temporal convergence-dispersion patterns:A case study of Shenzhen city[J]. Journal of Geo-information Science, 2016, 18(4): 486-492. ]
[29] Gao S, Wang Y, Gao Y, et al. Understanding urban traffic-flow characteristics:A rethinking of betweenness centrality[J]. Environment and Planning B, 2013, 40(1): 135-153. DOI:10.1068/b38141
[30] 王德, 钟炜菁, 谢栋灿, 等. 手机信令数据在城市建成环境评价中的应用——以上海市宝山区为例[J]. 城市规划学刊, 2015, 32(5): 82-90. [Wang De, Zhong Weijing, Xie Dongcan, et al. The application of cell phone signaling data in the assessment of urban built environment:A case study of Baoshan district in Shanghai[J]. Urban Planning Forum, 2015, 32(5): 82-90. ]
[31] 丁亮, 钮心毅, 宋小冬. 上海中心城就业中心体系测度——基于手机信令数据的研究[J]. 地理学报, 2016, 71(3): 484-499. [Ding Liang, Niu Xinyi, Song Xiaodong. Measuring the employment center system in Shanghai central city:A study using mobile phone signaling data[J]. Acta Geographica Sinica, 2016, 71(3): 484-499. ]
[32] Ahas R, Aasa A, Mark U, et al. Seasonal tourism spaces in Estonia:Case study with mobile positioning data[J]. Tourism Management, 2007, 28(3): 898-910. DOI:10.1016/j.tourman.2006.05.010
[33] 张朝枝, 保继刚. 休假制度对遗产旅游地客流的影响——以武陵源为例[J]. 地理研究, 2007, 26(6): 1295-1303. [Zhang Chaozhi, Bao Jigang. Impact of holiday policy upon tourist flow in world heritage site:Taking Wulingyuan of Hunan as a case[J]. Geographical Research, 2007, 26(6): 1295-1303. ]
[34] 赵新波. 基于基站位置定位的客源分析系统的研究[J]. 信息系统工程, 2015(12): 16-17. [Zhao Xinbo. The study of tourists analysis system based on location of base station[J]. China CIO News, 2015(12): 16-17. DOI:10.3969/j.issn.1001-2362.2015.12.008]
[35] 宋小冬, 丁亮, 钮心毅. "大数据"对城市规划的影响:观察与展望[J]. 城市规划, 2015, 39(4): 15-18. [Song Xiaodong, Ding Liang, Niu Xinyi. Influence of big data on urban planning:Review and prospection[J]. Urban Planning, 2015, 39(4): 15-18. DOI:10.11819/cpr20150404a]
[36] Pei T, Sobolevsky S, Ratti C, et al. A new insight into land use classification based on aggregated mobile phone data[J]. International Journal of Geographic Information Science, 2014, 28(9): 1988-2007. DOI:10.1080/13658816.2014.913794
[37] 刘耕, 王晓明, 张均强, 等. 基于信令数据的旅游景区智能管控研究[J]. 电子科技大学学报, 2015, 44(5): 769-777. [Liu Geng, Wang Xiaoming, Zhang Junqiang, et al. Study on intelligent management and control of tourist attraction based on mobile signaling data[J]. Journal of University of Electronic Science and Technology of China, 2015, 44(5): 769-777. ]
[38] 李金昌. 大数据与统计新思维[J]. 统计研究, 2014, 31(1): 10-17. [Li Jinchang. Big data and new mind on statistics[J]. Statistical Research, 2014, 31(1): 10-17. ]
[39] 张珍珍, 李君轶. 旅游形象研究中问卷调查和网络文本数据的对比——以西安旅游形象感知研究为例[J]. 旅游科学, 2014, 28(6): 73-81. [Zhang Zhenzhen, Li Junyi. A comparative study on the data of a questionnaire and web texts in tourism image researches:A case study of Xi'an's tourism image perception[J]. Tourism Science, 2014, 28(6): 73-81. ]
[40] 刘逸, 保继刚, 朱毅玲. 基于大数据的旅游目的地情感评价方法探究[J]. 地理研究, 2017, 36(6): 1091-1105. [Liu Yi, Bao Jigang, Zhu Yiling. Exploring emotion methods of tourism destination evaluation:A big-data approach[J]. Geographical Research, 2017, 36(6): 1091-1105. ]
[41] 张苏, 常芳, 李九全, 等. 大数据支持下城市社区生活空间质量的可获性图谱法初探——以西安为例[J]. 人文地理, 2016, 31(3): 52-59. [Zhang Su, Chang Fang, Li Jiuquan, et al. Preliminary study of geoinformatic tupu method for urban community quality of life space based on big data:A case study of Xi'an[J]. Human Geography, 2016, 31(3): 52-59. ]
表 1 县区漫游用户数与景区游客量相关性分析表 Tab.1 Correlativity Between Internet Traffic and Actual Visitors
表 2 基站网流量与景区游客量相关性分析表 Tab.2 Correlativity Between Internet Traffic and Actual Visitors
表 3 基站话务量与景区游客量相关性分析表 Tab.3 Correlativity Between Telephone Traffic and Actual Visitors
图 1 2014年1—6月慈利县与武陵源区联通网络漫游用户数量对比 Fig.1 The Numbers of Unicom Roaming User in Cili County and Wulingyuan District
图 2 因子一(日常居住区)因子载荷量空间分布 Fig.2 Spatial Correlations of the First Factor-Daily Life Areas
图 3 因子一(日常居住区)网流量变化趋势 Fig.3 Factor No.1 Describing Daily Life Flows
图 4 因子二(重点旅游区)因子载荷量空间分布 Fig.4 Spatial Correlations of the Second Factor-tourism Areas
图 5 因子二(重点旅游区)网流量变化趋势 Fig.5 Factor No.2 Describing Tourism Flows
图 6 因子三(旅游服务区)因子载荷量空间分布 Fig.6 Spatial Correlations of the Third Factor-Tourism Service Areas
图 7 因子三(旅游服务区)网流量变化趋势 Fig.7 Factor No.3 Describing Tourist Transportation Flows
表 4 识别空间因子的实体空间特征方差分析 Tab.4 ANOVA of Each Factors' Spatial Features
基于手机数据可靠性分析的旅游城市功能空间识别研究
赵莹, 张朝枝, 金钰涵