2. 上海市城市化生态过程和生态恢复重点实验室, 上海 200241
2. Shanghai Key Laboratory for Urban Ecological Processes and Eco-Restoration, Shanghai 200241, China
河流水质是近年来得到社会各方关注的重要环境问题, 土地利用方式在一定程度上通过地形、地表径流、雨污管网排放等水文循环及人类活动, 成为影响河流水质的重要因素。因此, 分析土地利用方式对水质的影响, 对于流域和城市环境管理具有重要意义。目前, 水质与土地利用响应关系的研究方法主要包括相关性分析[1]、多元回归分析、冗余分析和聚类分析等[2]。其中, 聚类分析能将数据集分为多个内部具备相似特征而外部明显不同的集群[3], 研究具有代表性的集群有助于深入了解河流水质的空间异质性[4]。水质数据的非线性、高维性和不确定性决定了非线性聚类分析能更合理地用于处理水质数据。自组织神经网络可以通过自组织、自学习的网络可视化方式, 运用非线性映射[5]在低维度上表示高维度的空间数据, 近年来在水资源和水环境管理领域得到了较多应用[6]。此外, 水质与土地利用方式的关系随着空间尺度的变化而改变[7], ZHAO等[8]的研究表明土地利用对河流水质总变化的解释率随着监测点位缓冲区的大小而改变。目前探索不同距离缓冲区对河流水质影响的研究尺度大多集中于部分水质指标, 而针对不同水质聚类集群的最优缓冲区尺度的探讨目前还较少。
上海市地处水系结构复杂的平原河网地区, 河流水文水动力情况与汇水区边界难以界定, 且受人类活动干扰较强[9], 河流水质与河岸带土地利用类型的响应关系具有较强的地域性特点[10], 传统的通过划分子流域进行“土地利用-河流水质”研究的方法较难适用。针对平原河网地区特点, 通过对上海市55个河网水质监测点进行聚类识别, 分析全市水质空间分布格局, 探讨水质与河岸带土地利用的关系及尺度效应, 以期为区域土地格局优化与水环境保护提供参考。
1 材料与方法 1.1 研究区概况上海市地处长江入海口、太湖流域东缘, 面积为6 340 km2; 除西南部有小面积丘陵山地外, 全市基本为平原, 地势差较小; 城市化发展迅速, 是中国目前城市化水平最高的城市。境内河湖众多且大多相通相连, 形成了密布的网状水系, 在水位和水闸的双重影响下, 多数河道流速缓慢且在人工调节下双向流动。截至2016年, 上海市市管、区管、镇管及村级河道共计43 424条(段), 总长28 811.44 km, 面积为494.32 km2, 河网密度为4.54 km·km-2 [11]。2013年上海市主要河湖与入境断面水质属于Ⅲ~劣Ⅴ类, 难以达到相应的功能区要求, 主要污染指标为总磷和氨氮[12]。上海通过开展合流制污水治理工程管控工作, 以点源形式排放的生活污水和工业废水已基本实现截污纳管, 城市和农村地区的地表径流成为影响上海市地表水环境质量的重要因素[13]。
1.2 数据来源水质数据来自于2013年《上海市环境质量报告书》, 根据上海市河流特点及环境现状, 选取pH值、溶解氧(DO)、高锰酸盐指数(CODMn)、化学需氧量(CODCr)、生化需氧量(BOD5)、氨氮(NH3-N)、总磷(TP)、挥发酚(VP)、石油类(Petro)和总氮(TN) 10个代表性水质指标。DO值越高表明水质越好, 除DO和pH外其他各项参数属于污染性指标, 浓度越高表明水体污染越严重。
土地利用数据来源于华东师范大学地理信息科学教育部重点实验室提供的2013年上海市航片及土地利用解译数据。根据GB/T 21010—2007 《土地利用现状分类》解译得出的土地类型分为工业用地、居住用地等28种类型, 并参考赵军[14]的研究结果进行重分类, 将上海市土地利用类型划分为农业用地、城镇建设用地、水域、城市绿地和其他用地5类。
1.3 研究方法 1.3.1 空间尺度的创建上海地处平原河网地区, 河水流向复杂, 同一断面水质受多个方向来水影响[15], 因此利用ArcGIS 10.2软件的空间分析工具将55个水质监测点分别作为地理中心, 划定半径分别为100、200、500和1 000 m的圆形缓冲区, 求取不同缓冲半径内各类土地利用面积占比。选取100 m缓冲区作为最小空间尺度是因为在该尺度下河岸带对河流的影响最直接[16]; 而将1 000 m作为最大空间尺度则是因为当缓冲区大于1 000 m时, 相邻的缓冲区开始重叠。
1.3.2 自组织神经网络自组织特征映射(self-organization feature map- ping, SOM)神经网络是一种用于可视化和解释大型高维数据集的算法, 是可用于无监督模式认知方式的聚类分析[17], 其由输入层和输出层两层人工神经元组成。在SOM算法中, 所有样本被视为经变量定义的n维输入向量由输入层输入到神经网络中, 输入层的权重向量与每个神经元相关联[18]。输出神经元通过领域关系与相邻向量连接, 经历初始化、竞争、选择获胜神经元和相似向量聚类4个步骤, 最终决定映射的拓扑结构。K-means算法是一种基于样本相似度通过迭代过程将数据集划分为不同类别, 使得聚类内部样本差异小、不同聚类差异大的聚类方法。笔者采用SOM+K-means两阶段聚类方法, 以SOM聚类为初始处理聚类方法, 求取聚类数N的合理区间和各类最终的聚类中心, 再基于K-means算法将通过SOM得出的庞大聚类数N再次进行聚类, 以提高聚类的精确性, 最终选取Davies & Bouldin指数(DBI)最低的最优分类, 达到两阶段聚类的效果[19]。采用SOM Toolbox 2.0 for Matlab程序包和Matlab 2017b软件完成所有计算。将基于非等级K-means分类的SOM方法应用于上海市河网水质空间特征识别, 具体步骤如下。
(1) 将上海市55个监测站点的10项水质数据输入SOM网络, 应用拓扑值计算网络大小以选择神经元数量, 并根据量化误差(QE)和拓扑图形误差(TE)的最小值确定输出神经元数量和可视化结构, 采用QE确定所建立的神经网络用于区分原始输入数据的能力, 而TE可用于测试神经网络质量, 即评估网络是否适用于训练[5]。确定神经网络数量和可视化结构后, 经过迭代训练得出各项指标聚类的权重值。
(2) 将从SOM聚类结果中得到的权重值作为初始聚类中心, 结合DBI索引选择最佳聚类数量执行K-means计算。上述聚类组合算法可保持SOM网络的自组织特性和K-means算法的高效率, 弥补SOM网络过度收敛时间和K-means算法初始聚类中心值选择范围小的缺陷。
1.3.3 冗余分析冗余分析(RDA)是一种有约束的线性排序技术, 可从统计学角度评价2个多元数据集之间的关系[20]。冗余分析能用于对多解释变量进行统计检验, 从独立和整体2个尺度表达解释变量对响应变量的方差贡献率, 并可通过排序图展示各变量内和变量间的关系, RDA已被广泛应用于动植物群落组成与环境因子关系及类似研究中[21]。
笔者将各聚类的水质数据分别作为环境变量, 将土地利用类型数据作为解释变量, 采用Canoco 4.5软件对水质数据进行趋势对应分析(DCA), 根据排序轴第1轴长度, 确定选取的线性模型[22]。结果显示, 排序轴第1轴长度均小于3, 因此, 选择RDA对水质与土地利用类型的相关性进行分析。
2 结果与分析 2.1 水质空间格局的识别选择拓扑值确定网格大小, 基于SOM+K-means模型将55个监测站点的10项水质数据作月测数据均值化处理后进行聚类, 确定当神经元数为36个(9×4)时, 神经细胞获得最佳网络训练效果, 此时QE和TE值分别为1.316和0.018。SOM映射图上不同水质参数的分布见图 1。
由图 1可知, 处于映射图左上方的pH值和溶解氧(DO)浓度较高, 且向右下方逐渐降低。高锰酸盐指数(CODMn)、化学需氧量(CODCr)和生化需氧量(BOD5)具有相似的分布类型, 其数值均是从左下方向右上方逐渐降低, 意味着这些水质参数之间存在较强的相关性。而氨氮(NH3-N)、总磷(TP)和总氮(TN)浓度都由左上角向右下角呈逐渐递增趋势, 也体现出较强的相关性。此外, 挥发酚(VP)和石油类(Petro)的高值主要出现在右下角。当不同聚类中平均方差值小于5%时, DBI最低, 相应聚类数可以看作是最佳聚类结果。输入训练好的神经元节点权重后, 通过K-means聚类分析并结合DBI选择聚类数量。DBI最小值为0.743 7, 即确定在4个簇处时, 聚类达到最佳分类效果(图 2)。
由图 2~3可知, 聚类Ⅰ中监测点主要分布在淀山湖、黄浦江上游、浦东大治河和崇明岛南引河等上海市远郊地区。聚类Ⅱ中监测点基本上分布在苏州河流域。聚类Ⅲ中监测点大多分布在城市近郊的嘉定区、宝山区的蕴藻浜及其支流附近。而黄浦江下游、川杨河监测点大多集中在聚类Ⅳ中。
按照GB 3838—2002《地表水环境质量标准》, 评估不同聚类水质参数的等级。为统一进行评价, 总氮按湖、库标准评级。由表 1可知, 聚类Ⅰ总体水质最好, 仅总氮属于劣Ⅴ类, 其余水质指标均为Ⅲ或Ⅲ类以上。聚类Ⅱ、Ⅲ总体水质较差, 氨氮、总磷和总氮均属于劣Ⅴ类, 其中, 聚类Ⅲ总体水体污染形势最严峻。所有聚类中总氮均为劣Ⅴ类, 除总氮外, 氨氮(NH3-N)、总磷(TP)等营养型污染物是聚类Ⅱ、Ⅲ和Ⅳ的主要污染物。石油类污染物在各聚类间的差异性较明显, 除在聚类Ⅰ中水质评级为Ⅰ类外, 其他聚类均为Ⅳ类。
可见, 上海市水质空间分布存在较明显的差异性:淀山湖、崇明岛和黄浦江上游等远郊地区河流水质较好, 而苏州河沿线、蕴藻浜及其支流等城市近郊河流水质相对较差。
2.2 不同聚类中土地利用类型最优尺度识别由图 4可知, 各缓冲区聚类Ⅰ的城镇建设用地面积占比均明显小于其他聚类。除聚类Ⅰ外, 其他聚类的主要土地利用类型均为城镇建设用地。100、200和500 m缓冲区内聚类Ⅱ的农业用地面积占比均很小, 在1 000 m缓冲区尺度上有明显增大趋势。就聚类Ⅳ而言, 除城镇建设用地和水域外, 其他用地类型面积占比较小。
由图 5可知, 就聚类Ⅰ、Ⅲ、Ⅳ而言, 500 m缓冲区空间尺度对于水质参数的解释率最高, 分别为43.9%、56.1%和44.9%。各聚类缓冲区尺度从100 m扩大至500 m时, 土地利用解释水质变化的幅度较显著, 各聚类平均解释率增加14.08百分点, 而缓冲区由500 m扩大至1 000 m时, 总解释率除聚类Ⅱ外均呈下降趋势。这表明对于上海市水质的不同聚类而言, 土地利用类型总体影响的最大空间尺度为500 m, 这与ZHAO等[8]研究得出的400 m缓冲区对上海市水质解释率最大的结论较吻合。但对于苏州河沿线的聚类Ⅱ而言, 1 000 m缓冲区尺度对聚类Ⅱ的总解释率最高, 达59.1%。
为进一步研究土地利用对河流水质的解释能力, 对10项水质指标和5种土地利用方式进行排序(图 6)分析。
结合图 6和表 2可知, 对于不同聚类的不同最佳尺度, 城镇建设用地都具有较高的方差贡献率, 在聚类Ⅰ的500 m缓冲区, 城镇建设用地的解释率高达35.0%。这表明上海市城镇建设用地是影响河流水质的主要因子, 且水质污染程度随着缓冲区范围增加到500 m时累积效果最显著。在聚类Ⅱ的1 000 m缓冲区, 对水质解释率最高的土地利用类型是农业用地, 解释率达44.3%。
由图 4可知, 聚类Ⅱ的1 000 m缓冲区内农业用地面积占比较该聚类其他空间尺度上农业用地面积占比有显著增长, 这解释了在此情境下农业用地对水质解释率高的原因。
Spearman秩相关分析显示, 各聚类城镇建设用地与大多数污染水质指标之间存在正相关关系。就聚类Ⅰ而言, 在0.05显著水平上, 城镇建设用地与氨氮、挥发酚和石油类呈正相关, 系数分别为0.625、0.597和0.632。在0.01显著水平上, 城镇建设用地与CODCr呈正相关, 系数为0.664。就聚类Ⅲ而言, 在0.05显著水平上, 城镇建设用地与氨氮呈正相关, 系数为0.683, 这与前人的研究结果[16]较一致, 表明与其他土地利用类型相比, 城镇建设用地是上海这个高度城市化地区非点源污染的主要来源。而就不同聚类的空间最佳响应尺度而言, 图 4显示聚类Ⅰ中城镇建设用地面积占比相较于其他聚类而言处于最低水平, 但图 7显示, 就聚类Ⅰ而言, 各水质指标与城镇建设用地的相关性最强, 水质较差的聚类Ⅱ与城镇建设用地的相关性较低, 这说明在淀山湖、黄浦江上游、大治河和崇明岛等远郊地区的水质与城镇建设用地的响应相较于水质较差的城市近郊地区更敏感。
大多数研究揭示了农业土地利用与河流水质之间的正相关关系, 普遍认为农业尤其是在城市化程度较低的集水区施肥和畜牧业所产生的营养成分是非点源污染的主要贡献来源[23]。但笔者研究中, 所有聚类的农业用地与溶解氧均呈正相关关系, 且聚类Ⅱ呈显著正相关(P < 0.01);农业用地与大多数营养型水质指标呈负相关关系, 特别是就聚类Ⅲ而言, 氨氮、TN与农业用地呈显著负相关(P < 0.01或P < 0.05)。由图 4可知, 就各聚类最优尺度而言, 除聚类Ⅰ城镇建设用地面积占比略小于农业用地面积占比外, 其余各聚类城镇建设用地面积占比均远大于农业用地面积占比。该结果印证了ZHAO等[8]、TU [24]对上海、波士顿的研究结论, 即在一些高度城市化流域, 由于城镇建设用地面积占比高于农业用地面积占比, 农业用地对水质污染的贡献可能会在一定程度上为其他土地利用类型所掩盖。
3 结论(1) SOM+K-means模型分析结果显示, 上海市水质存在较强的空间异质性:城市远郊地区的聚类Ⅰ水质最优, 苏州河沿线的聚类Ⅱ与城市近郊的聚类Ⅲ水质状况较差, 黄浦江下游的聚类Ⅳ水质处于中等水平。总氮、氨氮和总磷等营养型污染物是上海水质污染的主要贡献因子。
(2) RDA分析结果显示, 聚类Ⅰ、Ⅲ和Ⅳ的最佳空间响应尺度为500 m, 解释率分别为43.9%、56.1%和44.9%;而聚类Ⅱ的最佳空间响应尺度为1 000 m, 解释率为59.1%。
(3) 在最优响应尺度下, 城镇建设用地对各聚类水质的解释率较大, 且与多数水质污染指标呈正相关关系, 说明城市化地区不透水路面的地表径流、生活污染排放等对水质的影响较明显。因此, 控制城市地表径流污染是进一步改善上海市河流水质的重要途径。
(4) 该文讨论了土地利用与水质聚类的关系, 今后可应用SOM神经网络对土地利用类型、景观斑块指数与水质参数进行聚类, 进一步探讨不同空间尺度下水质与土地利用、景观格局的关系。
[1] |
项颂, 庞燕, 窦嘉顺, 等. 不同时空尺度下土地利用对洱海入湖河流水质的影响[J]. 生态学报, 2018, 38(3): 876-885. [ XIANG Song, PANG Yan, DOU Jia-shun, et al. Impact of Land Use on the Water Quality of Inflow River to Erhai Lake at Different Temporal and Spatial Scales[J]. Acta Ecologica Sinica, 2018, 38(3): 876-885.] (0) |
[2] |
SHEN Z Y, HOU X S, LI W, et al. Relating Landscape Characteristics to Non-Point Source Pollution in a Typical Urbanized Watershed in the Municipality of Beijing[J]. Landscape and Urban Planning, 2014, 123: 96-107. DOI:10.1016/j.landurbplan.2013.12.007 (0) |
[3] |
NGUYEN T T, KAWAMURA A, TONG T N, et al. Clustering Spatio-Seasonal Hydrogeochemical Data Using Self-Organizing Maps for Groundwater Quality Assessment in the Red River Delta, Vietnam[J]. Journal of Hydrology, 2015, 522: 661-673. DOI:10.1016/j.jhydrol.2015.01.023 (0) |
[4] |
PARK Y S, KWON Y S, HWANG S J, et al. Characterizing Effects of Landscape and Morphometric Factors on Water Quality of Reservoirs Using a Self-Organizing Map[J]. Environmental Modelling & Software, 2014, 55: 214-221. (0) |
[5] |
KOHONEN T.Software Tools for SOM[M]//Self-Organizing Maps. Berlin: Springer, 2001: 311-328. DOI: 10.1007/978-3-642-56927-2_8.
(0) |
[6] |
BRENTAN B, MEIRELLES G, LUVIZOTTO E Jr, et al. Hybrid SOM+ K-means Clustering to Improve Planning, Operation and Management in Water Distribution Systems[J]. Environmental Modelling & Software, 2018, 106: 77-88. (0) |
[7] |
DING J, JIANG Y, LIU Q, et al. Influences of the Land Use Pattern on Water Quality in Low-Order Streams of the Dongjiang River Basin, China:A Multi-Scale Analysis[J]. Science of the Total Environment, 2016, 551/552: 205-216. DOI:10.1016/j.scitotenv.2016.01.162 (0) |
[8] |
ZHAO J, LIN L, YANG K, et al. Influences of Land Use on Water Quality in a Reticular River Network Area:A Case Study in Shanghai, China[J]. Landscape and Urban Planning, 2015, 137: 20-29. DOI:10.1016/j.landurbplan.2014.12.010 (0) |
[9] |
黄沈发, 王敏, 车越, 等. 平原河网地区水源地水质对土地利用变化的响应:以黄浦江上游水源地为例[J]. 生态与农村环境学报, 2006, 22(4): 14-19. [ HUANG Shen-fa, WANG Min, CHE Yue, et al. Effect of Land Use on Water Quality in Waterhead Region in River Network Plain:A Case Study of the Upper Huangpu River[J]. Journal of Ecology and Rural Environment, 2006, 22(4): 14-19. DOI:10.3969/j.issn.1673-4831.2006.04.003] (0) |
[10] |
CHE Y, YANG K, WU E N, et al. Assessing the Health of an Urban Stream:A Case Study of Suzhou Creek in Shanghai, China[J]. Environmental Monitoring and Assessment, 2012, 184(12): 7425-7438. DOI:10.1007/s10661-011-2510-z (0) |
[11] |
上海市水务局.上海市河道(湖泊)报告[R].上海: [出版者不详], 2017.
(0) |
[12] |
上海市环境保护局.上海市环境质量报告书[R].上海: [出版者不详], 2013.
(0) |
[13] |
谢雨杉, 刘敏. 城市非点源污染特征及控制管理[J]. 环境保护, 2008, 36(22): 18-20. DOI:10.3969/j.issn.0253-9705.2008.22.007 (0) |
[14] |
赵军.平原河网地区景观格局变化与多尺度环境响应研究[D].上海: 华东师范大学, 2008. [ZHAO Jun. Landscape Pattern Change and Its Environmental Response Across Multiple Spatial Scales in Tidal Plain[D]. Shanghai: East China Normal University, 2008.]
(0) |
[15] |
赵军, 杨凯, 邰俊, 等. 河网城市不透水面的河流水质响应阈值与尺度效应研究[J]. 水利学报, 2012, 43(2): 136-142. [ ZHAO Jun, YANG Kai, TAI Jun, et al. Threshold and Scaling Effect of Impervious Surface Impact on Stream Water Quality in City With River Networks[J]. Journal of Hydraulic Engineering, 2012, 43(2): 136-142.] (0) |
[16] |
PRATT B, CHANG H. Effects of Land Cover, Topography, and Built Structure on Seasonal Water Quality at Multiple Spatial Scales[J]. Journal of Hazardous Materials, 2012, 209/210: 48-58. DOI:10.1016/j.jhazmat.2011.12.068 (0) |
[17] |
ZHOU P, HUANG J L, PONTIUS R G, et al. New Insight Into the Correlations Between Land Use and Water Quality in a Coastal Watershed of China:Does Point Source Pollution Weaken It?[J]. Science of the Total Environment, 2016, 543: 591-600. DOI:10.1016/j.scitotenv.2015.11.063 (0) |
[18] |
LETRÉMY P, COTTRELL M.Data Analysis Using Self-Organizing Maps[C]//European Symposium on Time Series Prediction ESTS'08.[s. l.]: [s. n.], 2008.
(0) |
[19] |
DAVIES D L, BOULDIN D W. A Cluster Separation Measure[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1979, PAMI-1(2): 224-227. DOI:10.1109/TPAMI.1979.4766909 (0) |
[20] |
尹锴, 崔胜辉, 石龙宇, 等. 人为干扰对城市森林灌草层植物多样性的影响:以厦门市为例[J]. 生态学报, 2009, 29(2): 563-572. [ YIN Kai, CUI Sheng-hui, SHI Long-yu, et al. Human-Induced Disturbance on the Understory Plant Diversity of Urban Forest:A Case Study of Xiamen[J]. Acta Ecologica Sinica, 2009, 29(2): 563-572. DOI:10.3321/j.issn:1000-0933.2009.02.002] (0) |
[21] |
MAKARENKOV V, LEGENDRE P. Nonlinear Redundancy Analysis and Canonical Correspondence Analysis Based on Polynomial Regression[J]. Ecology, 2002, 83(4): 1146-1161. DOI:10.1890/0012-9658(2002)083[1146:NRAACC]2.0.CO;2 (0) |
[22] |
SLIVA L, DUDLEY WILLIAMS D. Buffer Zone Versus Whole Catchment Approaches to Studying Land Use Impact on River Water Quality[J]. Water Research, 2001, 35(14): 3462-3472. DOI:10.1016/S0043-1354(01)00062-8 (0) |
[23] |
HAIDARY A, AMIRI B J, ADAMOWKI J, et al. Assessing the Impacts of Four Land Use Types on the Water Quality of Wetlands in Japan[J]. Water Resources Management, 2013, 27(7): 2217-2229. DOI:10.1007/s11269-013-0284-5 (0) |
[24] |
TU J. Spatially Varying Relationships Between Land Use and Water Quality Across an Urbanization Gradient Explored by Geographically Weighted Regression[J]. Applied Geography, 2011, 31(1): 376-392. DOI:10.1016/j.apgeog.2010.08.001 (0) |