文章快速检索     高级检索
  生态与农村环境学报  2019, Vol. 35 Issue (11): 1475-1483   DOI: 10.19741/j.issn.1673-4831.2019.0205
0
基于决策树模型的水稻镉超标空间识别及预测研究
王院民 1, 陈东湘 2, 仝桂杰 1, 颜道浩 1, 李富富 1, 吴绍华 3,4    
1. 南京大学地理与海洋科学学院, 江苏 南京 210023;
2. 浙江财经大学东方学院, 浙江 海宁 314408;
3. 浙江财经大学土地与城乡发展研究院, 浙江 杭州 310018;
4. 国土资源部城市土地资源监测与仿真重点实验室, 广东 深圳 510034
摘要:为探究水稻籽粒中Cd元素的超标风险及其与环境要素之间的关系,筛选了11个环境因子,基于决策树模型,识别出影响水稻Cd超标的主控因子,并建立超标空间预测技术。结果表明,距交通运输用地距离、土壤有机质含量和无定形铁含量为研究区水稻Cd超标的主控因子。经验证,提取的研究区水稻籽粒Cd超标识别规则的精度为85.71%。进一步运用隶属度空间制图法,以有限的样点对研究区水稻籽粒Cd超标进行空间分布预测制图,分类精度达到91.67%,该结果精度比单纯的决策树和传统插值制图方法都有较大提高。构建的决策树模型能较好地预测水稻籽粒Cd超标的空间分布,对研究区水稻Cd超标空间识别与分区管控有实践意义。
关键词决策树    Cd    水稻籽粒    识别规则    隶属度制图    
Spatial Recognition and Prediction of Rice Cd Over-standard Based on Decision Tree Model
WANG Yuan-min 1, CHEN Dong-xiang 2, TONG Gui-jie 1, YAN Dao-hao 1, LI Fu-fu 1, WU Shao-hua 3,4    
1. School of Geographic and Oceanographic Sciences, Nanjing University, Nanjing 210023, China;
2. Dongfang College, Zhejiang University of Finance and Economics, Haining 314408, China;
3. Land and Urban-Rural Development College, Zhejiang University of Finance and Economics, Hangzhou 310018, China;
4. Key Laboratory of Urban Land Resources Monitoring and Simulation, Ministry of Land and Resources, Shenzhen 510034, China
Abstract: Cadmium contamination of rice grains has become an important factor affecting the quality and safety of rice in China. To explore relationships between Cd contamination in rice and various environmental factors, spatial mapping was carried out. Eleven environmental factors were selected for study. Using a decision tree model and a reasoning mapping method, the main factors controlling Cd contamination in rice were identified in a case study area, and a spatial prediction technology for identifying rice with Cd levels in excess of the Chinese standard was established. The results show that transportation distance, soil organic matter content and amorphous iron content were the main factors correlated with Cd contamination in rice. Rice having Cd contents exceeding the standard in the study area were extracted and classified into five grades according to their associated risk degree. The empirical accuracy of this classification method was 85.71%. In addition, a subordinate degree spatial analysis method was used to make spatial predictions of rice areas having Cd levels exceeding the standard threshold, based on information from limited sampling points. The classification accuracy using this method reached to 91.67%, representing a marked improvement, compared with the simple decision tree and traditional interpolation mapping results. However, the decision tree model developed in this study predicts the spatial distribution of Cd contamination risk in rice, making it of practical significance to mitigating Cd contamination risks in rice.
Key words: decision tree    Cd    rice grain    recognition rule    subordination mapping    

随着我国工农业快速发展, 越来越多的有害物质随着工业排放、大气沉降、化肥与农药滥用等方式进入土壤中, 其中由重金属所造成的土壤环境问题尤为严重[1]。据调查显示, 耕地土壤中Cd元素污染问题最严重, 其点位超标率达到7.0%[2]。水稻是重金属Cd易富集农作物, 易使Cd通过食物链进入人体, 影响人体健康。人体摄入过量Cd元素可能会导致高血压、肾功能失调和心脑血管疾病[3-4]。如今, 重金属Cd污染已成为影响我国水稻品质安全的重要因素[5-6]

作物中Cd含量会随着所处环境不同而呈现出不同的富集状态[7], 探讨不同环境中水稻Cd超标空间识别及预测问题, 对因地制宜制定水稻Cd污染防范措施具有很现实的指导意义。当前作物重金属空间分布及其影响因素研究中, 较常用研究方法有地统计法[8]、GIS空间分析法[9]、随机森林模型法[10]以及主成分分析(PCA)和相关性分析(CA)等多元统计法[11]。但单用这些分析方法都存在一定局限性。地统计法一般适用于重金属污染程度较低且母质污染与外界污染差值不大的区域; GIS空间分析法所利用的空间插值虽能直观表征空间分布, 但由于污染物空间分布影响因素多, 存在较大不确定性; PCA和CA等多元统计方法中相互校验一般需要在研究过程中采取足够多的样本才能达到空间识别效果[12]; 随机森林模型法、人工神经网络法等则难以提取具体的空间识别规则。因此, 采用多方法整合以弥补单一方法的缺陷, 是当前提高作物重金属空间分布识别和制图精度的重要途径。

为解决传统制图精度较低的问题, 采用整合决策树模型与隶属度空间制图方法对水稻籽粒Cd超标空间进行识别和预测。相较于只采用决策树制图方法, 采用隶属度空间制图方法可将水稻籽粒Cd超标类型与环境之间的关系表示为一系列隶属度函数, 即将传统非0即1的二元逻辑假设转化为0~1的隶属度形式, 以表达水稻Cd超标类型与多环境因子之间的非线性关系, 能更好地反映水稻籽粒Cd超标空间分布的渐变特征, 从而提高空间制图精度。研究目标包括(1)识别影响水稻籽粒Cd超标的主控因子; (2)构建水稻籽粒Cd超标与环境因子之间的决策树模型, 并进行超标区域空间预测; (3)提取水稻籽粒Cd元素的超标识别规则, 通过隶属度分析开展水稻超标风险的空间分布预测制图研究, 旨在为研究区水稻Cd超标风险识别与分区管控提供决策支持。

1 材料与方法 1.1 研究区概况

斗门区位于珠江三角洲南端, 珠海市西部, 东连中山市, 北依江门市, 介于北纬21°59′~22°25′、东经113°0.5′~113°25′之间(图 1)。该区下辖5个镇, 总面积为674.8 km2。斗门区地貌类型以低山、丘陵、台地、沉积平原和仍在发育的滩涂为主, 呈现出明显的层状地貌。全区平原宽广, 低山突屹, 孤丘众多, 水道交错, 河涌密布, 整体地形趋势为东北部低于西南部。由于研究区位于西江入海口, 上游污染物经搬运沉积会在土壤中富集; 同时, 研究区内乡镇企业分布较密集, 其排放的污染物也加剧了污染程度, 导致研究区土壤重金属富集, 重金属易通过土壤-水稻系统迁移到水稻籽粒中。

图 1 研究区概况及采样点分布 Fig. 1 Survey of the study area and distribution of sampling points
1.2 采样方法与样品测试

根据水稻田空间分布情况, 于2018年6月底在研究区随机设66个采样点采集水稻籽粒和水稻根际土壤样品, 同时再设土壤采样点65个(图 1)。研究区污染工厂点位空间数据采用Python 3.7软件获取。将每个水稻采样点所处农田分成5小块, 在每小块采集5株水稻, 把整块农田25株水稻的籽粒混合后作为1份水稻籽粒样品, 将籽粒脱壳、脱糠后, 贮存于编号塑料袋中备用。采集水稻的同时采集水稻根基土壤。在每个土壤采样点将边长为10 m的正三角形顶点与中心处各取1 kg土壤, 混匀后取1 kg作为该样点土壤样品。根际土壤和土壤样品均为表层0~20 cm土壤。

在实验室将水稻籽粒样品烘干、称重、粉碎, 采用HNO3-HClO4溶液对0.1 g水稻籽粒样品进行混酸处理, 采用电感耦合等离子体质谱(ICP-MS, Agilent 7700X)测定水稻籽粒Cd含量。先后在土壤样品中加入HF、HNO3和HClO4对样品进行消煮, 然后采用石墨炉原子吸收法测定土壤样品中全量Cd含量。测试过程均加入生物成分分析标准物质(GBW10044)进行质量控制, 回收率为90%~111%。具体的样品测试结果见表 1

表 1 水稻籽粒、根际土壤和土壤Cd含量测试结果分析 Table 1 Analysis of Cd content in rice grain, rhizosphere soil and soil
1.3 决策树模型的构建 1.3.1 决策树模型构建原理

决策树一般由根节点、分叉点和叶子节点3部分组成。首先将所采集样本按一定比例分为训练样本和检验样本, 设训练样本S的个数为s, 被分为m类, 每种类别分别记为Ci(i=1, 2, …, m), Ci类样本个数为si, 则Ci类中存在si的概率记为pi, 样本分类所需要的分类期望记为I(s1s2,…,sm), 其计算公式为

$ {p_i} = {s_i}/s, $ (1)
$ {I_{\left( {{s_1}, {s_2}, \cdots , {s_m}} \right)}} = - \sum\limits_{i = 1}^m {{p_i}} {\log _2}{p_i}。$ (2)

假设属性A可以将训练样本S划分为n个子集, 记为sj(j=1, 2, …, n), sij为子集sj中属于Ci类的个数, 则Ci类中存在子集sj中样本的概率记为pij, 子集sj样本需要的分类期望记为I(s1js2j,…,smj), 按属性A划分成子集的期望记为EA, 训练样本S按属性A分类所得到的信息增益(Gain值)记为GA, 其计算公式为

$ {p_{ij}} = {s_{ij}}/{s_j}, $ (3)
$ {I_{\left( {{s_{1j}}, {s_{2j}}, \cdots , {s_{mj}}} \right)}} = \sum\limits_{i = 1}^m {{p_{ij}}} {\log _2}{p_{ij}}, $ (4)
$ {E_{\rm{A}}} = \sum\limits_{j = 1}^n {\frac{{{s_{1j}}, {s_{2j}}, \cdots , {s_{mj}}}}{s}} {I_{\left( {{s_1}, {s_{2j}}, \cdots , {s_{nj}}} \right)}}, $ (5)
$ {G_{\rm{A}}} = {I_{\left( {{s_{1j}}, {s_{2j}}, \cdots , {s_{mj}}} \right)}} - {E_{\rm{A}}}。$ (6)

按相同方法得到所有属性的Gain值, 将训练样本按Gain值最大的属性进行分类, 然后自上向下利用递归法构建所有决策树分支。决策树从根节点到子节点的每一个分支都代表着一种分类规则, 每条分支上的节点都代表着该规则的限制条件, 对每条规则进行逐一提取、编号及精度分析, 最终实现水稻籽粒中Cd超标的具体识别。

1.3.2 决策树模型构建方法及精度验证

影响水稻籽粒Cd含量的环境因子可分为自然因素和人为因素, 自然因素包括土壤Cd含量、土壤有机质含量、土壤pH值、砂粒含量、土壤全Fe含量、土壤无定形Fe含量和距河流水面距离, 人为因素包括距城镇村及工矿用地距离、距交通运输用地距离、距污染企业距离和夜间灯光指数。

依据GB 15618—2018《土壤环境质量农用地土壤污染风险管控标准(试行)》和GB 2762—2017《食品中污染物限量》, 并结合实际情况, 将样本各属性分为超标(F)和不超标(T)2类, 尽量使2类样本数量差别不大, 避免决策树因一侧数目过少而被剪枝, 具体分类标准见表 2。在决策树模型中计算得到各环境因子Gain值, Gain值可表示环境因子为决策树模型构建带来的信息量, 能用来直接衡量各环境因子贡献度大小。某环境因子Gain值越大, 则该环境因子特征越重要。构建决策树模型时选择Gain值较大的环境因子对应的水稻样点数据。

表 2 各环境因子属性分类和贡献度 Table 2 Attribute classification and contribution degree of environmental factors

42个采样点数据用于构建决策树模型, 其他24个采样点数据用于隶属度制图精度验证。将构建决策树模型的42个采样点从研究区左上到右下依次编号为1~42, 并按5:1比例进行分配, 得到训练样本35个和预测样本7个, 采取编号等间隔6的样本为预测样本的分层取样法, 将这6组样本依次放在决策树模型中生成决策树。决策树构建完成后以预测样本遍历所构建的决策树模型, 将模型预测结果与样本实际结果进行比较, 从而得到决策树预测精度。

1.4 隶属度制图

隶属度制图模型是在土壤-景观模型基础上对定量模型进行重新制图的过程[13-15]。该模型采用系统论方法论述了土壤发生过程与景观要素之间的关系, 为空间预测分布制图提供了很大便利[16-19]。隶属度制图步骤如下。

(1) 类型隶属度的计算。类型隶属度为某个分类类型与环境因子组合之间的相似度[20-21]。先提取某超标类型与单个环境因子之间的隶属度函数, 进而计算该超标类型与环境因子之间的隶属度。再计算该超标类型与环境因子组合之间的隶属度, 即采用limiting factor方法综合上一步计算得到的单环境因子隶属度。超标类型会受到隶属度最小的环境因子限制, 以环境因子组合之间的最小单环境因子隶属度作为该超标类型的隶属度。最后计算该超标类型与多个环境因子组合之间的隶属度。当某超标类型对应多个环境因子组合时, 采用模糊最大算子方法实现多环境因子组合之间隶属度的综合。选择多个环境因子组合中数值最大的隶属度作为该超标类型的类型隶属度。

(2) 类型隶属度图的硬化。硬化是对每个图像像元进行综合分析, 每个像元会形成1个类型的隶属度向量。设m种类型对应的隶属度向量分别为Ai(i=1, 2, …, m), 当Ai为最大值时, 认为该像元所属类型为第i种。

(3) 精度验证。类型隶属度图硬化完成后, 需进行solimsolution 2015软件与ArcGIS 10.2软件之间的格式转换, 以便能更好地进行空间制图表达。精度评价时采用混淆矩阵方法进行分析, 分析指标为生产精度、用户精度和总分类精度[22-23]

2 结果与分析 2.1 影响水稻籽粒Cd含量的各环境因子贡献度

表 2所示, 距交通运输用地距离、土壤SOM含量和土壤无定形Fe含量为影响水稻籽粒Cd含量的主控环境因子; 而研究区土壤Cd含量和土壤砂粒含量空间变异小, 是影响水稻Cd含量的非主控因子。

2.2 决策树的构建

综合考虑研究区实际情况和水稻籽粒Cd含量各环境因子的贡献度分析结果(表 2), 选择距交通运输用地距离(Dist-road)、土壤SOM含量(SOM)、土壤无定形Fe含量(A-Fe)和土壤pH值(pH)4个环境因子构建决策树。公路交通污染是影响公路两侧农产品质量安全的重要因子之一, 距交通运输用地距离越小, 水稻籽粒Cd污染越严重, Cd活性越强[24]。土壤SOM含量对水稻Cd含量的影响主要体现在有机胶体对金属离子的强交换和吸附能力, 土壤SOM含量过低时, 增加其含量可减少作物中重金属含量, 而SOM含量较高时, 增加重金属活性, 反而会加重重金属污染[25]。土壤无定形Fe能吸附土壤重金属, 降低土壤中有效态Cd含量, 进而减少植物对Cd的吸收[26]。土壤pH值则通过影响重金属在土壤中的溶解度来影响其行为, 增加pH值会大大降低作物中Cd活性[27]

决策树模型共生成6棵决策树(图 2)。如图 2所示, 决策树1~5分支中都存在超标(F)和不超标(T)的情况, 决策树6由于分层抽样时超标样本数目较少, 决策树结果全为T, 作为特殊情况不予考虑。决策树1~4只包含距交通运输用地距离、土壤SOM含量和土壤pH值3个环境因子, 这是由于训练样本中土壤无定形Fe含量的Gain值较小。决策树5中则包含所有4个环境因子, 这说明该决策树训练样本集模拟结果较好, 满足研究要求。

pH为土壤pH值, Dist-road为距交通运输用地距离, SOM为土壤SOM含量, A-Fe为土壤无定形Fe含量。F和T分别为超标和不超标。 图 2 决策树模型所产生的决策树简图 Fig. 2 A decision tree diagram generated by the decision tree model
2.3 水稻Cd元素超标的识别规则及精度分析

基于5棵决策树, 对每个分支逐一进行规则提取, 共得到22条水稻Cd超标的识别规则。去除存在许多重复的规则, 并根据每条规则超标情况及出现次数, 将水稻籽粒Cd超标可能性按从大到小顺序划分为A~E 5个等级, 最终得到判断水稻籽粒Cd超标与否的5条识别规则(表 3)。

表 3 水稻超标决策树识别规则的提取 Table 3 Extraction of over-standard rules for rice

为验证决策树模型可靠性, 利用每组验证样本依次对每棵决策树进行精度验证,结果见表 4

表 4 验证样本进行模型验证的精度 Table 4 Validation samples to validate the model accuracy

表 4所示, 每棵决策树验证精度>70%, 且平均精度为85.71%。对精度数据进行统计分析, 得到标准差为14%, 方差为2%。这表明构建的决策树模型比较稳定, 能够用于对水稻籽粒Cd超标情况进行风险识别。

2.4 隶属度制图与精度分析 2.4.1 水稻Cd超标的隶属度

为在空间上对研究区水稻籽粒Cd污染进行风险识别, 根据决策树模型计算结果采用solimsolution 2015软件添加规则(表 2), 构建pH、SOM、Dist-road和A-Fe的单环境因子隶属度曲线, 得到研究区规则库, 推理得到研究区水稻籽粒Cd超标隶属度分布(图 3)。隶属度值介于0~100之间, 隶属度值越大, 则表示该空间像元内水稻籽粒Cd超标风险越高。如图 3所示, 隶属度高值区主要分布在研究区中部、西部和北部区域, 而低值区主要分布在研究区东部和南部地区。

图 3 研究区水稻Cd超标的隶属度分布 Fig. 3 Distribution map of subordinate degree of rice Cd over-standard in study area
2.4.2 水稻超标隶属度图的硬化

图 3并不能直接得到研究区水稻Cd空间超标风险, 还需要利用solimsolution 2015软件进行硬化处理。硬化采用最大隶属度法, 即对同一个像元, 比较其对应的水稻Cd超标与不超标的隶属度值大小, 最后将隶属度较大的水稻Cd超标类型作为该像元的值。对研究区所有像元进行分析后, 得到研究区水稻Cd污染风险规则推理制图(图 4)。

图 4 研究区水稻Cd污染风险隶属度制图 Fig. 4 Mapping of subordinate degree of Cd pollution risk of rice in study area
2.4.3 隶属度制图精度验证

为分析隶属度制图效果, 采用ArcGIS 10.2软件对用于构建决策树模型的研究区42个采样点水稻籽粒Cd实测值进行反距离插值制图(图 5)。反距离插值原理为以插值点与样本间的距离为权重进行加权, 对离插值点越近的采样点赋予的权重越高。

图 5 研究区水稻Cd污染风险识别插值图 Fig. 5 Interpolation map of rice Cd pollution risk identification in study area

(1) 制图效果评价。如图 4~5所示, 隶属度制图与传统插值图结果相似度较高, 都可以表明研究区水稻籽粒Cd污染风险安全区域范围明显大于超标区域范围的分布特征, 且超标区域主要分布在研究区中部和东北部, 这在一定程度上也验证了决策树模型的可靠性。由于水稻Cd超标受生长区域环境制约, 环境的复杂性决定了超标区域的分散性。隶属度制图超标区域更为分散, 不是大面积区域超标, 这在一定程度上更加符合研究区实际情况。

(2) 隶属度制图精度评价。采用24个采样点数据对隶属度制图结果进行精度验证(表 5)。验证结果显示, 水稻Cd超标的用户精度和生产精度均为66.67%, 相对较低。而水稻Cd不超标的用户精度和生产精度均为95.24%, 相对较高。这主要是由于水稻Cd超标的采样点数目较少导致。总分类精度为91.67%, 这表明在有限的野外采样点的验证下, 该精度达到了预期效果, 因此可以认为所构建的决策树模型是比较可靠的。

表 5 水稻Cd污染风险隶属度制图精度评价 Table 5 Mapping accuracy evaluation of rice Cd pollution risk rules

而采用同样的24个水稻样本对所得到的插值图进行验证, 得到传统插值图的精度混淆矩阵(表 6)。结果表明, 水稻籽粒Cd超标的用户精度和生产精度分别为20.00%和33.33%, 水稻籽粒Cd不超标的用户精度和生产精度分别为89.74%和80.95%, 总分类精度为75.00%。

表 6 水稻Cd污染风险插值图精度评价 Table 6 Accuracy evaluation of rice Cd pollution risk interpolation mapping

表 5~6所示, 与传统插值图相比, 基于决策树模型的隶属度制图总分类精度由75.00%上升至91.67%。插值图方法主要通过空间数据相关性进行制图预测, 其结果受限于样本数量和采样点空间设置。而决策树模型优势在于其考虑了水稻污染与环境因子之间的关系, 且如果规则精度较高这种关系还可推广到其他地区, 较传统插值图方法具有更加实际的应用意义。

3 讨论

笔者研究选取了影响研究区水稻籽粒Cd污染的11个环境因子构建决策树模型, 并根据模型得到每个环境因子的贡献度, 发现距交通运输用地距离为主控因子, 这可能一方面是因为研究区采样点周围交通运输用地比较密集, 而交通排放的重金属生物有效性高[27]; 另一方面是因为交通条件好的地区企业分布密集, 人为活动强烈, 重金属外源输入通量大。土壤粒径越小, 其总表面积就越大, 吸收重金属的能力就越强, 所以土壤中重金属含量与砂粒含量之间呈一定正相关关系[28]。但笔者研究发现土壤砂粒含量与土壤Cd含量的贡献度最小, 这可能是由于研究区土壤母质为河相冲积物, Cd含量和土壤砂粒含量分布相对较均匀。因此, 研究区土壤Cd元素含量和砂粒含量与水稻籽粒Cd含量相关不显著。

此外, 构建决策树过程中, 笔者研究对总样本按训练样本数与验证样本数比值为5:1进行分配, 最终得到35个训练样本和7个验证样本。而采用的分配方式不同(如4:1或6:1), 决策树模型计算结果也会不同, 如何选择最优分配方式以尽量减少分配方式造成的误差也是该研究重点考虑的问题之一。构建决策树模型时, 如果训练样本太少会使规则缺乏代表性, 而若验证样本太少则会降低验证结果的可靠性。基于此, 以最终得到的规则数量和模型验证精度为标准, 采用不同分配方式进行多次模型构建, 规则数量越多, 模型结果偶然性就越小, 而验证精度则能更直接反映模型效果。最终发现35个训练样本和7个预测样本的分配方式效果最好。综上所述, 不同分配方式会对模型结果产生一定影响, 但可以通过调节分配方式将这种影响降低到最小, 使构建的模型符合研究需要。

根据决策树分支提取了识别研究区水稻Cd超标的5个等级的识别规则, 且通过识别规则进行隶属度空间制图表达, 得到研究区水稻Cd超标空间分区。隶属度空间制图与插值图结果存在一定差异, 这主要是因为制图原理不一样。插值图法以插值点与样本间的距离为权重进行加权, 对离插值点越近的采样点赋予更高的权重[29], 这使离超标样点距离越近的区域超标可能性越大, 最后造成超标区域在超标样点周围成片分布的现象。而隶属度空间制图充分考虑了周围环境因子与水稻超标样点之间的影响机制, 并通过决策树模型以一定规则的形式表示出来, 最后再基于模糊数学理论进行推理制图, 这就使结果中超标区域不再是成片分布, 而是根据特定样点所处的特定环境机制形成[30]。如表 5~6所示, 隶属度制图用户精度明显大于插值图, 这主要是由于超标样点既分布在插值图的片状区域内, 也分布在隶属度制图的零星区域内。由于插值图的片状超标区域较大, 会包含更多不超标样点, 而隶属度制图的零星区域能以更小范围锁定这些超标样点, 从而提高模型准确度。总体来说, 决策树与隶属度制图相结合, 能提高模型稳健度和识别精度, 可以判别出影响水稻籽粒Cd超标的主控因子和非主控因子, 并能根据识别规则较准确地推断出水稻Cd超标的空间区域, 可为政府部门有效减少研究区水稻籽粒Cd超标情况提供决策依据。

4 结论

(1) 通过计算各环境因子的信息增益, 发现距交通运输用地距离、土壤SOM含量和土壤无定形Fe含量为影响研究区水稻籽粒Cd污染的主控因子, 而土壤Cd含量和土壤砂粒含量为非主控因子。

(2) 选择土壤pH值、土壤SOM含量、土壤无定形Fe含量和距交通运输用地距离4个环境因子构建决策树模型, 得到5条用于识别水稻籽粒Cd污染的规则。经验证, 识别规则精度约为85.71%, 可在一定程度上用于识别研究区水稻籽粒Cd污染风险。

(3) 对识别规则进行空间制图表达, 发现用隶属度制图方法得到的水稻籽粒Cd污染空间分布更细致, 比较符合研究区水稻籽粒Cd污染实际情况, 且总分类精度为91.67%, 在采样点有限的情况下能达到制图要求。与单纯决策树制图(精度为85.71%)和传统插值图(总分类精度为75.00%)相比, 决策树模型与隶属度结合能提高决策树模型稳健性和识别精度。

参考文献
[1]
宋伟, 陈百明, 刘琳. 中国耕地土壤重金属污染概况[J]. 水土保持研究, 2013, 20(2): 293-298. [ SONG Wei, CHEN Bai-ming, LIU Lin. Soil Heavy Metal Pollution of Cultivated Land in China[J]. Research of Soil and Water Conservation, 2013, 20(2): 293-298.] (0)
[2]
环境保护部, 国土资源部. 全国土壤污染状况调查公报[J]. 中国环保产业, 2014(5): 10-11. (0)
[3]
CHAKRAVARTY R, BANERJEE P C. Mechanism of Cadmium Binding on the Cell Wall of an Acidophilic Bacterium[J]. Bioresource Technology, 2012, 108: 176-183. DOI:10.1016/j.biortech.2011.12.100 (0)
[4]
CHEN X, ZHU G Y, JIN T Y, et al. Effects of Cadmium on Forearm Bone Density After Reduction of Exposure for 10 Years in a Chinese Population[J]. Environment International, 2009, 35(8): 1164-1168. DOI:10.1016/j.envint.2009.07.014 (0)
[5]
张红振, 骆永明, 章海波, 等. 水稻、小麦籽粒砷、镉、铅富集系数分布特征及规律[J]. 环境科学, 2010, 31(2): 488-495. [ ZHANG Hong-zhen, LUO Yong-ming, ZHANG Hai-bo, et al. Characterizing the Plant Uptake Factor of As, Cd and Pb for Rice and Wheat Cereal[J]. Environmental Science, 2010, 31(2): 488-495.] (0)
[6]
WANG M E, CHEN W P, PENG C. Risk Assessment of Cd Polluted Paddy Soils in the Industrial and Township Areas in Hunan, Southern China[J]. Chemosphere, 2016, 144: 346-351. DOI:10.1016/j.chemosphere.2015.09.001 (0)
[7]
李冰.成都平原农田土壤镉污染成因与阻控技术研究[D].杨凌: 西北农林科技大学, 2014. [LI Bing.Study on Cadmium Pollution Causes and Control Technologies of Farmland Soil in Chengdu Plain[D].Yangling: Northwest University of Agriculture and Forestry Science and Technology: 2014.] http://cdmd.cnki.com.cn/Article/CDMD-10712-1015513095.htm (0)
[8]
郑袁明, 陈同斌, 陈煌, 等. 北京市近郊区土壤镍的空间结构及分布特征[J]. 地理学报, 2003, 58(3): 470-476. [ ZHENG Yuan-ming, CHEN Tong-bin, CHEN Huang, et al. The Spatial Structure and Distribution of Ni Contents in Soils of Suburbs of Beijing[J]. Acta Geographica Sinica, 2003, 58(3): 470-476. DOI:10.3321/j.issn:0375-5444.2003.03.018] (0)
[9]
ZHANG C S, LUO L, XU W L, et al. Use of Local Moran's Ⅰ and GIS to Identify Pollution Hotspots of Pb in Urban Soils of Galway, Ireland[J]. Science of the Total Environment, 2008, 398(1/2/3): 212-221. (0)
[10]
ZHANG X Y, LIN F F, JIANG Y G, et al. Assessing Soil Cu Content and Anthropogenic Influences Using Decision Tree Analysis[J]. Environmental Pollution, 2008, 156(3): 1260-1267. (0)
[11]
ZHENG Y M, CHEN T B, HE J Z. Multivariate Geostatistical Analysis of Heavy Metals in Topsoils From Beijing, China[J]. Journal of Soils and Sediments, 2008, 8(1): 51-58. DOI:10.1065/jss2007.08.245 (0)
[12]
张长波, 李志博, 姚春霞, 等. 污染场地土壤重金属含量的空间变异特征及其污染源识别指示意义[J]. 土壤, 2006, 38(5): 525-533. [ ZHANG Chang-bo, LI Zhi-bo, YAO Chun-xia, et al. Characteristics of Spatial Variability of Soil Heavy Metal Contents in Contaminated Sites and Their Implications for Source Identification[J]. Soil, 2006, 38(5): 525-533. DOI:10.3321/j.issn:0253-9829.2006.05.005] (0)
[13]
HUGGETT R J. Soil Landscape Systems:A Model of Soil Genesis[J]. Geoderma, 1975, 13(1): 1-22. DOI:10.1016/0016-7061(75)90035-X (0)
[14]
ZHU A X, BAND L, VERTESSY R, et al. Derivation of Soil Properties Using a Soil Land Inference Model (SoLIM)[J]. Soil Science Society of America Journal, 1997, 61(2): 523. (0)
[15]
ZHU A X, HUDSON B, BURT J, et al. Soil Mapping Using GIS, Expert Knowledge, and Fuzzy Logic[J]. Soil Science Society of America Journal, 2001, 65(5): 1463. DOI:10.2136/sssaj2001.6551463x (0)
[16]
杨琳, Fahmy Sherif, Jiao You, 等. 基于土壤-环境关系的更新传统土壤图研究[J]. 土壤学报, 2010, 47(6): 1039-1049. [ YANG Lin, FAHMY Sherif, JIAO You, et al. Updating Conventional Soil Maps Using Knowledge on Soil-Environment Relationships Extracted From the Maps[J]. Acta Pedologica Sinica, 2010, 47(6): 1039-1049.] (0)
[17]
HOWELL D, KIM Y G, HAYDU-HOUDESHELL C A.Development and Application of Digital Soil Mapping Within Traditional Soil Survey: What Will It Grow Into?[M]//HARTEMINK A E, MCBRATNEY A B, MENDONÇA-SANTOS M L.Digital Soil Mapping With Limited Data.Dordrecht, Holland: Springer Netherlands, 2008: 43-51.DOI: 10.1007/978-1-4020-8592-5_4. (0)
[18]
GUO Y, SHI Z, LI H Y, et al. Application of Digital Soil Mapping Methods for Identifying Salinity Management Classes Based on a Study on Coastal Central China[J]. Soil Use and Management, 2013, 29(3): 445-456. DOI:10.1111/sum.12059 (0)
[19]
HUDSON B D. The Soil Survey as Paradigm-Based Science[J]. Soil Science Society of America Journal, 1992, 56(3): 836. DOI:10.2136/sssaj1992.03615995005600030027x (0)
[20]
杨琳, 朱阿兴, 秦承志, 等. 运用模糊隶属度进行土壤属性制图的研究:以黑龙江鹤山农场研究区为例[J]. 土壤学报, 2009, 46(1): 9-15. [ YANG Lin, ZHU A-xing, QIN Cheng-zhi, et al. Study on Mapping Soil Attributes by Using Fuzzy Membership Degree:Taking Heshan Farm Research Area in Heilongjiang Province as an Example[J]. Acta Pedologica Sinica, 2009, 46(1): 9-15. DOI:10.3321/j.issn:0564-3929.2009.01.002] (0)
[21]
ZHU A X, SCOTT MACKAY D. Effects of Spatial Detail of Soil Information on Watershed Modeling[J]. Journal of Hydrology, 2001, 248(1/2/3/4): 54-77. (0)
[22]
宋宏利, 张晓楠. 中国区域多源土地覆被遥感产品精度分析与验证[J]. 农业工程学报, 2012, 28(22): 207-214, 296-297. [ SONG Hong-li, ZHANG Xiao-nan. Precision Analysis and Validation of Multi-Sources Landcover Products Derived From Remote Sensing in China[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(22): 207-214, 296-297. DOI:10.3969/j.issn.1002-6819.2012.22.029] (0)
[23]
韦玉春, 汤国安, 杨昕, 等. 遥感数字图像处理教程[M]. 北京: 科学出版社, 2007: 1-289. (0)
[24]
李波, 林玉锁, 张孝飞, 等. 沪宁高速公路两侧土壤和小麦重金属污染状况[J]. 农村生态环境, 2005, 21(3): 50-53, 70. [ LI Bo, LIN Yu-suo, ZHANG Xiao-fei, et al. Heavy Metal Pollution of the Soils and Wheat Grains Alongside the Shanghai-Nanjing Expressway[J]. Rural Eco-Environment, 2005, 21(3): 50-53, 70.] (0)
[25]
卢声. 土壤因素对农作物中重金属含量的影响分析[J]. 丹东纺专学报, 2004, 11(3): 34-35. [ LU Sheng. Analysis of Heavy Metals Concentrations in Crops by Influencing of Soils Factors[J]. Dandong Textile College, 2004, 11(3): 34-35. DOI:10.3969/j.issn.1673-4939.2004.03.012] (0)
[26]
侯秀.铁锰氧化物对碱性盐化土壤镉污染中镉的行为影响及生物效应[D].天津: 天津师范大学, 2009. [HOU Xiu.Behavioral and Biological Effects of Ferromanganese Oxides on Cadmium Pollution in Alkaline Saline Soils[D]: Tianjin: Tianjin Normal University: 2009.] http://d.wanfangdata.com.cn/Thesis_Y1506629.aspx (0)
[27]
韩国新, 冯精兰, 孙剑辉. 公路交通对土壤重金属污染生态风险评价方法的建立与应用[J]. 河南师范大学学报(自然科学版), 2015, 43(2): 98-102. [ HAN Guo-xing, FENG Jing-lan, SUN Jian-hui. Development and Application of Ecological Risks Assessment for Heavy Metals From Road Traffic[J]. Journal of Henan Normal University(Natural Science), 2015, 43(2): 98-102.] (0)
[28]
赵晶, 汤旭. 不同粒径土壤中重金属的分布规律[J]. 四川环境, 2011, 30(4): 17-20. [ ZHAO Jing, TANG Xu. Distribution of Heavy Metals in Soils With Different Particle Size[J]. Sichuan Environment, 2011, 30(4): 17-20. DOI:10.3969/j.issn.1001-3644.2011.04.005] (0)
[29]
LU G Y, WONG D W. An Adaptive Inverse-Distance Weighting Spatial Interpolation Technique[J]. Computers & Geosciences, 2008, 34(9): 1044-1055. (0)
[30]
ZHU A X. A Similarity Model for Representing Soil Spatial Information[J]. Geoderma, 1997, 77(2/3/4): 217-242. (0)