摘要: 赤潮的发生是各种自然因素综合作用的结果,涉及物理、化学、生物等方面的因素。针对赤潮预测中影响因子选取难、准确率不够等问题,本文提出一种基于随机森林(RF)特征选择方法的极端梯度提升树(XGBoost)赤潮等级预测模型。以三沙湾赤潮监控区为研究区,将2005—2019年间湾区内发生的赤潮事件数据作为模型输入数据,结合随机森林算法的特征重要性和皮尔逊相关性分析得出特征最终排序。其次,根据RF算法在各特征下的AUC值求得模型最佳特征数并结合特征重要性选出XGBoost模型所需的最佳特征集合。最后,利用最佳特征集合对XGBoost分类模型进行训练。实验结果表明,该方法相比其他分类方法可以达到较高的分类精度,能够为三沙湾赤潮等级预测提供新的解决方法。
中图分类号: