研究基于大数据的病虫害监测预警分析方法,探索适合于不同虫害监测预警模型构建的技术和方法。
1.研究项目进展
(1)数据采集
实现了基于物联网的数据采集以及数据传输。主要采集了温度、湿度、风速等气象数据以及土壤的温度、湿度、PH值等土壤数据,同时通过视频传输捕获大田作物长势实时图像信息以及诱罐内需要采集的害虫个体信息。数据传输部分基于3G数据模块,通过Zigbee连接个部分模块功能,然后数据打包传输。
历史数据采集。主要包括纸质档案文档的搜集、数据格式整理与录入,组建数据集。
(2)数据库与平台搭建
搭建完成了基于大数据平台Hadoop的小麦、玉米虫害检测预警平台,实现了基于Hadoop的局部支持向量机的并行化算法。
(3)数据分析与挖掘
研究了不同机器学习算法如SVR、决策树以及基于R的统计算法等在害虫监测预警中的应用。找到了适合于不同虫害监测预警模型构建的技术和方法。
2.研究成果应用
(1)在小麦蚜虫发生程度预测中的应用
分析了与小麦蚜虫发生程度的关联因子,构建了基于决策树和SVR的预测模型。在鲁中地区,麦蚜发生量与日照时数相关程度最高,当日照时数大于13 h,小麦蚜虫发生程度为4级。在预测麦蚜发生程度时,决策树C5.0算法的准确率略低于SVR。
(2)在玉米螟发生程度预测中的应用
最大风速、平均气压是对玉米螟发生程度影响最显著的正相关因子,平均温度、最高气压是影响最显著的负相关因子;通过主成分分析,前七个主成分的贡献率达到96.87%,前九个主成分贡献率达到99.36%,能代表99.36%的数据;最后主成分回归方程的Multiple R-Squared=0.437,P=0.002533。
图玉米螟发生程度与单个气象因子的相关性分析(颜色越深表示相关性越强)
(3)在玉米田棉铃虫发生程度预测中的应用
建立了基于SVR的玉米田第四代棉铃虫发生量预测模型。模型预测的平均绝对百分比误差为4.36%,预测值与实际值的相关系数为0.9606,呈现高度的相关性。这一模型的建立为玉米田第四代棉铃虫的科学有效防控提供了科学指导。
图支持向量机回归拟合结果与实际值对比
图支持向量机回归预测结果与实际值对比
(4)分析了麦田主要天敌昆虫瓢虫种群演化的关联因子
基于决策树的麦田主要瓢虫类天敌昆虫发生趋势分析表明,当日最低气温在调查期年际变化呈上升趋势,随日最低气温升高,七星瓢虫数量减少。当日照时数在调查期年际变化呈上升趋势,随日照时数的增加,异色瓢虫的数量增加。
图 2种瓢虫的发生趋势
图2001 - 2014年小麦生长期日最低气温与日照时数变化的时间序列
图七星瓢虫(上)与异色瓢虫(下)决策树分类模型预测值与真实值拟合