Prediction of PM2.5 concentration based on machine learning using MODIS AOD and LDAPS data
- Alternative Title
- MODIS AOD와 LDAPS 자료를 활용한 머신러닝 기반 PM2.5 농도 예측
- Abstract
- 미세먼지(particle matter less than 2.5㎍/㎥, PM2.5)는 주요 대기오염물질로 호흡기나 심혈관 질환 등의 원인이 되며 건강에 위협을 주는 물질이다. 인간의 건강을 위해 미세먼지를 모니터링하고 예방하는 것이 중요하며 이를 위해서는 미세먼지를 예측하는 것이 필요하다. 본 연구에서는 PM2.5의 정확한 예측에 필요한 머신 러닝 모델을 구축하였다. 예측을 위한 독립변수로 2017년부터 2019년까지의 local data assimilation and prediction system (LDAPS) 모델링 데이터의 기상인자 15가지(NCPCP, UGRD, VGRD, TMP, TMIN, TMAX, RH, MAXGUST, 50MINU, 50MINV, 50MAXU, 50MAXV, STMP, HPBL, PRES)와 화학인자 4가지(CO, O3, SO2, NO₂), aerosol optical depth (AOD) 2가지(470㎚, 550㎚) 파장대의 데이터를 선정하였다. 종속변수는 서울시 40개 AQMS 지점에서 관측된 PM2.5 값으로 하였다. 예측에 사용된 머신러닝 모델은 앙상블 기반의 알고리즘인 RF, GBM, XGB를 이용하였으며 예측 정확도 지표는 R², Bias, RMSE, MAE를 적용하였다. 예측 결과, XGB가 R²=0.89, Bias = -0.143, RMSE = 4.719, MAE = 3.502로 예측에 적합한 모델임을 확인하였다. 그러나, RF와 GBM 모델 또한 정확도 면에서 큰 차이를 보이지 않아 세 모델 모두 좋은 성능임을 확인하였다. 변수 중요도 평가를 통해 모델의 훈련에 기여한 인자를 파악하였으며, O3와 SO2,, NCPCP 등이 높은 기여도를 나타냈다. 또한, 결측 값으로 인한 AOD의 영향력을 평가하기 위해 AOD를 제외한 모델의 성능을 비교 분석하였으며, AOD가 포함되었을 때, 약 5%의 정확도 향상의 결과를 나타냈다. 계절별 모델 성능의 분석도 실시하였으며, 봄과 겨울에 높은 정확도를 보였으며, 여름과 가을에 낮은 정확도를 나타냈다. 본 연구는 서울시의 PM2.5 예측을 위해 LDPAS 기상인자, MODIS AOD, 지상관측 자료인 화학인자 등을 활용하고자 하였으며, 안정적인 성능을 보이는 앙상블 기반의 RF, GBM, XGB알고리즘을 이용하여 예측을 수행하였다. 본 연구의 결과를 통해 실시간으로 변하는 PM2.5 농도의 모니터링과 관리 및 대책 수립에 도움이 될 것으로 기대된다.
- Author(s)
- 류민지
- Issued Date
- 2023
- Awarded Date
- 2023-02
- Type
- Dissertation
- Keyword
- PM2.5, Machine Learning, Prediction
- Publisher
- 부경대학교
- URI
- https://repository.pknu.ac.kr:8443/handle/2021.oak/32966
http://pknu.dcollection.net/common/orgView/200000668093
- Affiliation
- 부경대학교 대학원
- Department
- 대학원 지구환경시스템과학부공간정보시스템공학전공
- Advisor
- 김진수
- Table Of Contents
- 1. Introduction 1
1.1. Background 1
1.2. Literature review 3
1.3. Objectives 5
2. Methodology 7
2.1. Study Area 7
2.2. Data 9
2.2.1. LDAPS Data 11
2.2.2. MODIS AOD 13
2.2.3. Ground measurement data 14
3. Methodology 15
3.1. RF 15
3.2. GBM 15
3.3. XGB 16
3.4. Model construction and validation 17
4. Results 19
4.1. Model performance 19
4.2. Feature Importance 23
4.3. Comparison with and without AOD 25
4.4. Model Performance Analysis by Time Series 27
5. Discussion 33
6. Conclusion 38
7. References 39
- Degree
- Master
-
Appears in Collections:
- 대학원 > 지구환경시스템과학부-공간정보시스템공학전공
- Authorize & License
-
- Authorize공개
- Embargo2023-02-08
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.