Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-4517(Print)
ISSN : 2287-3503(Online)
Journal of Environmental Science International Vol.28 No.1 pp.125-135
DOI : https://doi.org/10.5322/JESI.2019.28.1.125

The Development of a Rainfall Correction Technique based on Machine Learning for Hydrological Applications

Young-Mi Lee,Chul-Min Ko*,Seong-Cheol Shin,Byung-Sik Kim1)
ECOBRAIN Co. Ltd., Jeju 63309, Korea
1)Department of Urban & Environmental Disaster Prevention Engineering, Kangwon National University, Samcheok 25913, Korea
*Corresponding author: Chul-min Ko, Manager, ECOBRAIN Co. Ltd., Jeju 63309, Korea Phone : +82-70-7018-0512
18/12/2018 08/01/2019 15/01/2019

Abstract


For the purposes of enhancing usability of Numerical Weather Prediction (NWP), the quantitative precipitation prediction scheme by machine learning has been proposed. In this study, heavy rainfall was corrected for by utilizing rainfall predictors from LENS and Radar from 2017 to 2018, as well as machine learning tools LightGBM and XGBoost. The results were analyzed using Mean Absolute Error (MAE), Normalized Peak Error (NPE), and Peak Timing Error (PTE) for rainfall corrected through machine learning. Machine learning results (i.e. using LightGBM and XGBoost) showed improvements in the overall correction of rainfall and maximum rainfall compared to LENS. For example, the MAE of case 5 was found to be 24.252 using LENS, 11.564 using LightGBM, and 11.693 using XGBoost, showing excellent error improvement in machine learning results. This rainfall correction technique can provide hydrologically meaningful rainfall information such as predictions of flooding. Future research on the interpretation of various hydrologic processes using machine learning is necessary.



수문학적 활용을 위한 머신러닝 기반의 강우보정기술 개발

이영미,고철민*,신성철,김병식1)
㈜에코브레인, 1)강원대학교 도시·환경방재공학전공

    1. 서론

    최근 기후변화에 따라 전 세계적으로 태풍, 호우, 폭염 등 위험기상의 발생이 증가하고 있으며, 이로 인한 사 회·경제적 피해도 증대되고 있다. 최근 4년간(2011 ~ 2014년) 우리나라에서 자연재해로 인해 발생한 연평균 재산 피해액은 약 5조 5천억 원으로 추정되며, 이는 2001 ~ 2010년(약 2조 7천억 원) 대비 약 2배, 1991 ~ 2000년(약 7천억 원) 대비 약 7배 이상 증가한 수치이다. 이 중에서도 호우로 인한 피해가 가장 컸으며, 피해액은 약 4조 1.5천억 원으로 전체 피해액의 약 60%에 해당된 다(MPSS, 2015). 이러한 피해를 최소화하고 홍수 예・ 경보를 위한 선행시간을 확보하기 위해서는 정확한 강우 및 홍수예측이 필수적이다(WMO, 2011).

    강우는 비선형적인 현상이므로 일반적인 선형모형으 로 예측하는 것에는 한계가 있다. 머신러닝은 비선형성 관계를 가진 빅데이터 기반의 자료를 분석하는데 적합하 고, MOS (Model Output Statistics) 기법처럼 수치 모 델의 예측성능을 보완하는데도 기여한다. 최근에는 기상 및 기후와 관련된 자료가 방대해지고 이와 같은 자료를 보다 정확한 예측정보로 만들어내기 위한 빅데이터 기반 의 다양한 방법론이 개발되고 있다. 또한 수치예보자료 의 정량적 강우량 추정 개선을 위한 인공신경망을 활용 한 여러 연구가 이루어져 왔고, 이와 같이 머신러닝은 기 상예측분야에서 다양하게 적용되고 있으며 특히, 집중호 우와 같이 예측오차가 크고 단기간에 정확한 예측이 필 요한 현상에 대해 기존의 예측한계를 보완하기 위한 방 법으로 널리 사용되고 있다(Hong, 2008, Kang et al., 2011, Sumi et al, 2012, Parmar et al., 2017). 그러나 여전히 수문학적 활용을 위한 강우 예보 능력은 부족하 고, 정량적으로 사용하기 위해서는 지역적 오차와 시스 템 오차 제거가 필수적이다. 따라서, 본 연구에서는 기상 청의 수치예보자료에 머신러닝 기반의 강우보정기술을 도입하고자 한다.

    머신러닝은 부스팅 기법중의 하나로 최근 많이 사용 되는 LightGBM 과 XGBoost 기법을 적용하였고, 2017 년부터 2018년까지의 최근 호우사례 중 서울과 강릉을 중심으로 큰 피해를 주었던 5개 사례에 대해 연구하였다. 머신러닝 결과를 통해 산정된 보정 강우에 대하여 검증 하였고, 집중호우에 대한 머신러닝의 예측개선 정도를 분석하였다. 그리고 사례별 공간분포에 대한 분석을 통 하여 집중호우 지역의 강우패턴 정확도를 비교하였다.

    2. 자료 및 연구방법

    2.1. 수치 자료

    본 연구에서는 강우보정 알고리즘 개발을 위한 입력 자 료로 기상청에서 제공하는 RAR (Radar-AWS Rainrates), MAPLE (McGill algorithm for precipitation nowcasting by lagrangian extrapolation)과 LENS (Local ensemble prediction system)를 사용하였다. RAR 자료는 국내에 설치된 레이더와 AWS (Automatic Weather Station)를 활용하여 실시간으로 정량적 레이더 강우강도 추정을 위 해 Z-R계수를 산출 및 적용하는 강우강도 산출시스템이 다. MAPLE 자료는 기상청 초단기 강우예측모델로 국 지적인 돌발성 집중호우를 예측하기 위해 2008년부터 3년간 국립기상과학원과 캐나다 맥길 대학교와 공동연 구를 통해 개발되었고, 위성과 레이더자료에서 산출된 이동벡터와 세미-라그랑지안 기법을 통하여 6시간 강우 량을 예측한다. 이러한 초단기 예보 생산체계는 기존 역 학 모델 기반에서 실황 중심의 외삽 예측 기반으로 전환 되면서, 1시간 강우량 예보를 개선하는 것으로 평가받고 있다(Hwang et al., 2015). RAR과 MAPLE 자료는 동 일하게 1km의 공간해상도와 10분 주기의 시간해상도를 가졌고, 바이너리 형태로 제공된다. 마지막으로 LENS 자료는 한반도 위험기상 확률 예측을 위해 13개의 앙상 블 섭동 멤버로 72시간까지 예측정보를 제공하는 UM(Unified model) 기반 국지 앙상블 예측시스템이고, 3 km의 공간 해상도와 12시간 주기의 시간 해상도를 가 졌으며, GRIB 형태로 제공된다(Kim et al., 2015). 앙상 블 예보는 기상현상의 비선형성에 따른 불확실성, 수치 모델의 고유 오차와 초기 분석장에 내재되어 있는 오차 들을 고려하여 여러 모델 결과를 토대로 특정현상 발생 확률의 예측 정보를 제공한다.

    2.2. 알고리즘 개발 방법

    강우보정 알고리즘은 2.1.에서 언급한 수치예보자료 의 전처리, 머신러닝, 후처리의 3가지 과정을 통해 개발 되었다(Fig. 1). 우리는 대부분의 알고리즘 개발 과정에 서 CDO (Climate Data Operator), NCO (NetCDF operator)를 주로 사용하였다. CDO와 NCO는 NetCDF 형식의 대용량 자료를 간결한 명령어로 신속하게 처리해 주는 도구로서, 전처리 이전에 바이너리 형식의 RAR과 MAPLE, GRIB 형식의 LENS 자료를 모두 NetCDF 형 식으로 변환시켰다.

    첫 번째, 전처리는 수치예보자료에서 머신러닝의 입 력자료로 사용되는 기상 예측인자들을 추출하기 위한 과 정이다. 집중호우와 관련된 기상 예측인자들은 문헌을 통해 조사하였고, Kang et al.(2011)에서 제시한 예측인 자와 추가 예측인자를 정리하여 Table 1에 제시하였다. LENS 자료에서는 3차원 공간 자료를 활용하여 층후도, 상/중/하층 풍속, 연직바람시어, 대기 불안정도, 가강수 량 변수 등을 추출하였고, MAPLE과 RAR 자료에서는 2차원 강우량 변수를 추출하였다. 이러한 수치예보자료 의 기상 예측인자들은 1 km 해상도의 호우영향모델 격 자로 내삽되어 머신러닝 입력자료로 최종 생성되었다. 두 번째, 머신러닝 과정은 예측 6시간 전부터 1시간 전까 지 앙상블 멤버별 LENS와 MAPLE의 기상 예측인자, RAR 관측 강우를 활용하여 지도 학습하였다. 그리고 매 시간 머신러닝을 통해 생성된 예측모형에 LENS와 MAPLE 예보자료를 입력하여 1시간 간격의 앙상블 멤 버별 초단기(0 ~ 6시간) 보정강우를 산출하였다(Fig. 2). 머신러닝은 다양한 기법 중에 부스팅 기법의 한 종류인 XGBoost와 LightGBM을 선정하였다. XGBoost는 기 존 부스팅 기법들과 비교해 학습과 분류가 빠르다는 장 점이 있고, LightGBM은 대용량 데이터 학습에 적합하 다(Ke et al., 2017). 마지막, 후처리 과정은 머신러닝 과 정을 통해 산출된 앙상블 멤버별 보정 강우를 평균하여 최종 보정강우를 생산하였다.

    2.3. 호우사례 선정

    집중호우란 시간당 30 mm 이상 또는 하루에 80 mm 이상의 비가 내리는 경우나 하루에 연강수량의 10%에 해당하는 비가 내리는 경우로 정의한다(K-Water, 2016). 본 연구에서는 집중호우의 정의를 근거로 서울, 강릉 지역의 AWS 자료에서 2017 ~ 2018년 중 일 누적 강우량이 80 mm 이상인 날을 조사하였고, 5개 호우사례 를 선정하였으며, 이에 대한 상세 내용을 Table 2에 제시 하였다.

    1번 사례는 2017년 07월 10일 나타난 서울 지역의 호 우 사례로 하층제트 전면의 층후 분류형으로 분석되며, 일 최다 강우량은 한강(418)지점에서 169 mm 로 관측 되었다. 2번 사례는 2017년 07월 23일 나타난 서울 지역 의 호우사례로 오전 10시경에 강한 강우를 나타낸 사례 이다. 중·하층의 수증기량이 많고 연직 불안정이 강한 지 역으로 하층제트 전면의 층후 분류형으로 분류되며, 일 최다 강우량은 서울(108)지점에서 133.5 mm 로 관측되 었다. 3번 사례는 2018년 05월 17일에 나타난 서울 지역 의 호우사례로 오전 4시경에 강한 강우를 나타낸 사례이 다. 중층대기에서는 서풍류와 함께 연직적으로 바람시어 와 온난이류가 발생하는 하층제트 전면의 층후 분류형 사례로, 일 최다 강우량은 강남(400)지점에서 101.5 mm 로 관측되었다. 4번 사례는 2018년 08월 06일에 나타난 강릉 지역의 호우사례로 영동지방을 중심으로 발생하는 동해안 호우형태이다. 동풍의 영향을 받는 동해안 중심 으로 집중호우가 발생하였으며, 동해안의 비는 대기 중 층에 찬 공기가 위치하는 가운데, 대기 하층으로 동풍이 유입되면서 내리는 강우형태로 분석되었다. 오전 3시와 7시 경에 강한 강우가 나타났으며, 이에 따라 KTX 강릉 역이 침수되는 피해사례가 발생하였다. 일 최다 강우량 은 강문(524)지점에서 282 mm 로 관측되었다. 5번 사 례는 2018년 8월 29일 오전 0시와 오전 8시경에 나타난 서울 지역의 호우사례이다. 이 사례는 태풍 솔릭이 통과 한 후, 우리나라 북쪽 상층에 찬 공기가 위치하는 가운데, 남쪽에서는 북태평양고기압이 발달하면서 남북으로 폭 이 좁은 수증기 통로가 형성되었다. 고기압 가장자리에 서 대기하층에서의 강풍대를 따라 많은 양의 수증기가 지속적으로 유입되면서 국지적으로 호우가 발생하였다. 일 최다 강우량은 도봉지점에서 249.5 mm로 관측되었 다.

    3. 결과 및 고찰

    3.1. 통계 검증

    5개의 호우사례에 대해 강우보정 알고리즘을 적용한 결과를 검증하기 위해 Kim et al.(2008)에서 제시한 3개 의 검증 지표(MAE, NPE, PTE)를 사용하였다(식 1 ~ 3). 검증 지표로는 보정 강우량의 평균 오차를 보여주는 MAE (Mean Absolute Error), 보정 강우량의 최대 오차 를 나타내는 NPE (Normalized Peak Error), 보정강우 량의 최대값이 발생하는 시점에 대한 오차를 나타내는 PTE (Peak Timing Error)가 있다. MAE와 NPE는 0에 가까울수록 관측값과 오차가 적다는 것을 의미하고, PTE는 0에 가까울수록 관측강우량의 최대값이 발생하 는 시점이 비슷하고, 음의 값은 보정 강우량이 관측 강우 량보다 먼저 최대값으로 발생하며, 양의 값은 정반대를 의미한다.

    M A E = 1 n i = 1 n | O i E i |
    (1)

    Oi : 관측강우, Ei : 보정 강우, n: 자료 개수

    N P E = P e P o P o
    (2)

    Pe : 보정 강우량의 최대값, Po : 관측 강우량의 최대값

    P T E = T e max T o max
    (3)

    T e max : 보정 강우량의 최대값이 발생하는 시각

    T o max : 관측 강우량의 최대값이 발생하는 시각

    5개의 집중호우 사례에 대해 LightGBM과 XGBoost 로 보정된 결과의 3가지 검증 지표를 Table 3에 제시하 였다. 전체 사례에 대해 LightGBM, XGBoost, LENS 의 평균 MAE가 각각 7.96 mm, 7.97 mm, 11.23 mm로 보정결과의 MAE 오차가 LENS 자료에 비해 크게 개선 된 효과를 보여주었다. 특히, 5번 사례에서 보정된 결과 는 동서방향의 공간 패턴을 유사하게 모의하였고, LENS 자료보다 약 12.7 mm 오차를 줄였다. 전체 사례에 대한 XGBoost와 LightGBM의 평균 NPE는 6.35 mm, 7.05 mm로 LENS 자료의 10.42 mm와 비교해 많이 향상된 결과를 보여주었다. MAE와 유사하게 5번 사례에서 XGBoost와 LightGBM이 각각 23.86 mm, 27.46 mm 를 나타내 LENS 자료의 41.86 mm보다 약 18 mm 정도 크게 개선되었다. PTE를 통해 3번 사례에서 XGBoost 와 LightGBM이 각각 0.02와 0.16으로 LENS 자료 의 -0.4보다 0에 가까워 관측 강우량의 최대값 나타 나는 시점과 매우 유사함을 확인할 수 있다. 그리고 LightGBM의 결과는 관측에서 발생한 시각보다 상대적 으로 먼저 나타나고, XGBoost의 결과는 나중에 나타났 다. 1번 사례의 보정결과에서도 LENS 자료보다 약 0.2 의 오차가 줄어들어 최대 강우가 나타나는 시각을 보정 해주었다. 보정결과만 비교해보면 모든 사례에서 평균 PTE는 0.49를 나타내는 XGBoost가 0.52를 나타내는 LightGBM보다 상대적으로 우수한 성능을 보여주었다. 그러나 MAE와 NPE 가 우수했던 5번 사례에서 XGBoost 결과의 PTE는 LENS 자료와 비교해 크게 개 선되지 않았고, LightGBM은 오히려 LENS 자료보다 오차가 증가했다. 또한, 2, 4번 사례는 보정된 결과 모두 LENS 자료보다 약 0.4 ~ 0.9 큰 시간 차이를 보였다. 위 3가지 검증 결과를 종합해보면, 강우보정 알고리즘은 LENS에 비하여 MAE, NPE 지표와 관련된 강우량을 크게 개선시켰지만, PTE와 관련된 강우시점은 오히려 보정 성능을 감소시켰다. 따라서, 향후 알고리즘 보완을 통해 개선할 필요가 있다.

    3.2. 호우사례별 공간분포 비교

    Fig. 3 ~ Fig. 7에 호우사례 1 ~ 5의 3시간 누적 관측 강우량과 앙상블 멤버별 보정 강우 평균값에 대한 3시간 누적 강우량의 공간분포를 비교하여 제시하였다. Fig. 31번 사례의 결과로 2017년 7월 10일 2000 LST이며, Fig. 3(a)는 RAR, Fig. 3(b)는 MAPLE 예측자료, Fig. 3(c)는 LENS 예측자료, Fig. 3(d)와 Fig. 3(e)는 각각 LightGBM과 XGBoost를 통해 보정된 강우자료이다 (이하 Fig. 3 ~ 7의 그림구성 동일). 1번 사례에서 Fig. 3(a)는 서울 지역에서 약 20 mm 이상의 강한 강우를 나 타내고 있는 반면 Fig. 3(b)와 Fig. 3(c)의 예측자료에서 는 서울지역에 강우를 모의하지 않거나 서울 일부 지역 에서 약 15 ~ 20 mm 이상으로 Fig. 3(a)에 비하여 적게 모의하고 있다. 반면 머신러닝을 통해 보정된 Fig. 3(d) 와 Fig. 3(e)에서는 서울 지역 강우량이 각각 약 5 ~ 10 mm(최대 약 20 mm)로 실황자료에 비하여 적은 강우량 으로 보정되었으나, Fig. 3(a)와 유사한 강우패턴을 모의 하고 있어 집중호우 지역의 강우패턴이 머신러닝을 통해 개선되는 것을 확인할 수 있다. Fig.42번 사례의 결과 로 2017년 7월 23일 1000 LST 이며, Fig. 4(a)와 비교 하여 Fig. 4(b)는 수도권 지역과 강원도 지역의 강우량이 약 15 ~ 20 mm 더 많은 강우를 모의하였고, Fig. 4(c)의 수도권 북부도 약 15 ~ 20 mm 더 많은 강우를 모의하였 다. 반면 Fig. 4(d)와 Fig. 4(e)에서는 Fig. 4(a)와 비교하 여 서울 지역의 강우량이 약 20 mm이상 적게 모의되었 으나, 공간적인 패턴은 유사하게 나타났다. 1번 사례와 2 번 사례에서 나타난 LightGBM과 XGBoost의 서울 호 우 지역 강우량을 적게 모의하는 경향에 대해서는 호우 유형 및 선행 예측 인자 등에 대한 추가적인 연구가 필요 하다고 판단된다.

    Fig. 53번 사례의 결과로 2018년 5월 17일 0400 LST에서는 서울 지역에 대해 Fig. 5(e)의 결과가 Fig. 5(a)와의 오차 ±5 mm 로 유사하게 모의한 것으로 나타 났다. 반면 Fig. 5(b)와 Fig. 5(c)는 수도권 지역의 강우 량과 강우패턴을 제대로 모의하지 못하고 있으며 특히, Fig. 5(c)는 수도권과 강원도 전역에 10 mm 이상의 강 우를 예측하여 실제와 약 10 ~ 15 mm 차이를 보였다. Fig. 64번 사례의 결과이며 이전 사례와 다르게 강릉 지역에서 나타난 집중호우 사례로, 동해 연안을 따라 나 타난 Fig. 6(a)의 강우분포를 머신러닝의 결과인 Fig. 6(d)와 Fig. 6(e)에서 유사하게 예측하고 있다. Fig. 6(c) 는 강원북부 지역에서 20 mm 이상의 강한 강우패턴을 보였는데, 머신러닝 결과와 Fig. 6(a)의 오차는 0 ~ 5 mm로 개선된 것을 확인하였다. 그리고 강릉 지역에 대한 머신러닝 결과와 Fig. 6(a)의 오차도 LightGBM이 5 ~ 10 mm, XGBoost 가 0 ~ 5 mm 로 개선된 것을 확 인하였다. 마지막 집중호우 사례인 5번 사례의 결과로 2018년 8월 29일 2000 LST에서는 Fig. 7(a)에서 수도 권과 서울 중북부 지역을 통과하는 띠 모양의 강우밴드 가 동서방향으로 길게 관측되었고, 이러한 강우패턴을 Fig. 7(b)와 Fig. 7(d), Fig. 7(e)에서 유사하게 모의하고 있다. 하지만 Fig. 7(b)에서는 서울 남부 지역의 강우량 이 약 10 ~ 15 mm 적게 모의되었고, 강우밴드가 강원도 를 넘어 동해까지 확장되어 관측자료와 최대 20 mm 이 상 차이를 보였다. Fig. 7(c)는 Fig. 7(a)와 비교하여 강 우의 공간패턴도 상이하고 강우량도 약 15 ~ 20 mm 로 적게 모의하고 있었으나, 머신러닝을 통해 보정된 강우 의 오차가 약 2 ~ 10 mm 정도로 개선된 것을 확인하였 다. 머신러닝 결과가 집중호우 지역에 대해서는 유사 하게 모의하나, 경기 남부와 같은 무강우 지역에 대해 약 2 ~ 10 mm 의 강우가 나타나고 있어, 이에 대한 보완이 필요할 것으로 판단된다.

    4. 결 론

    본 연구에서는 기상청의 레이더 및 AWS 자료를 활용 한 RAR과 수치모델에서 생산되는 MAPLE, LENS 예 측자료를 활용하여 강우예측인자들을 입력하고, 두 종류 의 머신러닝(LightGBM, XGBoost) 학습을 통해 예측 모형을 생성하는 강우보정 알고리즘을 개발하였다. 이를 2017 ~ 2018년 중 서울과 강릉 지역의 일 강우량이 80 mm 이상인 날로 조사된 5개의 호우사례로 적용하여 보 정된 강우량과 관측된 강우량을 비교하는 통계검증을 수 행하고, 레이더 자료(RAR) 및 예측자료(MAPLE, LENS)와 함께 공간분포를 제시함으로써 강우보정 알고 리즘의 개선효과를 확인하였다.

    통계검증에서는 MAE 오차를 분석한 결과 LightGBM, XGBoost, LENS의 평균 MAE가 각각 7.96 mm, 7.97 mm, 11.23 mm로 LENS 자료에 비해 보정결과가 크게 개선된 효과를 보여주었다. 특히, 5번 사례에서는 보정결과가 동서방향의 관측 패턴을 유사하 게 모의하여 LENS 자료보다 약 12.7 mm 정도 개선되 었다. XGBoost와 LightGBM의 평균 NPE는 6.35 mm, 7.05 mm로 LENS 자료의 10.42 mm 보다 향상된 결과 를 보여주었고, 5번 사례에서 XGBoost와 LightGBM의 평균 NPE는 23.86 mm, 27.46 mm로 LENS 자료의 41.86 mm보다 약 18 mm 정도 향상된 것을 확인하였다. PTE는 모든 사례에 대해 XGBoost가 평균 0.49를 나타 내어, 0.52를 나타내는 LightGBM보다 상대적으로 우수 한 성능을 보여주었다. 머신러닝 결과는 강우량과 최다 강우량 예측에서 개선된 결과를 보여주었지만 최다 강우 량이 나타나는 시각에 대해서 LENS 자료가 LightGBM, XGBoost의 결과보다 나은 결과를 보여 향 후 최다 강우량 예측시각에 대한 개선이 필요함을 확인 하였다.

    호우사례별 3시간 누적 강우량에 대한 RAR, MAPLE, LENS, LightGBM, XGBoost의 공간분포 비 교에서는 1, 2번 사례의 서울 지역 보정 강우량이 RAR 에 비하여 약 5 ~ 10 mm(최대 약 20 mm) 적게 나타났 으나, RAR 자료와 유사한 강우패턴을 모의하고 있어 집 중호우 지역이 머신러닝을 통해 개선되는 것을 확인할 수 있었다. 5번 사례에서도 머신러닝을 통해 보정된 강우 의 오차가 약 2 ~ 10 mm 정도로 개선된 것을 확인하였 다. 1, 2번 사례에서 나타난 서울 호우 지역 보정 강우가 적게 나타나는 경향에 대해서는 호우 유형 및 선행 예측 인자 등에 대한 추가적인 연구가 필요하다고 판단된다. 또한 5번 사례의 경기 남부와 같은 무강우 지역에 2 ~ 10 mm 의 보정 강우가 나타나고 있어, 이에 대한 추가적인 연구가 필요할 것으로 판단된다. 3번 사례에서는 서울지 역에 대해 머신러닝 결과와 RAR 의 오차가 ±5 mm 로 유사하게 모의한 것을 확인하였다. 강릉 지역의 집중호 우인 4번 사례에서 동해 연안을 따라 나타난 강우 패턴에 대해 머신러닝 결과가 LENS 에 비하여 RAR 에 유사하 게 모의하였고, 특히 강원북부 지역에서 머신러닝 결과 와 RAR 의 오차는 0 ~ 5 mm 로 개선된 것을 확인하였 다. 그리고 강릉지역에 대한 머신러닝 결과와 RAR 의 오차도 LightGBM은 5 ~ 10 mm, XGBoost 는 0 ~ 5 mm 로 개선된 것을 확인하였다.

    통계 검증 및 공간 분석을 통해 본 연구에서 개발한 강 우보정 알고리즘의 오차개선 성능이 우수하다는 것을 보 여주었다. 5개의 호우사례 모두 LightGBM과 XGBoost 머신러닝 학습 이후, 강우량을 5 ~ 20 mm 적게 보정함 에도 불구하고 강우의 공간분포 패턴에 대한 보정효과가 뚜렷하였으며, 특히 3번 사례는 XGBoost의 학습결과가 LENS 자료의 오차를 대폭 줄이고 실황 레이더 자료인 RAR와 매우 유사하게 나타나 본 연구에서 개발된 강우 보정 알고리즘의 호우정보 개선효과에 대한 뚜렷한 근거 를 제공하였다.

    본 연구를 통하여 머신러닝을 활용한 수문학적 강우 정보 보정 연구에 효과가 있음을 확인하였다. 향후 다양 한 연구사례를 활용하여 추가적으로 집중호우 사례를 분 석하고, 머신러닝 고도화를 통하여 강우보정효과 개선에 유용한 자료로 활용할 수 있을 것으로 기대된다.

    감사의 글

    본 연구는 한국기상산업기술원 자연재해대응 영향예 보 생산기술개발/호우분야(KMI2018-03012) 연구사업 의 연구비지원에 의해 수행되었습니다.

    Figure

    JESI-28-125_F1.gif

    The process for the rainfall correction technique

    JESI-28-125_F2.gif

    Schematic diagram of machine learning.

    JESI-28-125_F3.gif

    The horizontal distributions of 3-hr accumulated rainfall of (a) RAR, (b) MAPLE, (c) LENS, (d) LightGBM and (e) XGBoost at 2000 LST in July 10, 2017 (CASE 1).

    JESI-28-125_F4.gif

    The horizontal distributions of 3-hr accumulated rainfall of (a) RAR, (b) MAPLE, (c) LENS, (d) LightGBM and (e) XGBoost at 1000 LST in July 23, 2017 (CASE 2).

    JESI-28-125_F5.gif

    The horizontal distributions of 3-hr accumulated rainfall of (a) RAR, (b) MAPLE, (c) LENS, (d) LightGBM and (e) XGBoost at 0400 LST in May 17, 2018 (CASE 3).

    JESI-28-125_F6.gif

    The horizontal distributions of 3-hr accumulated rainfall of (a) RAR, (b) MAPLE, (c) LENS, (d) LightGBM and (e) XGBoost at 0700 LST in August 6, 2018 (CASE 4).

    JESI-28-125_F7.gif

    The horizontal distributions of 3-hr accumulated rainfall of (a) RAR, (b) MAPLE, (c) LENS, (d) LightGBM and (e) XGBoost at 2000 KST in August 29, 2018 (CASE 5).

    Table

    Predictor variables used Machine Learning

    Cases of heavy rainfall

    MAE, NPE, PTE for QPE and corrected rainfall

    Reference

    1. Hong, W. C. , 2008, Rainfall forecasting by technological machine learning models , AMC, 200, 41-57.
    2. Hwang, D. I. , Lee, J. H. , Seo, D. I. , Nah, H. J. , Seo, Y. K. , 2015, Short-term and 1-hour rain forecast improvement using extrapolation prediction techniques , Proceedings of the Autumn Meeting of Korean Meteorological Society, 260-261.
    3. Kang, B. S. , Lee, B. K. , 2011, Application of artificial neural network to improve quantitative precipitation forecasts of meso-scale numerical weather prediction , JKWRA, 44(2), 97-107.
    4. Ke, G. , Meng, Q. , Finely, T. , Wang, T. , Chen, W. , Ma, W. , Ye, Q. , Liu, T. Y. , 2017, LightGBM: A Highly efficient gradient boosting decision tree,31st conference on neural information processing systems, 3149-3157.
    5. Kim, B. S. , Kim, B. K. , Kim, H. S. , 2008, Flood simulation using the gauge-adjusted radar rainfall and physics -based distributed hydrologic model, hydrol . Process., 22, 4400-4414.
    6. Kim, S. H. , Kim, H. M. , Kay, J. K. , Lee, S. W. , 2015, Development and evaluation of the high resolution limited area ensemble prediction system in the korea meteorological administration, atmosphere, 25, 67-83.
    7. Korea Meteorological Administration, 2017, Meteorological Technology & policy, 10(1).
    8. K-Water, 2016, https://www.water.or.kr/encyclopedia/encyclopedia/encyclopediaview.do?seq=527&p_group_seq=526&menu_mode=4&currentPageNo=1&search_Hangulindex=&search_Engindex=&TERM_SEQNO=4485&HANGULTERM=&ENGTERM=&COMM_CODE=&ATTFILE_SEQNO=&languege=h&searchText=concentration rainfall.
    9. Met Office, 2017, Flood Guidance Statement User Guide. Ministry of Public Safety and Security, 2015, Statistical yearbook of natural disaster.
    10. Ministry of Public Safety and Security, 2015, Statistical yearbook of natural disaster.
    11. Moore, R. J. , Cole, S. J. , Dunn, S. , Ghimire, S. , Golding, B. W. , Pierce, C. E. , Roberts, N. M. , Speight, L. , 2015, Surface water flood forecasting for urban communities, Aberdeen, CREW, 32. (CREW ReportCRW2012_03, CEH Project no. C04830).
    12. Parmar, A. , Mistree, K. , Sompura, M. , 2017, Machine learning techniques for rainfall prediction: A Review, Conference: 2017 international conference on innova -tions in information embedded and communication systems.
    13. Sumi, S. M. , Zaman, M. F. , Hirose, H. , 2012, A Rainfall forecasting method using machine laerning models and its application to the Fukuoka city case , Int. J. Appl. Math. Comput. Sci., 22(4), 841854.
    14. WMO (World Meteorological Organization), 2011, Manual on flood forecasting and warning, WMO -No.1072, Geneva, Switzerland.