Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-4517(Print)
ISSN : 2287-3503(Online)
Journal of Environmental Science International Vol.24 No.8 pp.1023-1036
DOI : https://doi.org/10.5322/JESI.2015.24.8.1023

River Stage Forecasting Model Combining Wavelet Packet Transform and Artificial Neural Network

Youngmin Seo*
Department of Constructional Environmental Engineering, Kyungpook National University, Sangju 742-711, Korea
Corresponding author: Youngmin Seo, Department of Constructional Environmental Engineering, Kyungpook National University, Sangju 742-711, Korea Phone: +82-54-530-1440 ymseo@knu.ac.kr
May 18, 2015 July 16, 2015 July 20, 2015

Abstract

A reliable streamflow forecasting is essential for flood disaster prevention, reservoir operation, water supply and water resources management. This study proposes a hybrid model for river stage forecasting and investigates its accuracy. The proposed model is the wavelet packet-based artificial neural network(WPANN). Wavelet packet transform(WPT) module in WPANN model is employed to decompose an input time series into approximation and detail components. The decomposed time series are then used as inputs of artificial neural network(ANN) module in WPANN model. Based on model performance indexes, WPANN models are found to produce better efficiency than ANN model. WPANN-sym10 model yields the best performance among all other models. It is found that WPT improves the accuracy of ANN model. The results obtained from this study indicate that the conjunction of WPT and ANN can improve the efficiency of ANN model and can be a potential tool for forecasting river stage more accurately.


웨이블릿 패킷변환과 신경망을 결합한 하천수위 예측모델

서 영민*
경북대학교 건설방재공학부 건설환경공학전공

    1.서 론

    최근 기후변화로 인하여 전 세계적으로 가뭄, 집중호 우 및 돌발홍수와 같은 극한수문사상의 발생이 증가하고 있는 실정이다. 특히 국내의 경우 국토의 대부분이 산지 로 이루어져 있어 산악지형으로 인한 국지적 기상조건 때문에 이러한 극한수문사상의 발생이 빈번하게 나타나 고 있다. 극한호우, 특히 태풍사상은 하류 하천유역에서 극심한 홍수피해를 발생시킬 수 있으며, 지형 및 수문학 적 특성과 더불어 인구과밀, 도시화 및 산업화는 국내의 홍수방재 및 수자원 관리를 더욱 복잡하게 만드는 요인 으로 작용하고 있다. 또한 강우의 시·공간적 변동성과 강 우-유출관계의 비선형성으로 인하여 하천유역에서의 유 출량 예측은 수자원 분야에서 가장 어렵고 중요한 문제 중 하나로 알려져 있다(Chang 등, 2007). 따라서 비선형 하천유출량 시계열에 대한 예측 정확도 및 신뢰성 향상 은 홍수예방 및 홍수피해저감, 토양침식저감 및 토양보 존, 저수지 유입량 예측, 용수공급 및 수자원관리 측면에 서 매우 필수적이라고 할 수 있다.

    하천유량 또는 수위예측과 관련된 많은 연구들은 과 거에 주로 개념적 및 추계학적 모델(conceptual and stochastic model)에 기초하여 수행되었다(Calvo와 Savi, 2009; Chang과 Hwang, 1999; Mishra 등, 2004). 비록 개념적 모델들이 수문곡선의 주요 특성을 예측하는데 많 이 적용되어 왔으나 이러한 모델들의 실행과 검정은 복잡 한 수학적 모델의 개발, 많은 매개변수들의 추정 및 숙련 된 모델링 경험 등의 필요성 때문에 매우 많은 어려움을 포함하고 있다(Duan 등, 1992; Grayson 등, 1992). 추계 학적 모델을 이용한 홍수예측은 주로 AR(autoregressive), ARMA(autoregressive moving average) 및 ARMA (autoregressive moving average with exogenous inputs) 과 같은 선형모델 및 비선형 회귀모델을 이용하여 수행 되었다(Chang과 Hwang, 1999; Mishra 등, 2004). 그 러나 이러한 모델들은 장기간 동안 측정된 하천유량자료 를 포함해야 하고 유역의 조건이 크게 변하지 않은 하천 유역으로 국한되는 등 적용성에 있어서 한계를 가지고 있다(Baratti 등, 2003).

    최근 인공지능(artificial intelligence) 또는 소프트 컴 퓨팅(soft computing) 기법은 비선형 수문시스템에 대한 모델링에 성공적으로 적용되어 왔다. 특히 ANN (artificial neural network) 및 ANFIS(adaptive neurofuzzy inference system) 모델은 각종 수문변수 예측을 위한 효과적인 도 구로서 널리 적용되어 왔다(Deshmukh와 Ghatol, 2010; Nguyen과 Chua, 2012; Patel과 Parekh, 2014; Seo 등, 2013a, 2013b, 2015a, 2015b). ANN 모델은 생물학적 신경회로망을 모사한 병렬계산모델로서 모델의 일반화 능력이 우수한 특징을 가지며, ANFIS 모델은 신경망과 퍼지추정 시스템의 장점을 결합한 모델이다. 비록 ANN 및 ANFIS 모델이 하천유량, 지하수 및 증발량과 같은 수문학적 변수들을 예측하는데 광범위하게 사용되기는 하지만 수문시계열은 여러 성분들을 포함하고 비선형 관 계를 가지기 때문에 자료의 전처리과정을 포함하거나 다 른 기법들과 결합한 하이브리드 모델(hybrid model)을 개발하는 것은 예측모델의 성능을 향상시킬 수 있는 것 으로 알려져 있다(Okkan, 2012).

    최근 인공지능에 기반한 예측모델의 정확성을 향상시 키기 위하여 인공지능모델과 다른 기법들을 결합한 형태 의 하이브리드 모델 개발이 활발히 이루어지고 있다. 예 를 들어, 카오스 기반 ANN(chaotic-based ANN) 모델 (Karunasinghe와 Liong, 2006), SPA(set pair analysis) 및 주성분 분석에 기반한 ANN 모델(Wang 등, 2006a; Wang 등, 2006b; Wu 등, 2009), 임계치 ANN 모델 (Wang 등, 2006b), 군집기반 ANN 모델(Cigizoglu와 Kisi, 2005), bootstrap 기반 ANN 모델(Jia와 Culver, 2006; Kim 등, 2013a; Seo 등, 2013a, 2013b; Tiwari 와 Chatterjee, 2010a, 2010b), 웨이블릿(wavelet) 기반 인공지능모델(Adamowski와 Prasher, 2012; Nejad와 Nourani, 2012; Seo 등, 2015a, 2015b; Tiwari와 Chatterjee, 2010b) 등이 대표적이다.

    웨이블릿 패킷변환(wavelet packet transform, WPT) 과 인공지능모델의 결합과 관련된 주요 연구들을 살펴보 면, Amiri와 Asadi(2009)는 웨이블릿 패킷과 최적기저 탐색 알고리즘(best basis search algorithm)을 이용하여 지반운동기록을 처리할 수 있는 방법을 제안하였다. Chen 등(2010)은 웨이블릿 패킷분해(wavelet packet decomposition), 위상공간 재구성(phase space recons -truction), SVR(support vector regression) 모델을 이 용하여 10분 해상도로 예측시간 1~6시간에 대하여 풍 속예측 방법을 제안하였다. Gokhale와 Khanduja(2010) 는 다양한 웨이블릿 기저집합을 적용한 웨이블릿 패킷해 석을 이용하여 시계열 신호의 분석과 합성을 위한 기법 을 제안하였다. Liu 등(2013)은 풍속예측을 위하여 웨이 블릿, 웨이블릿 패킷, 시계열 해석 및 ANN 모델에 기초 한 세 가지 하이브리드 모델, 즉 Wavelet Packet-BFGS, Wavelet Packet-ARIMA-BFGS 및 Wavelet-BFGS를 제안하였다. Ravikumar과 Tamilselvan(2014)은 비선 형 시계열에서 경향성 예측에 기반한 WPT를 제안하였 다. Raghavendra와 Deka(2015)는 월지하수위 변동을 예측하기 위하여 WPT와 SVR 모델의 결합을 통하여 SVR 모델의 예측효율을 향상시키고자 하였다.

    본 연구에서는 하천유역에서 유출량 또는 수위 예측 에 대한 정확성을 향상시키기 위하여 WPT와 ANN 모 델을 결합한 WPANN(wavelet packet-based artificial neural network) 모델을 제안하였으며, 안동댐 유역을 대상으로 한 적용분석을 통하여 WPANN 모델의 성능 을 기존의 ANN 모델과 비교하였다. 또한 WPT에 적용 되는 웨이블릿의 종류에 따른 WPANN 모델의 성능을 비교하기 위하여 13개의 웨이블릿, 즉 Haar wavelet (db1), Daubechies-2(db2), Daubechies-4 (db4), Daube -chies-6(db6), Daubechies-8(db8), Daubechies-10(db 10), Symmlet-2 (sym2), Symmlet-4 (sym4), Symmlet -8 (sym8), Symmlet-10(sym10), Coiflet-6 (coif6), Coiflet-12(coif12) 및 Coiflet-18 (coif18)에 따른 모델 성능을 비교하였다.

    2.재료 및 방법

    2.1.분석자료

    본 연구에서 제안한 WPANN 모델의 효율성 평가를 위하여 분석유역으로서 안동댐 유역을 선정하였다. WPANN 및 ANN 모델링을 위한 자료는 안동댐 유역에 위치한 2개의 수위관측소인 도산 및 소천에 대한 일수위 자료(2002~2013년)로서 국토교통부에 의해 운영 및 관 리되고 있는 WAMIS(Water Management Information System)로부터 수집되었다. 수집된 자료 중 2002~2010년(9년)의 자료는 WPANN 및 ANN 모델의 학습 을 위하여 사용되었으며, 2011~2013년(3년) 자료는 모 델의 검증을 위하여 사용되었다. Fig. 1은 분석대상유역 및 수위관측소의 위치를 나타내고 있다.

    2.2.분석방법

    (1)ANN 모델

    ANN 모델은 생물학적 신경회로망의 구조 및 기능 측 면에 근거하여 개발된 병렬계산시스템으로서 각 층(layer) 마다 배열된 노드(node) 또는 뉴런(neuron)들이 하나의 시스템을 이룬다. 다층퍼셉트론(multilayer perceptron, MLP)은 가장 널리 사용되는 ANN 모델 구조로서 일반 적으로 여러 노드들을 가지는 여러 개의 층으로 구성된 다. 입력층(input layer)은 ANN 모델의 첫 번째 층으로 서 외부의 정보(입력자료)를 받아들이며, 문제의 해(출력 자료)는 마지막 층인 출력층(output layer)에서 얻게 된 다. 은닉층(hidden layer)이라고 불리는 하나 이상의 중 간층은 입력층과 출력층 사이에 위치하며, 인접한 층에 서 노드들은 시냅스(synapse)라고 불리는 비순환 아크 (acyclic arc)에 의해 입력층으로부터 출력층까지 완전히 연결된다(Kim 등, 2012, 2013).

    각각 하나의 입력층, 출력층 및 은닉층으로 구성되고 J 개의 은닉노드(hidden node)를 가지는 다층퍼셉트론 은 가장 일반적인 ANN 모델 구조로서 Eq. (1)과 같은 주어진 함수를 이용하여 출력자료를 산출하게 된다 (Günther와 Fritsch, 2010).

    o X = f w 0 + j = 1 J w j w 0 j + i = 1 n w ij x i = f w 0 + j = 1 J w j f w 0 j + W j T X
    (1)

    여기서, w0는 출력노드의 절편(intercept), w0jj번 째 은닉노드의 절편, wjj번째 은닉노드로부터 시작하 여 출력노드에 이르는 시냅스에 상응하는 시냅스 가중치, wj = (w1j, ..., wnj) 는 j번째 은닉노드에 이르는 시냅 스에 상응하는 모든 시냅스 가중치의 벡터, x = (x1, ..., xn) 은 공변량 벡터(covariant vector)이고 f는 활성 화 함수(activation function)이다. Fig. 2는 일반적인 ANN 모델의 구조를 나타내고 있다.

    (2)웨이블릿 패킷변환

    웨이블릿은 자료를 다른 주파수 영역으로 분해하여 그것의 스케일에 부합하는 해상도로 각 영역을 분석하는 작은 파(wave) 형태의 수학적 함수로서 불연속 및 매우 급한 경사의 첨두를 가지는 신호가 발생하는 물리적인 상황 하에서 기존의 푸리에 기법(Fourier method)에 비 해 더욱 효과적인 분석이 가능한 장점을 가진다.

    WPT는 DWT(discrete wavelet transform)를 일반 화한 기법으로서 어떤 신호의 시간영역을 주파수 영역으 로 레벨(level)별 변환을 가능케 하는 기법이다. DWT는 웨이블릿 기저(wavelet basis)를 이용하여 자료벡터, 즉 신호 또는 스펙트럼의 좌표를 추정하며, 웨이블릿 기저 는 다른 스케일의 신호를 적합시키기 위하여 웨이블릿 을 연장하거나 신호의 모든 부분들을 포함하기 위하여 웨이블릿을 이동시킴으로써 생성된다. 즉, DWT는 신호 에 대한 시간-스케일 또는 시간-주파수 분석을 수행하게 된다. DWT에서 신호는 상세성분(detail)과 근사성분 (approximation)으로 분해되는데, 첫 번째 단계로부터 얻어진 근사성분은 새로운 상세성분과 근사성분으로 분 해되고 이러한 과정은 반복된다. DWT는 신호의 근사성 분만을 분해하기 때문에 고주파수 요소에서 국부적으로 존재하는 의미 있는 정보를 분석에 반영하지 못하는 문 제점이 발생할 수 있다. 반면 WPT에서는 DWT와 달리 근사성분 뿐만 아니라 상세성분도 분해되기 때문에 DWT에서는 n 레벨에서 n + 1개의 웨이블릿 성분을 생 성하지만 WPT는 2n개의 웨이블릿 성분을 생성하게 된 다. 즉, WPT는 저주파수 하위대역 뿐만 아니라 고주파 수 하위대역을 분해함으로써 DWT에 비해 더욱 정확한 주파수 해상도를 제공할 수 있게 되며, WPT는 DWT보 다 신호에 대한 훨씬 더 많은 특징을 얻을 수 있게 된다 (Lei 등, 1994).

    웨이블릿 패킷은 Eq. (2)와 같이 함수 ψij,k (t)로서 나 타낼 수 있다(Raghavendra와 Deka, 2015).

    ψ j , k i t = 2 j / 2 ψ i 2 j t k
    (2)

    여기서, i는 모듈화 매개변수(modulation parameter), j는 확장 매개변수(dilation parameter), k는 전이 매개 변수(translation parameter), i = 1, 2,···, jn이고 n은 웨이블릿 패킷 트리(wavelet packet tree)에서의 분해레 벨(decomposition level)을 나타낸다. 한편, 웨이블릿은 Eqs. (3)~(4)로 나타낼 수 있다.

    ψ 2 i t = 1 2 k = h k ψ i t 2 k
    (3)
    ψ 2 i + 1 t = 1 2 k = g k ψ i t 2 k
    (4)

    여기서, ψi (t)는 모웨이블릿(mother wavelet), h(k)g(k)는 각각 스케일링 함수(scaling function) 및 모 웨이블릿 함수(mother wavelet function)에 대한 필터 (filter)이다.

    신호 f(t) 에 상응하는 웨이블릿 패킷 계수(wavelet packet coefficient) Cij,k 는 Eq. (5)를 이용하여 구할 수 있다.

    C j , k i = f t ψ j , k i t dt
    (5)

    웨이블릿 패킷계수가 직교조건(orthogonality condi -tion) (Fan과 Zuo, 2006)을 만족시킬 경우 특정 노드에 서 주어진 신호에 대한 웨이블릿 패킷성분은 Eq. (6)에 의해 얻어질 수 있다.

    f j i t = k = C j , k i ψ j , k i t dt
    (6)

    j번째 레벨까지 웨이블릿 패킷분해가 수행된 이후에 원신호는 Eq. (7)과 같이 j번째 레벨에서의 모든 웨이블 릿 패킷성분들의 합으로 나타낼 수 있다.

    f t = i = 1 2 i f j i t
    (7)

    WPT는 LPF(low-pass filter) 및 HPF(high-pass filter)로 구성된다. 웨이블릿 패킷은 웨이블릿의 선형조 합이며, 선형조합에서의 계수는 웨이블릿 패킷 계수를 생성하는 재귀알고리즘(recursive algorithm)에 의해 산 정된다. WPT는 주어진 스케일에서 하나 이상의 기저함 수, 즉 웨이블릿 패킷을 가질 수 있다. 모든 LPF 및 HPF 가 반복될 경우 완전트리기저(complete tree basis)가 형 성된다. WPT의 상위 레벨은 신호에 대한 시간표현(time representation)이며, 하위 레벨은 신호에 대한 더 나은 주파수 해상도를 제공한다. Fig. 3은 WPT를 이용한 레 벨 3 분해를 나타내고 있다.

    (3)WPANN 모델

    WPANN 모델은 WPT와 ANN 모델을 결합한 하이 브리드 모델로서 먼저 원자료(학습자료 및 검증자료)를 WPT를 이용하여 근사성분 및 상세성분으로 분해하고, 다음으로 분해된 성분들을 ANN 모델의 입력으로 사용 하는 개념에 기초하고 있다. WPANN 모델은 다음과 같 은 3단계 알고리즘으로 구성된다.

    ▪ 1단계: WPANN 모델의 WPT 모듈에 의한 시계열 분해과정으로서 주어진 레벨에 따라서 원자료(학습 자료 및 검증자료)를 근사성분 및 상세성분으로 분 해한다.

    ▪ 2단계: WPANN 모델의 ANN 모듈에 의한 학습단 계로서 1단계에서 분해된 근사성분과 상세성분을 학습자료로 사용하여 WPANN 모델의 학습을 수 행한다.

    ▪ 3단계: WPANN 모델의 검증단계로서 2단계에서 학습된 WPANN 모델과 검증자료를 이용하여 WPANN 모델의 예측 및 모델성능지표 산정을 수 행한다.

    (4)모델성능평가

    본 연구에서 구축한 하천수위 예측모델, 즉 ANN 및 WPANN 모델의 성능은 모델성능평가지표를 이용 하여 평가하였다. 모델성능평가지표로서는 효율성 계수 (coefficient of efficiency, CE), IOA(index of agreement, d), 결정계수(coefficient of determination, r2), 제곱근 평균제곱오차(root-mean-square error, RMSE), 평균절대오차(mean absolute error, MAE), 평균제곱오 차(mean squared error, MSE), 평균제곱상대오차(mean squared relative error, MSRE) 및 평균고차오차(mean higher order error, MS4E)를 적용하였으며, 각 지표들 은 Eqs. (8)~(15)와 같이 나타낼 수 있다(Dawson과 Wilby, 2001).

    CE = 1 i = 1 N Q i Q i 2 i = 1 N Q Q ¯ 2
    (8)
    d = 1 i = 1 N Q i Q i 2 i = 1 N Q i Q ¯ + Q i Q ¯ 2
    (9)
    r 2 = i = 1 N Q i Q ¯ Q i Q ˜ i = 1 N Q i Q ¯ 2 i = 1 N Q i Q ˜ 2
    (10)
    RMSE = 1 N i = 1 N Q i Q i 2 0.5
    (11)
    MAE = 1 N i = 1 N Q i Q i
    (12)
    MAE = 1 N i = 1 N Q i Q i 2
    (13)
    MSRE = 1 N i = 1 N Q i Q i Q i 2
    (14)
    MS 4 E = 1 N i = 1 N Q i Q i 4
    (15)

    여기서, Qi*는 예측치, Qi 는 관측치, Q는 관측치의 평균, EQ 는 예측치의 평균이며, N 은 관측자료의 개수 이다.

    3.결과 및 고찰

    3.1.분석

    하천유역의 수위예측을 위하여 본 연구에서 구축한 ANN 및 WPANN 모델의 입력변수에 대한 결정은 동일 한 유역에서의 선행연구인 Seo 등(2015a)의 연구결과를 적용하였다. Seo 등(2015a)은 자기상관함수(autocorrela -tion function), 교차상관함수(cross correlation function) 및 부분자기상관함수(partial autocorrelation function) 를 적용하여 ANN 및 WANN(wavelet-based artificial neural network) 모델의 입력변수를 결정을 하였으며, 본 연구에서는 Seo 등(2015a)의 연구결과로부터 Eq. (16)과 같은 입력 및 출력변수 구성을 적용하였다.

    WL DS t = f WL SC t 2 , WL SC t 1 , WL SC t , WL DS t 3 , WL DS t 2 , WL DS t 1
    (16)

    여기서, WL 은 수위, t는 시간, f*는 ANN 또는 WPANN 모델, 첨자 DSSC 는 도산 및 소천 수위관 측소를 각각 나타낸다.

    ANN 및 WPANN 모델을 이용한 하천수위 예측을 위하여 본 연구에서는 MLP 타입의 ANN 모델을 적용하 였다. MLP 타입의 ANN 모델의 경우 정확한 모의결과 를 얻기 위해서는 모델구조와 모의매개변수를 최적화해 야 한다. 특히 은닉노드의 수는 ANN 및 WPANN 모델 의 예측결과에 큰 영향을 미치기 때문에 본 연구에서는 은닉노드의 수에 따른 RMSE 값의 변화를 분석하여 최 소 RMSE 값을 가지는 은닉노드의 수를 최적 은닉노드 수로 결정하였다. ANN 및 WPANN 모델에 대한 기타 모델링 과정은 ANN 모델링에서 일반적으로 채택하고 있는 방법을 따랐다(Kisi, 2007; Kim 등, 2012; Kim 등, 2013). ANN 및 WPANN 모델의 학습을 위하여 역전파 알고리즘(backpropagation algorithm)을 적용하였으며, 활성화 함수로서 일반적으로 가장 많이 채택되고 있는 로지스틱 시그모이드 함수(logistic sigmoid function) 를 적용하였다. 또한 모의매개변수는 시행착오법으로 결 정하였으며, ANN 및 WPANN 모델의 입력자료는 자료 의 상대적 크기에 따른 영향을 최소화하기 위하여 [0, 1] 로 정규화하였다.

    WPANN 모델링에서는 WPT를 이용하여 입력 시계 열 자료(학습자료 및 검증자료)를 분해하였으며, 분해레 벨 n은 Eq. (17)을 이용하여 결정하였다(Seo 등, 2015a, 2015b).

    n = int log N
    (17)

    여기서, n은 분해레벨, N 은 입력 시계열 자료의 개수, int [·]는 정수부를 출력하는 함수이다. Eq. (17)을 적용 하여 본 연구에서는 n = 3의 분해레벨이 결정되었다.

    또한 본 연구는 웨이블릿의 종류에 따른 WPANN 모 델의 효율성을 평가하는 것을 목적으로 하며, 총 13개의 웨이블릿, 즉 Haar wavelet(db1), Daubechies-2(db2), Daubechies-4(db4), Daubechies-6(db6), Daubechies -8(db8), Daubechies-10(db10), Symmlet-2(sym2), Symmlet-4(sym4), Symmlet-8(sym8), Symmlet-10 (sym10), Coiflet-6(coif6), Coiflet-12(coif12) 및 Coiflet -18(coif18)을 WPT에 적용하였다. Fig. 4는 학습기간에 대하여 sym10을 이용하여 분해된 도산 수위관측소의 일 수위 시계열의 예를 보여주고 있다.

    3.2.모델성능평가

    Table 1은 ANN과 WPANN 모델의 모델성능을 비 교한 것이다. ANN과 WPANN 모델의 성능 비교는 모 델성능평가지표, 즉 CE, d, r2, RMSE, MAE, MSE, MSRE 및 MS4E를 이용하여 수행되었다. 모델성능평가 지표 중에서 CE, dr2 값은 클수록, RMSE, MAE, MSE, MSRE 및 MS4E 값은 작을수록 더 우수한 모델 성능을 나타낸다. Table 1로부터 WPANN 모델의 CE, dr2 값은 ANN 모델의 값보다 크고, WPANN 모델 의 RMSE, MAE, MSE, MSRE 및 MS4E 값은 ANN 모델의 값보다 작은 것으로 분석되었다. 이러한 결과는 모델성능지표에 근거하여 WPANN 모델이 ANN 모델 보다 성능이 우수함을 나타낸다. 웨이블릿 종류에 따른 WPANN 모델의 모델성능을 살펴보면, WPANNsym10, WPANN-coif18 및 WPANN-sym8 모델이 다 른 WPANN 모델에 비해 CE, dr2 값은 크고, RMSE, MAE, MSE, MSRE 및 MS4E 값은 작은 것으로 분 석되었다. 이러한 결과는 WPANN-sym10, WPANN coif18 및 WPANN-sym8 모델이 다른 WPANN 모 델에 비해 모델성능지표에 근거하여 성능이 우수함을 나타낸다. 동일 웨이블릿 계열에 대해서 비교해보면, Daubechies 웨이블릿 중에서는 WPANN-db2 모델이 가장 우수한 모델성능을 나타내었으며, Symmlet 중에서 는 WPANN-sym10 모델, Coiflet 중에서는 WPANN -coif18 모델이 가장 우수한 모델성능을 나타내는 것으 로 분석되었다. 이 중에서 WPANN-sym10은 모든 비교 모 델 중에서 가장 우수한 모델성능을 나타내었다. WPANN -sym10 모델은 ANN 모델에 비하여 CE의 경우 1.66%, d의 경우 0.40%, r2의 경우 1.55%, RMSE의 경우 25.29 %, MAE의 경우 20.38%, MSE의 경우 44.26%, MSRE 의 경우 43.72%, MS4E의 경우 92.93 %의 성능향상을 나타내는 것으로 분석되었다.

    Fig. 5는 ANN 및 WPANN 모델에 대한 관측치와 예측치의 관계를 도시한 산점도(scatter plot)를 나타내 고 있다. Fig. 5에서 파란 색 직선은 1:1 경사 직선을 나 타내고 붉은 색 직선은 산점도에 대한 선형적합직선 (y = ax + b, 여기서, x는 관측치, y는 예측치, a는 직선 의 경사, by 절편)을 나타낸다. 산점도에서 1:1 직선 가까이에 점들이 분포할수록 더욱 정확한 모델성능을 나 타내며, 선형적합직선의 경사 a가 1에 근접하고 y 절편 b가 0에 근접할수록 더욱 정확한 모델성능을 나타낸 다. 모델성능 상위 3개의 모델, 즉 WPANN- sym10, WPANN-coif18 및 WPANN-sym8 모델과 ANN 모델 에 대하여 비교해 보면, ANN 모델보다 WPANN-sym10, WPANN-coif18 및 WPANN-sym8 모델이 1:1 경사 직선 가까이에 점들이 분포하고 a값이 1에 더 가까우며, b값 은 0에 더 가까운 결과를 나타내고 있다. 즉, 산점도에 근 거하여 WPANN-sym10, WPANN-coif18 및 WPANN -sym8 모델이 ANN 모델보다 모델성능이 더 우수한 것 으로 분석되었다.

    Fig. 6은 모델성능 상위 3개의 모델, 즉 WPANNsym10, WPANN-coif18 및 WPANN-sym8 모델과 ANN 모델에 대한 관측 및 예측 수위수문곡선, 예측오차 및 오차분포를 나타내고 있다. Fig. 6으로부터 수위수문 곡선의 예측오차의 경우 고수위 값에 대한 오차가 저수 위 값보다 크게 나타남을 알 수 있으며, ANN 모델은 WPANN-sym10, WPANN-coif18 및 WPANN-sym8 모델에 비하여 특히 고수위 값에 대한 오차가 크게 나타 남을 알 수 있다. 오차분포 측면에서 살펴보면, ANN 모 델의 경우 오차의 최대값과 최소값이 각각 0.5566 및 1.003으로서 1.5596의 범위(최대값-최소값)를 나타내고 있으며, WPANN-sym10 모델의 경우 오차의 최대값과 최소값이 각각 0.3290 및 0.3256으로서 0.6546의 범 위를, WPANN-coif18 모델의 경우 오차의 최대값과 최 소값이 각각 0.3558 및 0.4788로서 0.8346의 범위를, WPANN-sym8 모델의 경우 오차의 최대값과 최소값이 각각 0.3522 및 0.4414로서 0.7936의 범위를 나타내 는 것으로 분석되었다. 따라서 예측수위수문곡선의 오차 범위에 근거하여 WPANN-sym10, WPANN- coif18 및 WPANN-sym8 모델은 ANN 모델에 비해 작은 오차 범위를 가지는 것으로 분석되어 상대적으로 정확도가 높 은 것으로 나타났다. 특히 WPANN-sym10 모델은 가장 작은 오차범위를 가지는 것으로 분석되어 예측 수위수문 곡선의 오차 측면에서 가장 우수한 모델성능을 가지는 것으로 분석되었으며, ANN 모델에 비하여 약 58%의 성능향상을 가져오는 것으로 분석되었다.

    4.결 론

    본 연구는 하천유역에서의 수위예측에 있어서 ANN 모델의 예측 정확성을 향상시키기 위하여 WPT과 ANN 모델을 결합한 하이브리드 모델인 WPANN 모델을 제 안하였으며, 안동댐 유역을 대상으로 한 적용분석을 통 하여 WPANN 및 ANN 모델을 구축하고 모델성능평가 지표를 이용하여 구축된 모델들의 성능을 비교하였다. 또한 WPANN 모델의 WPT 모듈에서 적용되는 웨이블 릿의 종류에 따른 모델성능을 비교하기 위하여 13개의 웨이블릿, 즉 db1, db2, db4, db6, db8, db10, sym2, sym4, sym8, sym10, coif6, coif12 및 coif18에 따른 WPANN 모델의 성능을 비교하였다. 그 결과 WPANN 모델은 ANN 모델보다 우수한 모델성능을 나타내었으 며, WPANN 모델 중에서 WPANN-sym10, WPANN -coif18 및 WPANN-sym8 모델은 다른 WPANN 모델 에 비해 우수한 모델성능을 나타내었다. 모든 비교 모델 중에서 WPANN-sym10 모델은 가장 우수한 모델성능 을 나타내었다. 따라서 WPT와 ANN 모델을 결합한 WPANN 모델은 ANN 모델의 성능을 향상시킬 수 있으 며, WPANN 모델은 하천유역에서 신뢰성 있는 수위예 측을 위한 효과적인 도구로 활용될 수 있을 것으로 판단 된다.

    Figure

    JESI-24-1023_F1.gif

    Study region and locations of observations.

    JESI-24-1023_F2.gif

    General architecture of ANN.

    JESI-24-1023_F3.gif

    Wavelet packet decomposition tree for three levels.

    JESI-24-1023_F4.gif

    Decomposed time series using sym10 wavelet for training period.

    JESI-24-1023_F5.gif

    Scatter plots for ANN and WPANN models(Cont’d).

    JESI-24-1023_F6.gif

    Stage hydrographs and their error plots.

    Table

    Comparison of model performance

    Reference

    1. Adamowski J, Prasher S O. Comparison of machine learning methods for runoff forecasting in mountainous watersheds with limited data. J. Water Land Dev. 2012;17:89–97
    2. Amiri G G, Asadi A. Comparison of different methods of wavelet and wavelet packet transform in processing ground motion records. Int. J. Civil Eng. 2009;7(4):248–257
    3. Baratti R, Cannas B, Fanni A, Pintus M, Sechi G M. River flow forecast for reservoir management through neural networks. Neurocomputing. 2003;55(3-4):421–437
    4. Calvo B, Savi F. Real-time flood forecasting of the Tiber river in Rome. Nat. Hazards. 2009;50(3):461–477
    5. Chang F J, Chiang Y M, Chang L C. Multi -step-ahead neural networks for flood forecasting. Hydrolog. Sci. J. 2007;52(1):114–130
    6. Chang F J, Hwang Y Y. A self-organization algorithm for real-time flood forecast. Hydrol. Process. 1999;13(2):123–138
    7. Chen P, Chen H, Ye R. Chaotic wind speed series forecasting based on wavelet packet decomposit -ion and support vector regression. Proceedings of IPEC 2010 Conference Singapore. 2010:256–261
    8. Cigizoglu H K, Kisi O. Flow prediction by three back propagation techniques using k-fold partitioning of neural network training data. Nord. Hydrol. 2005;36(1):49–64
    9. Dawson C W, Wilby R L. Hydrological modell -ing using artificial neural networks. Prog. Phys. Geogr. 2001;25(1):80–108
    10. Deshmukh R P, Ghatol A A. Short term flood forecasting using general recurrent neural network modeling a comparative study. Int. J. Comput. Appl. 2010;8(12):5–9
    11. Duan Q, Sorooshian S, Gupta V K. Effective and efficient global optimization for conceptual rainfall-runoff models. Water Resour. Res. 1992;28(4):1015–1031
    12. Fan X, Zuo M J. Gearbox fault detection using Hilbert and wavelet packet transform. Mech. Syst. Signal Pr. 2006;20:966–982
    13. Gokhale M Y, Khanduja D K. Time domain signal analysis using wavelet packet decomposition approach. Int. Commun. Network Syst. Sci. 2010;3(3):321–329
    14. Grayson R B, Moore I D, McMahon T A. Physically based hydrologic modeling: 2. Is the concept realistic? Water Resour. Res. 1992;28(10):2659 –2666
    15. Günther F, Fritsch S. Neuralnet: Training of neural networks. R J. 2010;2(1):30–38
    16. Jia Y, Culver T B. Bootstrapped artificial neural networks for synthetic flow generation with a small data sample. J. Hydrol. 2006;331(3-4):580–590
    17. Karunasinghe D S K, Liong S Y. Chaotic time series prediction with a global model: artificial neural network. J. Hydrol. 2006;323(1-4):92–105
    18. Kim S, Seo Y, Singh V P. Assessment of pan evaporation modeling using bootstrap resampling and soft computing methods. J. Comput. Civ. Eng. 1943. 2013a doi: 10.1061/(ASCE)CP-5487.0000367
    19. Kim S, Shiri J, Kisi O. Pan evaporation modelling using neural computing approach for different climatic zones. Water Resour. Manag. 2012;26(11):3231–3249
    20. Kim S, Shiri J, Kisi O, Singh V P. Estimating daily pan evaporation using different data-driven methods and lag-time patterns. Water Resour. Manag. 2013;27(7):2267–2286
    21. Kisi O. Streamflow forecasting using different artificial neural network algorithms. J. Hydrol. Eng. 2007;12(5):532–539
    22. Lei J, Meyer Y, Ryan R D. Wavelets: Algorithms & applications. Math. Comput. 1994;63:822
    23. Liu H, Tian H, Pan D, Li Y. Forecasting models for wind speed using wavelet, wavelet packet, time series and artificial neural networks. Appl. Energ. 2013;107:191–208
    24. Mishra A, Hata T, Abdelhadi A W. Models for recession flows in the upper Blue Nile River. Hydrol. Process. 2004;18(15):2773–2786
    25. Nejad F H, Nourani V. Elevation of wavelet denoising performance via an ANN-based streamflow forecasting model. Int. J. Comput. Sci. Manage. Res. 2012;1(4):764–770
    26. Nguyen P K T, Chua L H C. The data-driven approach as an operational real-time flood forecasting model. Hydrol. Process. 2012;26(19):2878–2893
    27. Okkan U. Using wavelet transform to improve generalization capability of feed forward neural networks in monthly runoff prediction. Sci. Res. Essays. 2012;7(17):1690–1703
    28. Patel D, Parekh D F. Flood forecasting using adaptive neuro-fuzzy inference system (ANFIS) Int. J. Eng. Trend. Tech. 2014;12(10):510–514
    29. Raghavendra N S, Deka P C. Forecasting monthly groundwater level fluctuations in coastal aquifers using hybrid wavelet packet-support vector regression. Cogent Eng. 2015;2(1)
    30. Ravikumar K, Tamilselvan S. On the use of wavelets packet decomposition for time series predict –tion. Appl. Math. Sci. 2014;8(58):2847–2858
    31. Seo Y, Kim S, Kisi O, Singh V P. Daily water level forecasting using wavelet decomposition and artificial intelligence techniques. J. Hydrol. 2015a;520:224–243
    32. Seo Y, Kim S, Singh V P. Flood forecasting and uncertainty assessment using bootstrapped ANFIS; Proceedings of 6th Conference of Asia Pacific Association of Hydrology and Water Resources; Seoul, South Korea. 2013a. pp. 1–8
    33. Seo Y, Kim S, Singh V P. Multistep-ahead flood forecasting using wavelet and data-driven methods. KSCE J. Civil Eng. 2015b;19(2):401–417
    34. Seo Y, Park K B, Kim S, Singh V P. Application of bootstrap-based artificial neural networks to flood forecasting and uncertainty assessment; Proceedings of 6th International Perspective on Water Resources and the Environment, EWRI-ASCE; Izmir, Turkey. 2013b
    35. Tiwari M K, Chatterjee C. Uncertainty assess -ment and ensemble flood forecasting using bootstrap based artificial neural networks(BANNs): J. Hydrol. 2010a;382(1-4):20–33
    36. Tiwari M K, Chatterjee C. Development of an accurate and reliable hourly flood forecasting model using wavelet-bootstrap-ANN(WBANN) hybrid approach. J. Hydrol. 2010b;394(3-4):458–470
    37. Wang W, Van Gelder P, Vrijling J K, Ma J. Forecasting daily streamflow using hybrid ANN models. J. Hydrol. 2006a;324(1-4):383–399
    38. Wang H F, Huang W J, Wang W S. Cuntan station of the Yangtze River annual runoff forecasting with set pair analysis method. J. Heilongjiang Hydraul. Eng. Coll. 2006b;33(4):3–5
    39. Wu C L, Chau K W, Li Y S. Predicting monthly streamflow using data-driven models coupled with data-preprocessing techniques. Water Resour.Res. 2009;45(8):W08432