:: Journal of Environmental Science International ::
Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-4517(Print)
ISSN : 2287-3503(Online)
Journal of Environmental Science International Vol.27 No.7 pp.499-507
DOI : https://doi.org/10.5322/JESI.2018.27.7.499

A Missing Value Replacement Method for Agricultural Meteorological Data Using Bayesian Spatio–Temporal Model

Dain Park*,Sanghoo Yoon1)
Department of Statistics, Daegu University, Gyeongsan, 38453, Korea
1)Division of Mathematics and big data science, Daegu University, Gyeongsan 38453, Korea
*Corresponding author: Sanghoo Yoon, Division of Mathematics and big data science, Daegu University, Gyeongsan 38453, Korea Phone : +82-53-850-6421
07/02/2018 27/03/2018 26/04/2018

Abstract


Agricultural meteorological information is an important resource that affects farmersʼ income, food security, and agricultural conditions. Thus, such data are used in various fields that are responsible for planning, enforcing, and evaluating agricultural policies. The meteorological information obtained from automatic weather observation systems operated by rural development agencies contains missing values owing to temporary mechanical or communication deficiencies. It is known that missing values lead to reduction in the reliability and validity of the model. In this study, the hierarchical Bayesian spatio–temporal model suggests replacements for missing values because the meteorological information includes spatio–temporal correlation. The prior distribution is very important in the Bayesian approach. However, we found a problem where the spatial decay parameter was not converged through the trace plot. A suitable spatial decay parameter, estimated on the bias of root–mean–square error (RMSE), which was determined to be the difference between the predicted and observed values. The latitude, longitude, and altitude were considered as covariates. The estimated spatial decay parameters were 0.041 and 0.039, for the spatio-temporal model with latitude and longitude and for latitude, longitude, and altitude, respectively. The posterior distributions were stable after the spatial decay parameter was fixed. root mean square error (RMSE), mean absolute error (MAE), mean absolute percentage error (MAPE), and bias were calculated for model validation. Finally, the missing values were generated using the independent Gaussian process model.



농업기상 결측치 보정을 위한 통계적 시공간모형

박다인*,윤상후1)
대구대학교 통계학과, 1)대구대학교 수리빅데이터 학부 통계·빅데이터 전공

    1 서 론

    농업기상은 농가 수익, 식량 안보, 농업 재해에 많 은 영향을 미치는 중요한 국가 자원이다. 때문에 농업 정책의 기획, 수립, 집행, 평가를 담당하는 다양한 분 야에서 농업기상을 이용한 다양한 연구가 수행되고 있다(Lee, 2000). 농촌진흥청은 농작물의 생육과 병해 충 발생예측, 기상재해방지 등에 활용하기 위해 고품 질의 농업기상자료를 제공하는데 힘쓰고 있다.

    특정 지역에서 재배하는 작물이나 품종은 그 지방 의 기후에 맞게 진화되어 왔다. 날씨가 평년과 비슷할 경우 작물의 생육도 순조롭지만, 최근과 같이 기상의 변화폭이 커지면 작물의 생육도 예년과 달라지며, 그 정도가 심할 때는 큰 피해를 받게 된다(Lee et al., 2012). 특히 지구온난화에 따른 겨울철 및 봄철의 이 상기온은 양파 호르몬의 불균형을 초래하고 양파의 전반적인 생육단계를 빠르게 하여 품질을 저하시킨다 (Jang et al., 2002). 이 외에도 양파재배와 기상에 관 한 연구로 농작물 생산량과 기상요소의 상관관계 분 석(Lee et al., 2012)과 온도에 따른 양파의 생리적 특 성 및 수량 변화(Lee et al., 2014)등 의 연구가 진행되 었다.

    농촌진흥청에서 운용하는 자동기상관측장비인 AWS로 부터 얻는 기상정보는 일시적인 기계 장애나 통신 장애등으로 결측치가 포함되어 있다. 결측치가 포함된 자료를 이용한 자료 분석은 연구의 신뢰도와 타당도를 떨어뜨릴 수 있다. 이에 결측치가 보정된 농 업기상정보로 연구를 수행한다면 더 좋은 결과를 얻 을 수 있을 것이다. 기상정보의 결측치 보정방법으로 인공신경망을 이용한 방법(Min et al., 2016)과, 공간 시계열모형인 STAR 모형(Lee and Kim, 2010)을 이 용하여 결측치를 보정하는 연구들이 국내에서 수행되 었다.

    결측치 처리 방법은 크게 세 가지가 있다. 첫 번째 방법은 결측치를 제거하여 연구를 수행하는 것이다. 결측치 제거 방법은 분석에 사용되는 표본의 수가 줄 어들어 통계적 검정력이 감소하게 된다. 또한 연구의 내적 및 외적 타당도가 훼손될 수 있으며, 불완전한 모 수추정 등의 문제가 발생한다. 두 번째 방법은 평균값 이나 중앙값, 최빈값 등으로 대체하는 방법이다. 이러 한 단일값 대체 방법은 손쉽게 완전한 데이터 셋을 구 축할 수 있다는 점에서 좋지만, 대부분의 단일대체 값 은 편향된 추정을 하는 것으로 알려져 있다(Baraldi and Enders, 2010). 또한, 하나의 값으로 대체되기 때 문에 표준오차가 과소 추정되어 통계적 검정력의 관 점에서 문제가 되며 해당 변수의 분산을 작게 하고 다 른 변수와의 상관관계를 낮추는 등 연구결과의 편향 을 가져온다(Ko and Tak, 2016). 결측치를 처리하는 세 번째 방법은 결측치를 예측하여 대체하는 방법이 다.

    한반도 기상은 계절(시간)과 지역(공간)에 따라 큰 편차를 보이는 시공간적 특성을 내포하고 있기 때문 에 관심지역의 기상자료를 예측하기 위해선 통계적 시공간 모형이 필요하다. 시공간 자료 분석의 주된 관 심은 특정 공간에서 어떤 반응 변수와 변화를 시간에 따라 부드럽게 예측하는 것이다. 기상관측소 위치와 주산지 농작물의 재배지의 위치는 상이하므로 통계적 시공간 모형을 이용해 주산지의 기상정보를 예측할 수 있다. 본 연구에서는 베이지안 시공간 모델을 이용 하여 양파주산지인 전라남도에 대한 농업기상정보의 결측치를 보정하는 방법에 대해 알아보고자 한다.

    2 연구 방법

    본 연구에서는 농업기상 데이터의 결측치를 보정 하기 위해 계층적 베이지안 시공간 모델을 이용하였 다. 베이지안 시공간 모델의 식은 공간 선형 모델과 표 현이 유사하다(Yoon and Kim, 2016). 계층적 베이지 안 시공간 모형의 사전분포와 예측방법 및 모델평가 에 대한 상세한 방법론을 이번 장에서 다룬다.

    2.1 베이지안 시공간모형

    베이지안 시공간 모델은 두 단계의 계층 구조로 설 명 된다. 첫 번째 단계는 실제 자료 기반 확률과정(true underlying process)을 나타내고, 두 번째 단계는 시공 간 랜덤 효과(spatio-temporal random effect)를 나타 낸다(Gelfand et al., 2005). 실제 자료 기반 확률과정 에서 장기기간 l (year, l,⋯,r)과 단기기간 t(day, t = 1,⋯ Tl)에 따른 종속변수 Zlt는 관측값 Olt와 오차 항 єlt로 구성된다. 위치 si (i = 1,⋯,n) 와 장·단기 기 간(l , t)에 따른 종속변수를 Zl(si,t) 로 표기하며,

    Z l = ( Z l ( s 1 , t ) , , Z l ( s n , t ) ) , O l t = O ( O l ( s 1 , t ) , , O l ( s n , t ) ) , N = n l = 1 r T l

    이다. N은 관측치들의 총 개수이다. 잡음효과인 너겟 효과(nugget effet)나 순수오차기간(pure error term) 은 l t = ( l ( s 1 , t ) , , l ( s n , t ) ) 이다. σ 2 이 알려지지 않 은 순수오차에 대한 분산이고, In은 n차원 단위행렬일 때, єlt 독립정규분포 N ( 0 , σ 2 I n ) 을 따른다. η l t = ( η l ( s 1 , t ) , , η l ( s n , t ) ) 는 시공간 랜덤효과로 시간에 따른 독립 N ( 0 , η ) 을 가정하고 분산 공분산행렬 ( η ) σ η 2 S η 이다. σ η 2 는 규모모수이고, Sη는 공간 상 관행렬로 다음과 같이 정의되는 지수형 상관함수 (exponential function)으로 얻어진다.

    k ( s i , s j , ϕ ) = exp ( ϕ | s i s j | ) , ϕ > 0

    모수 ϕ는 거리 | s i s j | 에 따라 상관관계의 공간 감 쇠율을 제어한다.(Cressie, 1994).

    2.2 독립 가우시안 회귀모형(Independent Gaussian process model, GP model)

    Zlt는 실제자료의 확률과정이고 Zlt는 시공간적 확 률과정이라 하면 독립 가우시안 회귀모형은 다음과 같이 정의된다.

    Z l t = O l t + l t , O l t = X l t β + η l t

    여기서 єltηlt는 독립이고 n × p 행렬 Xlt는 절 편을 포함한 공변량 p로 구성되어 있다. 즉 β = ( β 0 , β 1 , , β p 1 ) p개의 회귀계수들로 구성된 p × 1 벡터이다. θ = ( β , σ 2 , σ η 2 , ϕ ) 는 GP모델의 모수 의 집합이고, 사전분포 π(θ)를 통해 결측치가 고려된 사후분포를 구할 수 있다. 관측치(z )가 주어졌을 때 결측치(z*)가 고려된 로그우도함수는 다음과 같다.

    log π ( θ , O , z * | z ) N 2 l o g σ 2 1 2 σ 2 l = 1 r t = 1 T l ( Z l t O l t ) ( Z l t O l t ) l = 1 r T l 2 l o g | σ η 2 S η | 1 2 σ η 2 l = 1 r t = 1 T l ( O l t X l t β ) S η 1 ( O l t X l t β ) + log π ( θ )

    모수는 깁스샘플링을 통해 추정된다. 깁스샘플링 (Gelfand and Smith, 1990)은 두 개 이상의 확률변수 의 결합 확률분포로부터 일련의 표본을 생성하는 확 률적 알고리즘으로 모수들의 완전 조건부 분포에 필 요하다(Banerjee et al., 2014). 사후분포의 완전 조건 부 분포는 Bakar and Sahu(2015)를 참고 바란다. 모 수 추정을 위해 본 연구에서는 13,000회의 모의를 실 시하여 이중 초기값에 영향을 받는 번인 구간 (burn-in period) 3,000개를 제거한 10,000개의 표본 을 분석에 사용하였다. β의 완전 조건부 분포는 Δ 1 = l = 1 r t = 1 T l X l t + I p / δ β 2 이고, χ = l = 1 r t = 1 T l X l t η 1 O l t 일 때, π ( β | , z ) N ( Δ χ , Δ ) 에 의해 얻어진다. σ 2 σ η 2 의 조건부분포는 아래와 같다.

    π ( 1 / σ 2 | , z ) G ( 2 N + a , b + 1 2 l = 1 r t = 1 T l ( Z l t O l t ) ( Z l t O l t ) ) , π ( 1 / σ η 2 | , z ) G ( 2 N + a , b + 1 2 l = 1 r t = 1 T l ( O l t X l t β ) ( O l t X l t β ) ) .

    또한, ϕ의 완전 조건부 분포는 아래와 같다.

    π ( ϕ | , z ) π ( ϕ ) × | S η | l = 1 r T i / 2 × exp [ 1 2 σ η 2 l = 1 r t = 1 T l ( O l t X l t β ) S η 1 ( O l t X l t β ) ] .

    2.3 사전분포

    베이지안 모형에서는 적절한 사전 분포의 설정이 중요하다. 모수에 대한 사전정보가 없는 경우 사전분 포는 우도함수에 비해 상대적으로 평평(flat)한 균등 분포를 가정한다. 본 연구에서 β의 사전분포로 정규 분포를, 시공간적 효과의 오차항 σ 2 와 랜덤효과의 오 차항 σ η 2 의 사전분포로 역감마 분포를 고려하였다. 공 간모수 ϕ의 사전분포는 감마분포와 균등분포를 고려 했으나 모수의 trace plot이 수렴하지 않았다. 이에 안 정적인 ϕ값을 찾기 위해 기상청 기상자료로 농촌진흥 청 기상자료를 예측한 값에 대한 RMSE를 최소화 하 는 ϕ를 최적공간모수로 설정하였다.

    2.4 예측 방법

    본 연구에서 종속변수는 일 평균기온이고, 독립변 수는 위도, 경도, 해발고도이다. 위치 s′와 시간 t′에 서 공간 예측은 종속변수 Zl(s′, t′) 에 대한 사후분포 를 통해 진행된다. 종속변수 Zl (s0, t′) 에 대한 사후분 포는 추정된 모수를 적분함으로써 얻어진다.

    π ( Z l ( s , t ) | z ) = π ( Z l ( s , t ) | O l ( s 0 , t ) , σ 2 ) π ( O l ( s , t ) | θ , z ) π ( θ | z ) d O l ( s , t ) d θ d z *

    깁스샘플링을 이용하여 사후분포 π ( θ , z * | z ) 로부터 랜덤샘플 θ(j)을 추출한다. 베이지안 크리깅을 적용하 여 O l ( s 1 , t ) , , O l ( s n , t ) 가 주어진 Ol(s′, t′) 의 조건 부 분포에서 샘플 O l ( j ) ( s , t ) 을 얻는다. 베이지안 크 리깅은 관심 있는 위치의 특성치를 알기 위해 이미 알 고 있는 주위의 값들의 선형 조합으로 그 값을 예측하 는 지구 통계학적 기법이다. 깁스샘플링의 마지막 단 계에서 결측값 Z l ( j ) ( s , t ) , j = 1 , , J 을 예측한다. 깁 스샘플링 예측값은 95% 신용구간(Credible Interval) 과 중앙값 및 평균을 사용하여 요약한다(Bakar and Sahu, 2015).

    2.5 평가방법

    모형 평가 척도로 평균제곱근편차(RMSE), 평균절 대오차(MAE), 평균절대비율오차(MAPE), 편향(BIAS) 을 이용하였다. 평가방법의 값이 작을수록 예측정확 도가 높음을 나타낸다.

    R M S E = 1 n i = 1 n ( y ^ i y i ) 2 , M A E = 1 n i = 1 n ( y ^ i y i ) 2 , M A P E = 1 n i = 1 n | ( y ^ i y i ) / y i | , B I A S = ( y ^ i y i )

    여기서 n은 전체 관측치의 수이고, yii번째 관측 값이며, y ^ i i번째 예측값을 나타낸다.

    3 연구 자료 및 지역 특성

    양파는 월동작물로 주산지가 전라남도, 경상남도, 경상북도로 남부지방에 집중율이 높다(Lee and Lee, 1995). 특히 전라남도가 2003년 이후 양파 재배면적 의 50% 이상을 차지하고 있다(Yoon et al., 2014). 양 파는 온대지방에서 잘 자라는데, 전라남도가 겨울철 (12~2월) 일평균기온이 0℃ 이상이고, 여름철(7~8월) 일평균 기온이 25℃ 정도인 온대지방이기 때문이다 (Yoon et al., 2014).

    연구를 위해 양파의 주재배지인 전라남도에 설치 운영 중인 기상관측자료를 이용하였다. 기상청은 95 개의 자동기상관측소(AWS, ASOS)를 운영하고 있고 농촌진흥청은 25개소의 농업 기상관측소를 운영하고 있다. 분석을 위해 수집된 자료의 기간은 2013년 1월 1일부터 2016년 12월 31일까지이다. 수집된 관측소 의 위치는 Fig. 1.이다. 파란색으로 표시된 곳은 기상 청의 기상관측소이며 빨간색으로 표시된 곳은 농촌진 흥청의 기상관측소이다.

    농업기상 정보를 분석한 결과 일시적인 기계결함 이나 통신 장애로 인한 결측치가 포함되어 있다. 관측 치는 365일*4년 동안 25개 기상관측소로부터 총 36,500개이며, 이 중 결측값이 3,639개로 나타났다. 전체 데이터에 대한 결측률은 9.97%이다(Table 1).

    4 자료 분석

    결측치는 자료가 수집되지 않아 실제값을 확인하 기 어렵다. 이에 본 연구에서는 기상청에서 운영하는 기상자료로 농업기상관측소의 기상정보를 예측하였 다. 농업기상관측소는 관측된 기상정보가 있으므로 예측값과 관측값 사이의 차이를 통해 베이지안 시공 간모형이 결측치 보정에 적절한지 평가할 수 있다. 본 연구에서는 베이지안 시공간모형에서 고려된 공변량 으로 위도, 경도(위도+경도) 그리고 위도, 경도, 해발 고도(위도+경도+고도)가 고려된 2개의 모형을 고려 하였다.

    베이지안 시공간모형의 모수추정을 위한 사전분포 에 따른 모수들의 trace plot은 Fig. 2~Fig. 3이다. Fig. 2와 Fig. 3에는 각 모델에 대한 독립변수와 시공간효 과의 표준편차 σ 2 와 통계적 랜덤효과 σ η 2 , 그리고 공간 모수 ϕ에 대한 trace plot이다. 분석결과 공간을 표현 하는 모수 ϕ는 값이 수렴하지 않은 문제점이 있다.

    베이지안 시공간 모형에서 공간모수 ϕ는 다른 모 수들의 추정치에 영향을 미친다. Trace plot에서 확인 되듯이 ϕ가 수렴되지 않으므로 ϕ를 어떻게 추정할지 에 관한 문제가 발생한다. 본 연구에서는 ϕ값을 0.01 에서 0.05까지 0.001씩 증가시키며 농업기상정보의 관측값과 예측값의 RMSE를 계산하였다. RMSE는 평균 제곱근 편차로 예측값과 관찰값의 차이를 다룰 때 쓰는 측도로 값이 낮을수록 좋다. 그 결과 위도+경 도 모형에서는 ϕ가 0.041일 때, 위도+경도+고도 모형 에서는 ϕ가 0.039 일 때 RMSE 값이 가장 낮았다(Fig. 4, Fig. 5).

    가장 낮은 RMSE를 공간모수 ϕ의 추정치로 사용 하여 trace plot을 그리면 Fig. 6과 Fig. 7이다. 공간모수 ϕ가 고정되었을 때, 다른 모수들의 trace plot의 연쇄 는 Fig. 2와 Fig. 3과 달리 임의적으로 변동하며 정규 분포에 근사하므로 수렴한다고 보인다.

    최적 공간모수로 고정하여, 각 모델의 모수를 추정 하면 Table 2와 Table 3이다. 시공간모형이므로 공간 성이 반영되어 관측소 인근지역은 관측소에서 관측된 값과 유사한 값을 보인다. Table 2의 위도와 경도만 고 려된 베이지안 시공간모형의 모수추정 결과를 살펴보 면, 랜덤효과인 σ 2 는 0.035이고 시공간효과인 σ η 2 은 13.515이다. 시공간효과의 분산이 랜덤효과 보다 크 므로 시공간 모형에 의해 자료가 잘 설명되고 있다. 공 간적 상관성인 ϕ는 0.041로 0에 가까우므로 공간적 상관성은 높다. 위도와 경도의 추정된 계수를 통해 관 측소에서 멀리 떨어질수록 위도 1도 증가하면 일 평균 기온이 2.2도 감소하고 경도가 1도 증가하면 일 평균 기온이 0.067씩 증가한다.

    위도와 경도 외에 해발고도까지 고려된 모형에서 추정된 모수는 Table 3이다. 위도와 경도만 고려된 모 형과 마찬가지로 랜덤효과 ( σ 2 =0.031)가 시공간효과 ( σ η 2 =12.047)보다 작으므로 시공간모형의 의미가 있 었다. 95% 신용구간을 통해 위도, 경도 그리고 고도 모두 통계적으로 유의미한 결과가 얻어졌다.

    기상청에서 얻은 일 평균기온으로 농업기상관측소 의 일 평균기온을 예측하여 베이지안 시공간 모형의 예측성능을 평가한 결과는 Table 4이다. 고도가 높아 질수록 온도가 내려가는 물리적 특성 때문에 고도를 고려한 모델이 예측성능이 더 좋을 것으로 기대했으 나, 위도와 경도만 고려한 모델이 RMSE, MAE, MAPE 기준으로 좋았다.

    기온의 공간적 분포는 계절에 영향을 받을 수 있다. 계절효과를 살펴보기 위해 최적 모형인 위도와 경도 모형의 계절별 예측성능을 살펴보면 Table 5이다. 전 체 모델의 RMSE가 1.184와 비교하면 가을이 봄, 여 름, 겨울에 비해 베이지안 시공간모형의 예측성능이 부족하였다. RMSE, MAE, MAPE, BIAS를 종합하면 여름철 일평균 자료가 베이지안 시공간 모형으로 가 장 잘 설명된다.

    계절 외에 베이지안 시공간 모형의 예측성능을 공 간적으로 살펴보기 위한 지역별 RMSE 결과는 Table 6이다. 보성군에 위치한 지역의 계절별 RMSE 평균이 1.7이상으로 다른 지역에 비해 예측정확도가 가장 낮았다. 이외에 베이지안 시공간모형으로 일 평균기 온이 잘 설명되지 않은 지역은 여수(1.39), 구례(1.27), 무안(1.25) 순이다.

    Table 6의 결과를 공간적으로 살피면 Fig. 8이다. 보성군은 주변 지역보다 표고가 높아 일교차가 크며 해양성 기후의 영향을 받아 기후 변화가 다른 지역에 비해 상대적으로 높다. 무안군도 해안지역으로 해양 성 기후의 영향을 받는다. 지역적 기후 특성이 강한 지 역은 베이지안 시공간 모형으로 예측하는데 어려움이 있다는 사실을 알 수 있다. 예측정확도가 높은 지역은 고흥군 풍양면, 장흥군 장흥읍, 나주시 금천면, 해남군 삼산면 순으로 기상청 기상관측소와의 거리는 5.91 km, 2.16 km, 0.38 km, 2.96 km 순이다. 즉, 베이지안 시공 간모형의 특성상 기상관측소와 농업기상관측소 간 거 리가 멀지않으면 예측 정확도가 높았다.

    마지막으로 기상청과 농업기상관측소에서 얻어진 모든 일평균자료를 활용한 베이지안 시공간모형으로 전라남도 보성군 웅치면의 일 평균기온의 결측치를 보정하였다(Table 7).

    5 결 론

    기상은 시공간적 특성을 내포하고 있어 계절(시간) 과 지역(공간)에 따라 큰 편차를 보인다. 기존의 연구는 기상자료의 결측치 보정을 위해 평균치와 조건부 기 대값을 최대화시키는 값을 이용하였다. 본 연구에서 는 기상자료의 시공간적 특성을 반영한 베이지안 시 공간 모형을 이용하여 결측치를 보정하는 방법을 다 루었다. 최적 시공간모형을 선정하기 위해 기상청 기 상관측소에서 관측된 일평균기온으로 농업기상관측 소의 일평균기온을 예측하여 RMSE, MAE, MAPE와 BIAS로 평가하였다. 이 후에는 기상청과 농업기상관 측소에서 관측된 모든 일평균자료로 베이지안 시공간 모형을 세워 농업기상관측소의 결측치를 보정하였다.

    베이지안 시공간모형을 세우기 위해선 사전분포가 중요하다. 사전분포 중 공간모수 ϕ의 trace plot이 수 렴하지 못하는 문제점이 제기되었다. RMSE를 기준 으로 ϕ를 조금씩 증가시켜 최적 공간모수 값을 추정 하여 베이지안 시공간모형을 세웠다. 분석결과 시공 간효과 모수가 랜덤효과 모수보다 크므로 시공간모형 으로 연구 자료를 잘 설명됨을 확인하였다. 하지만 지 형의 특성이 강해 날씨의 변화가 심한 지역은 시공간 모형으로 잘 설명되지 못한다는 한계점도 존재한다.

    본 연구는 기상의 시공간적 특성을 반영한 베이지 안 시공간 모형으로 농업기상 결측치를 보정해보자는 방법론적인 논지에서 시작 된 연구이다. 따라서 평균 치 보정, EM 알고리즘을 이용한 보정 등의 다른 결측 치 보정 방법과 결과를 비교분석은 수행되지 않았다. 또한 위도, 경도 그리고 해발고도외에 일평균기온에 영향을 미치는 외부 요인을 반영하지 못한 한계점이 존재한다. 따라서 향후 선행 결측치 보정 방법과의 비 교분석과 농업기상을 위한 중요 요인을 파악하기 위 한 추가 연구가 필요하다.

    Figure

    JESI-27-499_F1.gif

    Weather stations(KMA, RDA).

    JESI-27-499_F2.gif

    Trace plot about parameters of prior distribution in lon+lat model.

    JESI-27-499_F3.gif

    Trace plot about parameters of prior distribution in lon+lat+alt model.

    JESI-27-499_F4.gif

    Select optimal spatial decay ϕ (lon+lat model).

    JESI-27-499_F5.gif

    Select optimal spatial decay ϕ (lon+lat+alt model).

    JESI-27-499_F6.gif

    trace plot of lon+lat model(ϕ=0.041).

    JESI-27-499_F7.gif

    trace plot of lon+lat+alt model(ϕ=0.039).

    JESI-27-499_F8.gif

    Map of RMSE by stations.

    Table

    Missing value status

    Estimated parameter (lon+alt model)

    Estimated parameter (lon+alt+alt model)

    The result of evaluation

    The result of evaluation by season

    RMSE by station and month

    The examples of replacement missing values

    Reference

    1. K.S. Bakar , S.K. Sahu (2015) spTimer: Spatio-temporal Bayesian modelling using R., J. Stat. Softw., Vol.63 ; pp.1-32
    2. S. Banerjee , B.P. Carlin , A.E. Gelfand (2014) Hierarchical modeling and analysis for spatial data., Crc Press,
    3. A.N. Baraldi , C.K. Enders (2010) An Introduction to modern missing data analyses., J. Sch. Psychol., Vol.48 (1) ; pp.5-37
    4. N. Cressie (1994) An Approach to statistical spatial -temporal modeling of meteorological elds., J. Am. Stat. Assoc., Vol.89 ; pp.379-382
    5. A.E. Gelfand , S. Banerjee , D. Gamerman (2005) Spatial process modeling for univariate and multivariate dynamic spatial data., Environmetrics, Vol.16 ; pp.465-479
    6. A.E. Gelfand , A.F.M. Smith (1990) Sampling-based approaches to calculating marginal densities., J. Am. Stat. Assoc., Vol.85 ; pp.398-409
    7. H.I. Jang , H.H. Seo , S.J. Park (2002) Strategy for fruit cultivation research under the changing climate., Weonye Gwahag Gisulji, Vol.20 ; pp.270-275
    8. K. Ko , H. Tak (2016) The treatment of missing values using the integrated multiple imputation and callback method., Korean J. Policy Stud., Vol.54 (4) ; pp.291-319
    9. B.L. Lee (2000) Prospects on agrometeorological information for agricultural applications., Korean J. Agric. For. Meteorol., Vol.2 (1) ; pp.24-30
    10. H.J. Lee , H.S. Han , S.U. Chon , D.K. Kim , H. Kwon , K. Lee (2014) Physiological characteristics and yield of onion affected by rapid temperature changes., Korean J. Environ Agric, Vol.33 (4) ; pp.364-371
    11. J. Lee , Y. Lee (1995) Determinant Factors of Planted Area and Crop Situation of Red Pepper, Garlic, and Onions, Korea Rural Econ., INST,
    12. K.K. Lee , K.K. Ko , J.W. Lee (2012) Correlation analysis between meteorological factors and cropproducts., J. Environ. Sci. Int., Vol.21 (4) ; pp.461-470
    13. S. Lee , D. Kim (2010) The comparison of imputation methods in space time series data with missing values., Commun. Stat. Appl. Methods, Vol.17 ; pp.263-273
    14. J.S. Min , M.H. Lee , J.B. Jee , M. Jang (2016) A Study of the method for estimating the missing data fromweather measurement instruments., J. Digital Convergence, Vol.14 ; pp.245-252
    15. D.K. Yoon , S.Y. Oh , K.W. Nam , K.C. Eom , P.K. Jung (2014) Changes of cultivation areas and major disease for spicy vegetables by the change of meteorological factors., J. Climate Change Res, Vol.5 (1) ; pp.47-59
    16. S. Yoon , M. Kim (2016) Spatio-temporal models for generating a map of high resolution NO2 level., J.Korea Data Info. Sci, Vol.27 (3) ; pp.803-814