Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-4517(Print)
ISSN : 2287-3503(Online)
Journal of Environmental Science International Vol.26 No.9 pp.1073-1080
DOI : https://doi.org/10.5322/JESI.2017.26.9.1073

Method for Evaluating Optimal Air Monitoring Sites for SO2 in Ulsan

Junghyun Lim, Sanghoo Yoon1)*
Department of Statistics, Daegu University, Gyeongsan 38453, Korea
1)Department of Computer Science and Statistics, Daegu University, Gyeongsan 38453, Korea
Corresponding author: Sanghoo Yoon, Department of Computer Science and Statistics, Daegu University, Gyeongsan 38453, Korea +82-53-850-6421statstar@daegu.ac.kr
20170630 20170809 20170906

Abstract

Manufacturing and technology industries produce large amounts of air pollutants. Ulsan Metropolitan City, South Korea, is well-known for its large industrial complexes; in particular, the concentration of SO2 here is the highest in the country. We assessed SO2 monitoring sites based on conditional and joint entropy, because this is a common method for determining an optimal air monitoring network. Monthly SO2 concentrations from 12 air monitoring sites were collected, and the distribution of spatial locations was determined by kriging. Mean absolute error, Root Mean Squared Error (RMSE), bias and correlation coefficients were employed to evaluate the considered algorithms. An optimal air monitoring network for Ulsan was suggested based on the improvement of RMSE.


울산광역시 아황산가스(SO2)의 최적관측소 평가방법

임 정현, 윤 상후1)*
대구대학교 통계학과
1)대구대학교 전산통계학과
    Ministry of Education
    2017R1C1B1003273

    1.서 론

    대기오염 관측소는 기후변화의 실태를 감시하기 위해 상공의 오존(O3), 아황산가스(SO2), 이산화질소 (NO), 일산화탄소(CO) 등의 대기오염 물질 농도를 수 집한다(NIER, 2016). 우리나라는 1980년부터 대기오 염 관측소를 설치하여 운영 중이고, 2000년 이후에는 기준물질 외에 대기 환경에 중요한 물질을 측정하는 관측소를 추가 운영하고 있다. 대기오염 물질 중 SO2 는 석유, 석탄 등의 연류가 연소될 때 주로 배출되며, 주요 배출원은 발전소, 금속 제련공장, 정유공장 및 기 타 산업공정 등에서 발생한다.

    울산광역시는 1970년대 이후 대규모 산업단지가 형성된 산업도시로 대기오염현상에 민감하다(Baek, 2009; Oh et al., 2016). 울산광역시의 SO2 농도는 전 국 평균농도에 비해 상대적으로 높아 시민들은 SO2에 따른 건강에 대한 우려를 가지고 있다(Lee et al., 2011).

    대기오염 물질의 관측 정확도는 관측소의 위치나 수로 결정된다. 관측소를 조밀하게 구성한다면 정확 도는 향상되지만 비용이 상승하므로 비용과 정확도를 모두 고려한 관측소의 최적 선정이 필요하다. 관측소 의 최적 선정 방법이란 관측 정확도를 높이면서도 비 용을 최소화하는 것이다(Lee and Shu, 2003). 관측소 의 최적 선정을 위해선 설치된 관측소의 평가가 필요 하다(Jung, 2000). 관측소의 평가를 통해 중복 관측 여 부를 확인할 수 있다. 또한 효율성이 저조한 관측소는 관측을 중단하거나 위치를 옮겨 전반적인 효율성을 높일 수 있다.

    관측소의 평가는 엔트로피를 기반으로 이루어지며 수문학에서 시작되었다. 엔트로피는 관측된 자료를 토대로 이미 구축되어 있는 측정소를 평가한다 (Chung, 2009). 엔트로피를 통한 관측소 평가의 선행 연구로 Chapman(1986)는 수문 모델을 비교하였고, Al-Zahrani and Husain(1988)은 수문 네트워크의 최 적의 수를 결정하였다. Fiorentiono et al.(1992)은 이 탈리아 하천유역의 특성을 규명하였으며 Yoo and Jung(2002)는 충주댐 유역의 강우관측소를 혼합 분포 와 엔트로피로 제안하였다. Lee et al.(2013)은 엔트로 피 외에 공간분포를 고려한 유전자 알고리즘으로 최 적 강우관측소를 제안하였다.

    미관측 지점의 값을 예측하는 지구 통계학적 방법 인 크리깅(Kriging)은 관측소의 위치 평가에 필요하 다. 크리깅은 관측자료를 이용하여 공간 내삽을 통해 미관측 지점을 예측하기 위해 다양한 변수를 통합할 뿐만 아니라 공간적 불확실성을 평가할 수 있는 장점 이 있다(Goovaerts, 1993; Kyriakidis et al., 2004; Park, 2010). Lee et al.(2002)는 강우관측소 최적 설계 를 위해 면적강우량의 추정오차 최소화에 크리깅을 이용하였고, Lee and Shu(2003)은 섬진강댐 유역의 강우관측소 개량을 위해 평균 강우량이 최소가 되도 록 크리깅을 이용하였다. Yeh et al.(2011)은 크리깅을 이용하여 강우량을 예측하고 강우 분포의 불확실성은 엔트로피로 계산하였다.

    본 연구에서는 엔트로피와 크리깅을 통해 울산광 역시에서 운영 중인 대기오염 물질 중 SO2 농도를 관 측하는 최적 위치를 평가하고자 한다. 최적 관측소의 평가를 위해 SO2 농도의 관측값과 예측값의 사이의 편차(Bias), 평균절대오차(MAE: Mean Absolute Error), 평균제곱근오차(RMSE: Root Mean Squared Error), 그리고 상관계수(Corr: Correlation coefficient) 가 고려되었다.

    2.연구 방법

    2.1.엔트로피

    엔트로피는 정보 전달의 효율성을 수치화한 값으 로 불확실성이 높을수록 정보의 양이 많아져 값이 커 진다. 일반적으로 엔트로피는 불확실성 혹은 무질서 도로 알려져 있다. 엔트로피는 사용목적에 따라 한계 엔트로피, 조건 엔트로피, 결합 엔트로피로 구분된다. 경험적 확률분포의 불확실성 정도를 측정하는 엔트로 피는 다음과 같이 정의된다(Shannon, 1948).

    H ( X ) = n = 1 N p ( x n ) ln  p ( x n ) , n = 1 , 2 , 3 , , N

    여기서 p(xn) 은 xn의 경험적 확률이고 H (X)는 한계 엔트로피로 X 가 내재하고 있는 불확실성을 의 미한다. nX 의 계급구간의 수를 의미한다.

    임의의 변수 XY 가 있다면 조건부 확률과 결합 확률을 통해 조건 엔트로피와 결합 엔트로피가 계산 된다. XY 의 조건 엔트로피는 Y 를 통한 X 의 엔트 로피 합의 손실 정도를 의미하며 다음과 같이 계산된 다(Yang and Burn, 1994).

    H ( X | Y ) = n = 1 N n = 1 N p ( x n , y m ) ln  p ( x n | y m )

    여기서 n, mX, Y 의 계급구간의 수, p(xn, ym) 은 XY 의 결합 확률, p ( x n | y m ) XY 의 조건부 확률이다. 결합 엔트로피는 XY 의 결합 확률로 다 음과 같다.

    H ( X | Y ) = n = 1 N m = 1 N p ( x n , y m ) ln  p ( x n , y m )
    (3)

    2.2.크리깅

    크리깅은 주로 광물자원 매장량, 지역 지하수위, 대 기물질 농도 등을 예측하기 위해 사용되는 지구통계 모형이다. 크리깅은 미관측 지점과 주변 관측지점의 거리에 따른 상관관계를 가중치의 선형결합으로 미관 측 지점의 값을 예측한다. 모형의 평균(μ)는 사전에 알 수 없고 일정하다는 가정하에 위치정보(s )에 따른 식은 다음과 같다.

    Z ( s ) = μ + δ ( s )

    미관측 지점(s0 )의 예측치는 관측값의 가중치(λ)에 의해 다음과 같이 계산된다.

    Z ^ ( s 0 ) = i = 1 n λ i Z ( s i )

    여기서 Z ^ ( s 0 ) 는 크리깅 추정량, Z(si)는 관측 데이 터, λiZ(si) 의 가중치이며 추정치가 불편 (unbiased)이고 추정 분산(estimation variance)이 최 소가 되도록 결정되어야 한다. 또한 λi는 비편향 추정 량을 사용하여 Z ( s ) Z ^ ( s 0 ) 의 오차를 최소화 되도록 한다.

    E ( Z ^ ( s 0 ) ) = E ( Z ( s 0 ) ) min { E ( Z ^ ( s 0 ) Z ( s 0 ) ) 2 = V a r [ Z ( s 0 ) Z ^ ( s 0 ) ] }

    예측값 Z ^ ( s 0 ) 는 최소의 평균제곱오차를 가지며 식 (7)의 방정식은 라그랑주 승수법(lagrange multipliers) 을 이용하면 식(8)이다.

    L = V a r [ Z ^ ( s 0 ) Z ( s 0 ) ] 2 u ( i = 1 n λ i 1 )

    여기서 i = 1 n λ i = 1 은 불편성을 만족한다.

    2.3.최적관측소 선정방법

    최적 관측소는 관측자료의 불확실성인 엔트로피로 평가하였다. 결합 엔트로피는 관측소의 조합으로 계 산되므로 관측소의 수가 증가한다면 모든 조합의 경 우의 수가 증가하여 계산 시간이 오래 걸리는 단점이 있다. 따라서 결합 엔트로피는 관측소의 수가 비교적 적을 때 평가할 수 있는 방법이다(Joo, 2012). 조건 엔 트로피는 조건부 확률을 통해 순차적으로 관측소를 선정할 수 있어 관측소의 수가 많더라도 상대적으로 빠르게 최적 조합을 구할 수 있다. 하지만 엔트로피는 관측소의 공간을 고려하지 못하는 단점이 있다. 이에 본 연구에서는 잭나이프를 이용한 크리깅으로 예측 오차를 생성하여 그 값의 불확실성을 엔트로피로 계 산하였다. 본 연구에서 고려한 연구방법을 도식화하 면 Fig. 1이다. 알고리즘 1은 엔트로피만 고려하였고, 알고리즘 2는 크리깅과 엔트로피가 모두 고려되었다.

    최적관측소 수를 결정방법으로 Al-Zahrani and Husain(1998)은 결합 엔트로피의 합이 최대가 되는 지점을 제시하였다. 본 연구에서는 최적 관측소 평가 를 위해 결합 엔트로피 외에 조건 엔트로피를 고려하 였으므로 기존 방법을 적용하는데 한계점이 있다. 이에 본 연구에서는 최적 관측소로 선정된 관측소의 SO2 농도로 선정되지 않은 관측소의 SO2 농도를 예 측하면서 발생되는 예측 오차의 MAE, RMSE, Bias, Corr를 이용하였다.

    M A E = 1 n i = 1 n [ | z ( x i ) z ^ ( x i ) | ] SE = 1 n i = 1 n [ z ( x i ) z ^ ( x i ) ] 2 B i a s = 1 n i = 1 n ( z ( x i ) z ^ ( x i ) ) C o r r = i = 1 n ( z ( x i ) z ( x ¯ ) ) ( z ^ ( x i ) z ^ ( x ¯ ) ) i = 1 n ( z ( x i ) z ( x ¯ ) ) 2 ( z ^ ( x i ) z ^ ( x ¯ ) ) 2

    여기서 z ^ ( x i ) 는 임의의 위치 xi지점에서의 예측값, z (xi) 는 실제 관찰값, n은 자료 개수를 의미한다. 추 가적으로 관측소 수가 증가할수록 예측오차가 줄어들 므로 관측소 증가에 따른 향상 정도를 다음식과 같이 정량화하여 최적 관측소의 수를 결정하였다.

    R M S E Im p = R M S E i R M S E i + 1 R M S E i

    3.연구 자료

    에어코리아에서 제공하는 공공데이터를 이용하여 2001년부터 2014년까지 울산광역시 대기관측소의 SO2농도를 수집하였다. 에어코리아에서 일 단위로 제 공되는 SO2농도를 월 단위로 종합하여 최적 관측소를 평가하였다. 2001년부터 울산광역시에 설치된 대기 오염 관측소는 총 15개소이다. 10년 이상 꾸준히 관측 된 자료를 분석하기 위해 최근에 설치된 효문동(2006 년), 삼남면(2013년)의 관측소와 2004년에 운행 중지 된 원산리에 위치한 관측소는 분석에서 제외했다. 반 면 농소동은 2003년부터 2014년까지 11년간 관측된 SO2 농도를 고려하였다. 최종 선정된 12개의 대기관 측소 위치는 Fig. 2이다.

    관측된 SO2농도의 관측소별 분포 특성은 Table 1 과 Fig. 3이다. 부곡동(Bugok), 여천동(Yeocheon), 화산리(Hwasan)는 다른 지역에 비해 SO2 농도가 상 대적으로 높았다. 부곡동은 화학 단지가 조성되어 있 고, 여천동은 산업 단지 그리고 화산리는 온산국가산 업단지가 형성되어 있어 공장에서 배출되는 대기오염 물질 때문에 SO2농도가 상대적으로 높다고 볼 수 있 다. 이외 지역은 표준편차가 상대적으로 작으므로 SO2 가 일정하게 배출되는 것으로 판단된다.

    4.최적관측소 평가방법

    4.1.엔트로피기반 최적관측소 선정결과

    엔트로피와 크리깅을 통한 예측 오차의 엔트로피 에 따른 최적 관측소 조합은 Table 2와 Table 3이다. 관측자료의 엔트로피를 기준으로 한계 엔트로피를 계 산하면 무거동(Mugeo)이 가장 높으므로 울산을 대표 하는 관측소는 무거동이다. 무거동을 중심으로 조건 엔트로피를 계산하여 순차적으로 추가하면 대송동, 농소리(Nongso), 삼산동(Samsan), 덕신리(Deoksin), 화산리(Hwasan), 부곡동(Bugok), 여천동(Yeocheon), 신정동(Sinjeong), 성남동(Seongnam), 야음동(Yaeum), 상남리(Sangnam) 순이다. 결합 엔트로피는 관측소의 수를 결정하고 관측소의 수의 모든 조합을 계산하여 그중 가장 결합 엔트로피가 높은 관측소를 선정한다. 이 때문에 결합 엔트로피와 조건 엔트로피에 따른 최 적 관측소의 차이를 보인다. 공간적 분포를 고려한 엔 트로피는 결합 엔트로피의 순서는 유사하나 조건 엔 트로피의 순서는 많은 차이를 보인다.

    4.2.최적관측소 평가

    선정된 관측소를 모델링 자료로 사용하여 선정되 지 않은 관측소의 SO2농도를 예측하였다. 선정되지 않은 관측소의 관측값을 참값으로 간주하면 관측값과 예측값의 차이를 통해 선정된 관측소를 평가할 수 있 다. 본 연구에서 고려된 4가지 알고리즘에 대한 MAE, RMSE, Bias, Corr는 Fig. 4이다. MAE와 RMSE를 기준으로 보면 결합 엔트로피만으로 관측소를 선정하 는 알고리즘이 관측소의 수가 5보다 적거나 같을 때 우 수하였고, 조건 엔트로피 기반의 알고리즘은 관측소의 수가 6보다 크거나 같을 때 적절하였다. 크리깅을 통 해 공간성을 고려한 엔트로피는 기대했던 것보다 좋 은 성능을 보이지 않았다. Corr는 0과 1사잇값을 가지 며 1에 가까울수록 선형성이 좋다. Corr를 기준으로 선정된 관측소의 수가 6 이상인 알고리즘 A의 상관계 수가 0.5로 가장 우수하다.

    4.3.최적관측소의 수 결정

    대기오염 관측소는 Fig. 4에서 보여주듯이 관측소 의 수가 증가할수록 RMSE, MAE가 감소하고 Corr가 증가하므로 울산광역시에 설치된 12개의 대기오염 관 측소를 모두 운영하는데 좋다. 대기오염 관측소를 처 음 설치했을 때에는 대기오염 물질의 패턴을 알 수 없 으므로 인구밀도와 일정 단위 면적의 격자를 기준으 로 설치하였다(NIER, 2016). 본 연구에서는 10년 이 상 대기오염 관측소를 운영하면서 축척된 대기오염 물질의 통계학적 특성을 반영한 대기오염 관측소 평 가 방법을 제시하였다. 본 연구에서는 만약 기존에 설 치된 대기오염 관측소를 재배치하거나 축소 운영했을 때 적절한 최적관측소를 다루고자 한다.

    본 연구에서 고려된 4개의 알고리즘의 최적 관측소 의 수를 결정하기 위해 RMSE 향상도를 계산하였다 (Fig. 5). 알고리즘 A는 관측소의 수가 5까지 큰 향상 도가 없지만 6일 때 높은 향상도를 보이며 서서히 향 상도가 감소한다. 알고리즘 B는 관측소의 수가 4, 7, 10일 때 높은 향상도를 보인다. 알고리즘 C는 알고리 즘 A와 유사하나 관측소의 수가 7일 될 때까지 꾸준 히 증가하다 8일 때 감소하고 다시 관측소의 수가 10 일 될 때까지 증가하는 경향을 보인다. 알고리즘 D는 관측소의 수가 4, 8, 10일 때 높은 향상도를 보인다. Fig. 4에서 RMSE가 가장 낮은 알고리즘이 A이므로 알고리즘 A의 향상도를 기준으로 관측소의 수를 결정 하면 최적 관측소의 수는 6이다.

    최종적으로 알고리즘 A에 의해 선정된 울산광역시 의 최적 관측소 6개의 위치는 Fig. 6이다. 선정된 6개 의 관측소는 무거동, 대송동, 농소동, 삼산동, 덕신리, 화산리이다. 최적 관측소 위치의 분포를 살펴보면 주 요 화학 단지, 도심, 외각 지역에 고루 분산되어 있다.

    5.결 론

    최적 관측소를 평가하기 위한 연구는 수문학에서 많이 연구되었지만 아직 대기오염 관측소를 대상으로 한 연구는 수행되지 않았다. 본 연구는 엔트로피를 기 반으로 대기오염 관측소 위치의 적절성을 평가하였 다. 또한, 관측소의 공간적 특성을 반영하기 위해 크리 깅을 반영한 엔트로피도 고려하여 관측소를 평가하였 다. 울산광역시에서 운영 중인 12개의 대기오염 관측 소를 평가한 결과 최적 대기오염 관측소는 6곳으로 무거동, 대송동, 농소동, 삼산동, 덕신리, 화산리이다. 만약 격자단위의 기상정보와 대기오염 정보가 동적 모형이나 통계적 모형으로 생산된다면 선정된 6개의 관측소를 기반으로 최적 관측소를 추가로 선정할 수 있다.

    대기오염 관측소에서 관측되고 있는 대기오염 물 질은 SO2외에도 오존(O3), 이산화질소(NO2), 일산화 탄소(CO) 등이 있다. 본 연구에서는 SO2 농도만으로 울산광역시의 최적 대기오염 관측소를 평가하였으나, 향후에는 5개의 주요 대기오염 물질을 모두 고려할 수 있는 다변량 모형이 필요하다. 또한 대기오염 물질의 시간적 공간적 추세성을 반영한 모형을 기반으로 불 확실성을 계산한다면 기후변화를 반영한 최적 관측소 평가에 유리할 것으로 판단된다.

    감사의 글

    이 논문은 2017년도 정부(교육부)의 재원으로 한국 연구재단의 지원을 받아 수행된 기초연구사업(No. NRF-2017R1C1B1003273)에 의해 이루어졌습니다.

    Figure

    JESI-26-1073_F1.gif

    Optimal network evaluation method using two algorithms.

    JESI-26-1073_F2.gif

    The location of air monitoring sites.

    JESI-26-1073_F3.gif

    The boxplot of SO2 concentration level.

    JESI-26-1073_F4.gif

    Comparison of prediction performance according to selected combinations.

    JESI-26-1073_F5.gif

    The result of RMSE improvement.

    JESI-26-1073_F6.gif

    The suggested air monitoring sites.

    Table

    The summary of air monitoring sites

    The optimal combinations based on entropy theory

    The optimal combinations based on entropy after Kriging

    Reference

    1. Al-Zahrani M , Husain T (1998) An Algorithm for designing a precipitation network in the south-western region of Saudi Arabia , J. Hydrol, Vol.205 (3-4) ; pp.205-216
    2. Baek H S (2009) Survey on air pollution of Ulsan, Master's Dissertation, Ulsan University,
    3. Chapman T G (1986) Entropy as a measure of hydrologic data uncertainty and model performance , J. Hydrol, Vol.85 (1-2) ; pp.111-126
    4. Chung G H , Chang D E , Yoo D G , Jun H D , Kim J H (2009) Determination of optimal pressure monitoring locations for water distribution systems using entropy theory , J. KWRA, Vol.42 (7) ; pp.537-546
    5. Singh V P , Fiorentino M , Fiorentino M , Claps P (1992) On what can be explained by the entropy of a channel network Entropy and Energy Dissipation in Water Resources , WSTL 9 Springer Dordrecht, ; pp.139-154
    6. Goovaerts P (1993) Spatial orthogonality of the principal components computed from coregionalized variables , Math Geol, Vol.25 (3) ; pp.281-302
    7. Joo H J (2012) A Study on optimization of stage gauge network considering hydrologic similarity and classed by observation importance, Master's Dissertation, Inha university,
    8. Jung K R (2000) A Study on optimization of air pollution monitoring system in Ulsan area, Master's Dissertation, Ulsan University,
    9. Kyriakidis P C , Miller N L , Kim J (2004) A Spatial time series framework for simulating daily precipitationat regional scales , J. Hydrol, Vol.297 (1) ; pp.236-255
    10. Lee J H , Shu S W (2003) The improvement of the rainfall network over the Seomjinkang dam basin , J. KWRA, Vol.36 (2) ; pp.143-152
    11. Lee J H , Song Y H , Hong S H , Kim D H , Lee S H , Park M J (2013) Evaluation of water quality monitoring network in Geum river system using entropy theory , J. KOSHAM, Vol.13 (6) ; pp.447-453
    12. Lee J H , Yoo Y G , Jung J S (2002) An Improved study on optimal design method of rainfall network , J. KSCE, Vol.22 (5B) ; pp.671-677
    13. Lee Y S , Choi S D , Kwon H O , Kim C S , Son H S , Ye J (2011) Temporal and spatial distribution of sulfur dioxide in Ulsan , Korea. J. Korean Soc. Environ, Vol.14 (4) ; pp.249-256
    14. (2016) Air pollution monitoring network operation plan in 2016, http://library.nier.go.kr
    15. Oh I B , Bang J H , Kim S T , Kim E H , Hwang M K , Kim Y H (2016) Spatial distribution of airpollution in the Ulsan metropolitan region , J. KOSAE, Vol.32 (4) ; pp.394-407
    16. Park N W (2010) Application of indicator geostatistics for probabilistic uncertainty and risk analyses of geochemical data , J. KESS, Vol.31 (4) ; pp.301-312
    17. Shannon C E (1948) A Mathematical theory of communication , J. Bell syst. Tech, Vol.27 ; pp.379-423
    18. Yang Y , Burn D H (1994) An Entropy approach to data collection network design , J. Hydrol, Vol.157 (1-4) ; pp.307-324
    19. Yeh H C , Chen Y C , Wei C , Chen R H (2011) Entropy and kriging approach to rainfall networkdesign , Paddy Water Environ, Vol.9 (3) ; pp.343-355
    20. Yoo C S , Jung G S (2002) Evaluation of rain gauge networks using entropy theory: Comparison of mixed and continuous distribution applications , J. KSCE, Vol.22 (4) ; pp.447-457