Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-4517(Print)
ISSN : 2287-3503(Online)
Journal of Environmental Science International Vol.24 No.11 pp.1443-1450
DOI : https://doi.org/10.5322/JESI.2015.24.11.1443

Development of Energy Consumption Estimation Model Using Multiple Regression Analysis

Won-Jae Shin, Yong-Jun Jung1), Ye-Jin Kim1)*
Tae Sung Environment Institute Co., Ltd., Ulsan 44992, Korea
1)Department of Environmental Engineering, Catholic University of Pusan, Busan 46252, Korea
Corresponding author Ye-Jin Kim, Department of Environmental Engineering, Catholic University of Pusan, Busan 46252, Korea Phone : +82-51-510-0621 yjkim@cup.ac.kr
September 8, 2015 October 7, 2015 October 8, 2015

Abstract

Wastewater treatment plant(WWTP) has been recognized as a high energy consuming plant. Usually many WWTPs has been operated in the excessive operation conditions in order to maintain stable wastewater treatment. The energy required at WWTPs consists of various subparts such as pumping, aeration, and office maintenance. For management of energy comes from process operation, it can be useful to operators to provide some information about energy variations according to the adjustment of operational variables. In this study, multiple regression analysis was used to establish an energy estimation model. The independent variables for estimation energy were selected among operational variables. The R2 value in the regression analysis appeared 0.68, and performance of the electric power prediction model had less than ±5% error.


다중회귀분석을 활용한 하수처리시설 에너지 소비량 예측모델 개발

신 원재, 정 용준1), 김 예진1)*
(주)태성종합환경연구소
1)부산가톨릭대학교 환경공학과

    1.서 론

    하수처리시설은 인간의 활동 및 산업 시스템의 구동 후 발생되는 하수가 주요한 유입 인자이기 때문에, 일반 적으로 주민 혐오시설 및 다량의 에너지를 소비하는 시 설물로 인식되어 왔다. 하수처리장에 사용되는 전력은 연간 총 전력 사용량의 0.5%를 차지하고 있으며, 이와 같이 다량의 에너지를 소비하는 공공하수처리시설의 전 력비는 산업용 전력비가 적용됨에도 불구하고 공공하수 처리시설의 20.0%로 인건비(23.9%) 다음으로 큰 비중을 차지하고 있다(2012년 기준, Ministry of Environment, 2013).

    환경부는 현재 세계적으로 화두가 되고 있는 고유가 및 기후변화 협약에 대처하기 위해 지난 2010년 “에너지 자립화 기본계획”을 발표 하였다(Ministry of Environment, 2010). 하수처리 과정(소화가스·소수력 발전·하수열) 및 지역적(풍력·태양광 발전)특성을 활용한 신·재생에너지 시설의 확대를 통해 현재 공공하수처리 시설의 에너지 자립율(0.8%)을 2030년까지 단계적으로 향상시켜 최종적으로 50% 달성을 목표로 두고, 에너지 소비시설에서 에너지 재생산 시설로의 패러다임 전환을 시도했다. 이와 같은 신·재생에너지 기술들은 하수처리 장의 여유 부지 또는 처리 흐름의 수정으로도 충분히 에 너지 생산이 가능한 기술들이며, 이미 하수처리장에 이 들 신재생에너지 기술을 적용하여 에너지 자립화를 시 도한 연구사례가 존재한다(Yoon et al., 2014). 또한 최 근에는 고효율 장치를 도입함으로써, 동일한 전력으로 도 더 높은 성능을 확보하여 에너지 사용량을 저감할 수 있는 방안도 개발되고 있고(Ovezea, 2009), 하수처리 장의 에너지 효율성을 평가하기 위한 방법으로 비 방사 상 자료포락 분석(Data Envelopment Analysis)과 호 기조 시스템의 산소전달 효율에 대한 다양한 방법론들 (Hernández-Sancho et al., 2011; Kim et al., 2014; Liu et al., 2011)이 적용되고 있다. 장기적인 측면에서 이와 같은 신재생에너지 기술 및 고효율 장치 도입은 에너지 절감을 위한 효율적인 방법들 중 하나라고 판단할 수 있 지만, 상기 언급된 방법들은 시설 설치 및 교체를 위한 초 기 투자비가 발생하는 단점이 있으며 하수처리장의 운영 과는 전혀 연계되지 않은 새로운 기술들을 도입한 것이 다. 따라서 하수처리장의 효율적인 운영을 통한 에너지 절감 가능성에 대해 고려해 볼 필요가 있다. 이에 본 연 구에서는 운전자가 새로운 운전방안을 제시할 경우 그에 따른 에너지 절감량에 대해 제안할 수 있도록 다중 회귀 분석(Multiple regression analysis)을 통한 에너지 소비 상태를 예측할 수 있는 예측모델을 개발하였다.

    2.재료 및 방법

    2.1.대상 플랜트

    본 연구는 처리용량 340,000 m3/day인 N 하수처리장 표준활성슬러지 공정을 대상으로 에너지 소비량을 진단 및 평가하기 위해 2008년부터 2010년까지, 20개 항목 528개의 data를 수집하였다. N 하수처리장의 처리공정 도는 Fig. 1과 같다.

    N 하수처리장의 에너지 소비패턴을 진단하기 위해 하 수처리장에서 사용되는 주요 펌프류의 소비전력값을 바 탕으로 총 소비되는 에너지 중 부문별 소비되는 에너지 양을 계산한 결과, Fig. 2와 같은 비율을 얻을 수 있었다. 일반적으로, 하수처리장의 운영비용 중 큰 비율을 차지 하는 전력비는 호기조 송풍기가 가장 큰 요인인 것으로 선행 연구자들에 의해 조사된 바 있으며(KSWW, 2006), Fig. 2.1에서 하수처리장의 기기설비의 전력 소 비율을 비교하였다. 이 중 송풍기의 전력 소비율은 37% 를 차지하는 것으로 나타났으며, 나머지 부분은 주로 유 입 및 방류를 위한 펌프류에 의한 전력 소비율이 높은 것 을 알 수 있다. 이와 같이 큰 비율을 차지하는 송풍기에 의한 에너지 소비를 줄이기 위해, 송풍량 제어와 고효율 장비의 도입과 같은 연구들이 현재 활발히 진행되어 오 고 있다( Åmand et al., 2012; Ekma et al., 2006; Fernández et al., 2011).

    2.2.다중회귀분석

    회귀 분석(Regression Analysis)은 한 개 또는 그 이상 의 독립변수들과 한 개의 종속변수들의 관계를 파악하기 위한 통계적 기법이다. 즉 종속변수에 영향을 미치는 여 러 개의 독립변수들을 이용하여 종속변수의 변화를 예측 하는 방법으로서 가장 대표적인 종속관계(dependence) 에 관한 분석이다. 분석방법은 독립변수와 종속변수 사 이에 존재할 법한 아래 식과 같이 표현되는 선형식을 구 하여 독립변수들의 값이 주어졌을 때 종속변수의 값을 예측하고, 종속변수에 대한 독립변수의 예측력(영향력) 을 분석한다. 공학 분야 뿐 아니라 사회과학 분야에서도 널리 쓰이는 방법론으로서, 환경공학 분야에서는 특정 오염물질의 원인이 되는 여러 가지 변수들을 분석하여 원하는 오염물질의 양을 정량적으로 예측하기 위한 연구 사례들이 다수 존재한다 (Ҫamdevỳren et al., 2005).

    Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ... + β n x n + i
    (1)

    Y : dependent variable

    βi : partial regression coefficient

    xi : dependent variable

    ϵi : error

    종속변수를 표현하기 위한 독립변수가 하나면 단순회 귀분석(Simple regression analysis)이라 하고 위 식과 같 이 독립변수가 다수일 경우에는 다중회귀분석(Multiple regression analysis)이라고 한다(Sung, 2007). 다중회 귀분석을 실시하기에 앞서 종속변수(Dependent variable) 를 선택한 후 분석에 사용되는 독립변수(Independent variable)들을 선정하였다. 변수들의 선정 방법은 독립 변수들 중 가장 중요하다고 판단되는 변수부터 모형에 추가 시키면서 더 이상 추가시킬만한 유의한 독립 변수 가 없을 때 최종적으로 선택된 독립변수들만을 이용하여 모형을 적합 시키는 전진선택법 (forward selection)과, 모든 독립변수들을 포함하는 회귀모형을 만든 후 기여 도가 가장 적은 변수부터 차례로 제거시켜 나가는 후진 제거법(backward elimination) 중 후진제거법을 사용하 였다.

    회귀식의 유효성을 판단하기 위한 지표로서 기여율 (결정계수)이 있다. 기여율은 R2로 표기하며 1에 가까울 수록 우수한 회귀식임을 의미하나, 독립변수의 수가 증 가될수록 값이 커지는 경향이 있어, 아래와 같은 식으로 인해 계산되는 수정된 R2값을 활용하여 회귀식의 유효 성을 판단한다.

    R 2 = SSR TSS = 1 SSE TSS
    (2)

    TSS : Total Sum of Squares

    SSR : Sum of Squares due to Regression

    SSE : Sum of Squares due to Error

    수정된 R 2 = 1 n 1 n p 1 1 R 2
    (3)

    n: size of sample

    p: number of dependent variables

    회귀식이 개발된 후에는, 회귀모델의 유의성을 검정 하고 다중공선성을 VIF 계수를 사용하여 확인하였다. 변 수들 간에 다중공선성(Multicollinearity)이 존재하는 경 우, 다른 독립변수들의 결합으로 영향을 받는 독립변수 가 회귀모형 내에서 독자적인 정보를 제공하지 못하게 되므로 R2의 값은 큰 반면에 대부분의 회귀계수들이 유 의하지 않은 경우가 발생하게 된다. 다중공선성은 독립 변수들 사이의 선형종속(Linear Dependency)의 관계로 정의되며, 실질적으로 어느 독립변수가 다른 독립변수들 로부터 밀접한 상관관계를 가지고 있는 상태를 말한다. 따라서 VIF 분산팽창인자(Variance inflation factor)의 유무를 확인하는 것이 바람직하며, VIF값이 10이상이면 다중공선성이 존재한다고 판단하여 독립변수로 사용하 지 않는다(Ham, 2007).

    VIF = 1 1 R 2
    (4)

    3.결과 및 고찰

    3.1.다중회귀식 개발

    에너지 소비상태량 예측모델을 개발하기 위해 전력량 (종속변수)을 예측하기위해 데이터 항목들과의 상관관계 를 고려한 후, 다중회귀분석을 실시하였다. 독립변수의 선정은 모든 독립변수들을 포함하는 회귀모형을 만든 후 기여도가 가장 적은 변수부터 차례로 제거시켜 나가는 후진제거법을 사용하여 수행되었다. 이에 따라 에너지 소비, 즉 전력량(kwh/d)를 모사하기 위한 다중회귀분석 에 들어가는 변수로는 유입유량(Qin, m3/d), 수온(Temp, °C), SRT(d), DO(mg/L), 반송슬러지유량(Qras, m3/d), 1차 침전조 슬러지폐기유량(Qfir, m3/d), 2차침전조 슬 러지폐기유량(Qsec, m3/d), 슬러지 원심탈수기 폐기유 량(Qthic, m3/d), 소화조 유입 슬러지유량(Qdin, m3/d) 로 선택되었다(Table 2). 이는 단위공정별 전력량 및 단 위공정에 설치되어 있는 펌프 전력사용량 등의 기록이 에너지 절감을 위한 핵심변수라는 기존의 연구(Cho et al., 2012)에 의해 선택된 것이다. 상용 통계 소프트웨어 인 IBM SPSS 21v.을 사용하여 도출된 회귀식은 아래와 같다. Table 1

    y Elec = 52095 . 194 + 0 . 057 × Qin + 104 . 068 × Temp + 198 . 114 × SRT + 167 . 094 × DO + 0 . 017 × Qras + 0 . 560 × Qfir + 0 . 131 × Qsec + 0 . 256 × Qthi + 0 . 483 × Qdin
    (5)

    전력량을 종속변수로 한 전력량 예측모델의 적용 결 과는 Fig. 3과 4에 도시하였다. 도출된 회귀모형에 따른 예측 전력량은 실제 측정값과 0.828의 높은 상관성을 보 여주었고, 다중회귀분석에 사용되지 않은 95개의 데이터 에 대한 검증 결과에서도 0.833의 높은 상관도를 보였다 (Fig. 4). 또한 예측모델의 정밀도(precision)를 보다 객 관적으로 평가하기위해 실제 전력 사용량과 모델이 예측 한 값의 차이를 다룰 때 흔히 사용되는 RMSE(Root Mean Square Error)를 도출하였다. 예측 모델 개발에서 하수처리장에서 사용된 전력량과 모델 시뮬레이션 결과 사이의 RMSE는 약 1,603 kWh/day로 5% 이하의 낮은 오차로 확인되었다. 예측 모델의 검증결과에 대한 RMSE는 1,818 kWh/day로 모델 개발에서의 RMSE 값 보다는 높지만 역시 5% 이하의 오차로써 예측 모델이 성 공적으로 검증되었음을 확인하였다.

    또한 회귀식의 유효성을 판단하기 위한 지표인 수정 된 R2 값은 0.674로 계산되었다. 이것은 종속변수 y가 갖는 정보 중 67%를 x의 변동으로 설명할 수 있다는 것 을 의미한다. F값은 독립변수가 종속변수 예측에 도움이 되는지 판단하는 값으로, F값이 2 이상이기 때문에 유효 한 변수라 판달 할 수 있다(Noh, 2007). 유의확률 또한 0.05 이내에 존재하기 때문에 매우 적합한 것으로 나타 났다. Table 3

    3.2.회귀모형의 유의성 검정

    N하수처리장의 에너지 소비량을 예측하기 위해 개발 된 회귀모형의 유의성을 분산분석을 활용하여 검정한 결 과, 아래 표와 같은 결과를 도출하였다. 검정될 가설은 “회귀식은 의미가 없다”는 가설로 아래와 같이 표현할 수 있고 분산분석표의 “유의확률수치”에 주목하여 판정 할 수 있다(Park, 2009). “회귀식에는 의미가 없다”는 귀 무가설과 “회귀식에는 의미가 있다”라는 대립가설을 세 우고, 유의수준 a는 일반적으로 0.05로 설정된다(α =0.05). Table 4에서도 보이는 바와 같이, 개발된 회귀모 형의 유의확률이 0.000 으로 귀무가설을 기각하므로 의 미가 있다고 말할 수 있다.

    3.3.독립변수들의 다중공선성 검토

    개발된 회귀식에 포함된 독립변수들의 VIF 값은 통계 소프트웨어 SPSS를 이용해 구하였으며 Table 5에 나타 내었다. 본 연구에 사용된 독립변수의 VIF 값은 수식(6) 과 같은 방법으로 계산되어 1.283~2.676의 값을 나타 냈다. 일반적인 VIF 값의 범위인 10이내를 만족하였고, 공차한계(Tolerance)가 0.1 이상이므로 다중공선성의 영향은 거의 없다고 판단된다.

    4.결론

    하수처리시설의 에너지 소비량을 예측하기 위한 모델 을 다중회귀분석을 사용하여 개발하였다. 20개의 주요 운전변수 중 후진제거법을 사용하여 다중회귀모델에 사 용된 변수는 폭기조의 폭기량과 각종 펌프류에 관한 변 수들이었다. 개발된 회귀모델은 수정된 R2값이 0.68로 서, 일반적으로 다중회귀식의 적합성 보증으로 거론되는 계수인 0.7보다는 낮으나 회귀식의 유의성이나 선택된 변수의 다중공선성의 검토 결과 무리가 없는 것으로 판 단된다. 더군다나 회귀모델을 생성하기 위해 사용되었던 데이터셋에 관해서는 0.828의 상관계수로서 정확도를 보였고, 검증을 위한 데이터셋에 적용한 결과 0.833의 정확도를 보였다. RMSE의 값 또한 5%의 오차를 가짐 을 보여주었다. 본 연구에서 개발된 다중회귀모델을 사 용하여 하수처리장 운전자는 호기조 내 DO 농도의 조절 이나 반송슬러지, 폐기슬러지의 유량이 조절될 경우 전 력량은 어떻게 변동될 것인가를 추산해 볼 수 있다.

    Figure

    JESI-24-1443_F1.gif

    The Process flow diagram of N WWTP.

    JESI-24-1443_F2.gif

    The ratio of the power consumption of the mechanical equipments in N WWTP.

    JESI-24-1443_F3.gif

    Calibrated using prediction model of electric energy.

    JESI-24-1443_F4.gif

    Validated using prediction model of electric energy.

    Table

    Operational conditions of N WWTP

    List of independent variables used for multiple regression analysis

    Multiple regression analysis results

    Result in the analysis of variance

    VIF values for determining the multicollinearity of the independent variables

    Reference

    1. Amand L , Carlsson B (2012) Optimal aeration control in a nitrifying activated sludge process , Water Research, Vol.46; pp.2101-2110
    2. Cho E S , Han D H , Ha J S (2012) Energy efficiency evaluation of publicly owned wastewater utilities , Journal of Environmental Policy, Vol.11 (4) ; pp.85-105
    3. Ҫamdevyren H , Nilsun D , Arzu K , Keskyn S (2005) Use of principal component scores in multiple linear regression models for prediction of Chlorophyll-a in reservoirs , Ecological Modelling, Vol.181; pp.581-589
    4. Ekman M , Bjorlenius B , Andersson M (2006) Control of the aeration volume in an activated sludge process using supervisory control strategies , Water Research, Vol.40; pp.1668-1676
    5. Fernández F J , Castro M C , Rodrigo M A , Cañizares P (2011) Reduction of aeration costs by tuning a multi-set point on/off controller: A case study , Control Engineering Practice, Vol.19 (10) ; pp.1231-1237
    6. Ham H B (2007) Data analysis and SAS programming , Vol.328;
    7. Hernández-Sancho F , Molinos-Senante M , Sala- Garrido R (2011) Energy efficiency in Spanish waste -water treatment plants: A non-radial DEA approach , Science of the Total Environment, Vol.409 (14) ; pp.2693-2699
    8. Kim M H , Ji S H , Chang J H (2014) A study on energy saving effect from automatic control of air flowrate and estimation of optimal DO concentration in oxic reactor of wastewater treatment plant , Journal of Energy Engineering, Vol.23 (2) ; pp.49-56
    9. Korean Society of Water and Wastewater (2006) Research on energy saving strategies at public sewerage system ,
    10. Liu C , Li S , Zhang F (2011) The oxygen transfer efficiency and economic cost analysis of aeration system in municipal wastewater treatment plant , Energy Procedia, Vol.5; pp.2437-2443
    11. (2010) Ministry of Environment , Basic plan for energy saving at public wastewater treatment plants,
    12. (2013) Ministry of Environment , Report on the management and operation of public wastewater treatment plants,
    13. Noh H (2005) Theory and application of multivariate statistical analysis using Excel and SPSS , Hyungsul, pp.244-261
    14. Ovezea A (2009) Saving energy: Using fine bubble diffusers , Filtration & Separation, Vol.46 (1) ; pp.21-27
    15. Park S H , Cho S S , Kim S S (2009) Understanding and application of SPSS 17.0 , pp.261-270
    16. Sung T J (2007) Easy statistics using SPSS/AMOS , pp.263-265
    17. Yoon J W , Kim C Y , Choi C K (2014) Case studies of energy-saving method for renewable energy installa -tion in sewage treatment plant , Journal of Korean institute of illuminating and electrical installation engineers, Vol.28 (4) ; pp.42-48