1. 서 론
2. 선박 운항데이터의 처리
2.1 데이터 처리 절차
2.2 대상 선박 및 수집 데이터
2.3 데이터 처리
1) 수집된 운항 데이터 중 결측 구간에 대해서는 해당하는 데이터 세트를 제거하였다. 본 연구에서는 취득 데이터의 양 이 상대적으로 많았으며, 결측값이 특정한 항해구간이 아니라 무작위로 발생하였기 때문에 일부 결측 구간을 제외하더라도 데이터를 분석하는 데 문제가 없었다. 하지만 수집된 데이터 의 양이 한정적이거나 동적인 특성에 민감한 데이터의 경우 또는 특정한 운항 구간에서 결측이 많이 발생하는 경우는 적 절한 전처리가 필요하며 각별한 주의가 필요할 것으로 보인 다.
2) 매뉴얼에 명시된 기기의 정상 작동 범위를 크게 벗어나 거나 일정 시간 동안 변수의 관측값이 일정하게 유지되는 경 우는 데이터 수집 기기의 오류로 간주하여 해당하는 데이터 세트를 제거하였다.
3) 운항변수 중 선박의 기관출력과 연료소모량의 선형 관계 를 활용하여 이상값을 식별하였다. 두 변수의 회귀분석에 의 한 예측값과 관측값의 차가 정규분포를 이룬다는 가정하에 평 균으로부터 3 표준편차를 벗어난 범위의 관측값을 이상값으로 판단하여 원시 데이터로부터 제거하였다. Fig. 3은 기관출력 에 따른 연료소모량의 산점도를 나타낸 것으로써 실선은 두 변수의 선형 회귀선, 원은 회귀선을 기준으로 3 표준편차 이 내의 값, 별표는 3 표준편차 이외의 값에 해당한다. Fig. 4는 Fig. 3에서 이상값으로 식별된 데이터 중에서 샘플링 지점 (Samping point)의 관측값을 분석한 것이다. 시간에 따른 기 관 출력과 연료소모량의 변화를 볼 때 샘플링 지점에서 과도 한 값이 관측된 것을 알 수 있다. 전체 데이터 중 결측값을 제 외한 항해 구간은 3개월 17일이며, 2)와 3)의 이상값 처리 과 정을 수행한 후의 데이터는 항해 구간의 98%에 해당한다.
4) 데이터에 포함된 잡음을 처리하기 위하여 중앙값 필터를 적용하였다. 중앙값 필터는 관측값의 주변값들을 오름 또는 내림차순으로 정렬하여 해당하는 관측값을 정렬의 중앙값으 로 대체하는 방법이며, 이는 과도한 잡음 신호를 처리하고 데 이터의 전반적인 추세를 표현하는 데 효과적이다(Pratt, 2007). Figs. 5-6은 선박의 운항데이터인 평균흘수와 트림에 중앙값 필터를 적용한 결과를 예시로 나타낸 것이다. 파선이 필터를 적용하기 전의 원시 데이터이며 실선으로 나타낸 부분이 10분 간격으로 중앙값 필터를 적용한 결과이다. 평균흘수나 트림의 경우 실제로 선박의 동요 주기나 외력 등에 의하여 지속적으 로 값이 변화하는 특성을 가지나 취득 데이터가 1분 간격의 평균값이 아닌 취득 시점의 순간 데이터로 수집되었기 때문에 데이터가 전반적으로 불안정하며 일정한 추세변화를 나타내 는데 어려움이 존재하였다. 이러한 이유로 중앙값 필터를 적 용하여 데이터의 잡음 및 경향성에 대한 문제점을 보완하고자 하였다.
-
5) 기존의 변수를 조합하거나 관계를 활용하여 종속변수에 물리적으로 더욱 의미가 있는 변수로 변환하였으며, 불필요한 변수의 개수를 줄여 계산 복잡성을 해소시킬 수 있었다. 즉, 선박의 속력과 선수 방위 그리고 진풍속과 진풍향의 관계로부 터 식 (1), (2)와 같이 선박이 조우하는 바람의 상대 방위와 상 대 속도를 계산함으로써 연료소모량에 대한 바람 성분의 영향 을 직접적으로 반영하였다. 또한 동일한 각도의 경우 좌현과 우현에서 바람의 영향이 같기 때문에 선수방위를 기준으로 0-180도까지의 상대적인 방위를 고려하였다.
여기에서 V는 선박의 속력, W는 실제 바람의 속력, α는 선박의 선수방위를 기준으로 계산한 실제 바람의 방향, A는 겉보기 바람의 속력, β는 겉보기 바람의 방향이다.기관출력은 식 (3), (4)와 같이 주기관의 분당 회전수, 토크 등으로 계산할 수 있기 때문에 중복적인 변수의 사용을 방지 하기 위하여 기관 출력과 분당 회전수 중 하나를 제외하는 것 이 바람직할 것으로 판단하였다. 기관 출력의 경우 선박 운항 자가 항해 중 즉각적으로 확인하기에는 용이하지 못하며 통상 적으로 주기관의 분당 회전수를 이용하여 선박의 속력을 조정 하기 때문에 주기관의 분당 회전수를 활용하였다.여기에서 RPM은 주기관의 분당 회전수, w는 프로펠러축 의 각속도, T는 토크이다.선행 연구에서는 단위 시간당 연료소모량을 종속변수로 하 여 예측모델을 생성하는 경우가 많았으나, 항해사 입장에서 보면 주어진 외부환경에서 선박이 일정 거리를 이동하는 동안 소모되는 연료량을 지표로 제공해야 에너지 효율적인 운항상 태를 파악하고 연료소비를 저감하는 데 도움이 될 것이다 (Petersen et al., 2012; Kim et al., 2017). 따라서 식 (5)와 같 이 단위 항해 거리당 연료소모량을 계산하여 선박의 연료효율 을 판단하고자 하였다. 각 변수는 일반적으로 서로 다른 단위체계를 사용하고 있기 때문에 추후 회귀분석에 의한 계수를 추정하더라도 종속 변수에 대한 독립변수들의 영향력을 파악하기 어려운 경우가 발생한다. 이를 방지하기 위해 식 (6)과 같은 z값 변환을 수행 하여 데이터를 표준화하고자 하였으며, 표준화된 변수 zi는 평균이 0이고 표준편차가 1인 특징을 갖는다.
3. 주성분 분석 기반의 선박 연료소비 예측모델
3.1 주성분 분석
3.2 주성분 분석을 활용한 운항 변수 간의 관계 파악
1) 제1주성분 : 선박 주기관의 분당 회전수가 증가하면 선 박의 대지속력과 대수속력이 증가하며 단위 항해 거리당 연료 소모량이 증가한다. 즉, 선속이 높을수록 연료효율이 감소하는 경향이 있다.
2) 제2주성분 : 선박의 평균흘수가 증가하면 배수량 및 선 체 수선면 하부의 표면적이 증가하고 단위 항해 거리당 연료 소모량이 증가한다. 이는 흘수 증가로 인하여 선박의 저항이 증가하기 때문에 연료효율을 감소시키는 역할을 하는 것으로 판단된다. 또한 평균흘수가 증가하면 트림이 감소하는 경향이 있으며 이는 흘수 증가분을 보완하기 위한 선박에서의 조정으 로 보인다.
3) 제3주성분 : 상대 풍향이 감소하면 상대 풍속이 증가하 고 단위 항해 거리당 연료소모량이 증가한다. 상대 풍향과 상 대 풍속은 바람과 선박의 벡터 합성으로 계산된다. 따라서 상 대 풍향의 감소는 선박이 강한 선수 방향 바람을 조우하거나 고속으로 항해하는 경우에 해당하며, 이는 연료효율을 감소시 키는 역할을 한다.
4) 제4주성분 : 선박에서 사용하는 타각이 커질수록 단위 항해 거리당 연료소모량은 증가한다. 선박이 운항 중 타를 사 용하게 되면 타판에 작용하는 항력에 의해서 속도를 저하시키 는 역할을 하며, 이는 연료효율을 감소시킨다.
3.3 주성분 분석을 활용한 회귀분석 모델 구현
3.4 예측성능 평가 결과
4. 결론 및 향후 과제
1) 선박의 운항 특성을 고려한 적절한 데이터 정제를 수행 하기 위하여 변수 간의 선형 관계, 중앙값 필터, 주성분 분석 과 같은 방법을 활용하였다.
i) 선형 관계를 나타내는 선박의 기관출력과 연료소모량 의 회귀선으로부터 3 표준편차를 벗어나는 관측값을 이상값으로 식별하였으며, 식별한 값의 시계열 분석을 통해 이러한 방법의 유효성을 확인할 수 있었다.
ii) 중앙값 필터를 사용하여 데이터에 포함된 잡음을 처리 하고 일정한 경향성의 데이터로 정제하였다. 특히 선 박의 동요 주기나 외력 등에 의하여 지속적으로 값이 변화하는 데이터는 수집 간격이 길어질수록 일정한 추 세변화를 나타내기에 부적절한 경우가 있었으며, 이를 해결하기 위하여 중앙값 필터를 적용하였다.
iii) 주성분 분석을 활용하여 운항 변수와 연료소비 간의 관계를 파악하였으며, 이는 수집한 원시데이터의 이상 값을 식별하는 방법으로도 사용될 수 있다.
2) 예측모델을 구현하기 위하여 독립변수에 대한 주성분 분 석을 수행하였으며, 다음과 같은 4개의 주성분을 추출하였다. 제1주성분은 주기관 분당 회전수, 대지속력, 대수속력과 같은 선박의 추진 성분을 의미하였다. 제2주성분은 평균흘수, 트림, 배수량 및 침수표면적과 같은 선박의 하중 성분을 나타내었 다. 제3주성분은 선박이 조우하는 상대 풍속과 상대 풍향과 같은 외력 성분, 제4주성분은 타각성분을 의미하였다.
3) 평가용 데이터에 대한 주성분 회귀모델의 예측 성능은 평균 제곱근 오차 0.0211, 조정 결정계수 0.8299이었다. 10일 동안 선박의 연료소비를 예측한 결과 하루 평균 4.1 ton 정도 의 연료소모량의 차이가 발생하였으며, 선박의 전반적인 연료 소비 경향을 예측하기에는 적합할 것으로 사료된다.