AIS 및 LTE-Maritime 데이터를 활용한 항적 예측 오차 비교 연구

A Comparative Study of Vessel Trajectory Prediction Error based on AIS and LTE-Maritime Data

Article information

J Navig Port Res. 2022;46(6):576-584
Publication date (electronic) : 2022 December 31
doi : https://doi.org/10.5394/KINPR.2022.46.6.576
*,**Student, Graduate School of Data Science, Seoul National University. Gwanak-gu, Seoul, Korea
***,****KRISO, 32 Yuseong-daero, Yuseong-gu, Seoul, Korea
Professor, Graduate School of Data Science, Seoul National University. Gwanak-gu, Seoul, Korea
민지홍*, 이승주**, 조득재***, 백종화****, 박현우,
*,**서울대학교 석사과정생
***,****선박해양플랜트연구소 책임연구원
서울대학교 데이터사이언스대학원 교수
Corresponding author : 정회원, hyunwoopark@snu.ac.kr 02)880-1139
Received 2022 November 30; Revised 2022 December 5; Accepted 2022 December 28.

Abstract

기존 해상 교통안전을 위한 기반 정보는 AIS 시스템을 사용하여 왔으나, IMO의 e-Navigation 도입이 제기된 이후 LTE 통신을 활용한 초고속 해상무선통신시스템(LTE-Maritime, LTE-M)이 세계 최초로 대한민국에 구축되었다. 본 논문에서는 AIS와 LTE-Maritime을 사용하여 수집된 항적 데이터를 비교 분석하고, 두 가지 종류의 항적 데이터를 기반으로 해상 안전사고 예방에 활용될 수 있는 항적 예측을 수행하였다. AIS 대비 LTE-Maritime의 데이터 수집 간격이 조밀하고 균일하여 항적 예측 오차가 작은 것을 확인하였다. LTE-Maritime에서 수집된 데이터의 경우 데이터 송·수신 시간 간격은 AIS 대비 항적 예측 오차에 대한 영향이 약 17% 적은 것을 발견하였다. 본 연구는 AIS와 LTE-Maritime의 항적 데이터와 그 활용을 정량적으로 비교한 최초의 연구라는 점에서 의미가 있다.

Trans Abstract

AIS is widely utilized in vessel traffic services for marine traffic safety. In 2021, Korea deployed the high-speed maritime wireless communication system (LTE-Maritime) on the sea following IMO’s proposal for the introduction of e-Navigation. In this paper, vessel trajectory data from AIS and LTE-Maritime were used for vessel trajectory prediction to compare and analyze the two systems. The results show that the trajectory prediction error of LTE-Maritime was smaller than that of AIS due to the granular and uniform data provided by LTE-Maritime. Additionally, it was revealed that time interval is the most important factor influencing the errors in trajectory prediction, with the prediction error of LTE-Maritime growing at a slower rate of 17% than AIS. This research contributes to the literature by quantitatively comparing AIS and LTE-Maritime systems for the first time.

1. 서 론

기존 선박교통관제 시스템은 AIS(Automatic Identification System)를 이용하여 해사 사고 예방 및 선박 안전 확보를 위해 해상 교통상황을 모니터링을 수행하고 있다. AIS는 선박의 위치 정보 및 항해 정보가 포함되어 있고, 선박간 무선통신이 가능한 시스템으로서 교통 관리에 중요한 요소로 활용되고 있다(Oh et al., 2018). 국제해사기구(IMO, International Maritime Organization)는 2000년 6월 SOLAS 협약에 충돌 예방 기능, 선박 보고 제도 기능, VTS 기능 등을 수용하는 AIS 장치 탑재를 의무화하는 규정을 신설하였다(Yang et al., 2003). 국내에서는 2004년부터 항해 목적 및 선박 중량에 따라 순차적으로 강제 탑재 기준을 마련하였으며, 현재는 300톤 이상 국제선과 500톤 이상 화물선에 필수 장착을 요구하고 있다(Jeong, 2018). AIS는 VHF 무선통신 시스템을 통해 선박 간의 상호 통신 및 관제 시스템과의 통신을 수행하며, 장비 유형에 따라 2초에서 3분 사이의 간격으로 동적 정보를 방송한다는 특징이 있다(Jeong, 2018). 그러나 이러한 AIS의 특징은 많은 부분 네트워크 통신망의 한계에서 기인한다. 기존의 해상 무선통신 기술은 육상 통신 기술에 비해 현저히 낮은 성능을 제공하고 있다. 그 이유로는 해상의 지형적 특성상 육상의 기지국 사용이 불가피하고, 장거리 통신에 사용되는 낮은 주파수는 데이터 전송 용량이 적어 필수 데이터를 모두 전달할 수 없기 때문이다(Jeong, 2018).

IMO는 2006년 항해 안전 및 항운 효율 확립을 위해 e-Navigation 도입을 제기하였으며, 2014년부터 순차적으로 이를 해상에 적용하고 있다. 국내에서는 기존 해상 무선통신의 한계를 극복하고 한국 해양 환경에 맞도록 개선된 한국형 e-Navigation 구현을 2016-2020년까지 추진하였으며, 이 사업의 일환으로 2021년 LTE 통신을 활용한 초고속 해상무선통신시스템(LTE-Maritime, LTE-M)이 구축되었다(Jeong, 2018; Lim and Cho, 2018). LTE-M 네트워크는 평균 10Mbps 이상의 통신 속도로 대용량 데이터 전송이 가능하며, 이는 AIS의 1,000배에 이르는 속도이다. 선박 라우터(router) 시스템을 기반으로 한 LTE-M 인프라의 구축으로 육상 LTE 통신 적용의 한계를 극복하고, 해상 최대 100km의 통신 거리를 지원하며 대용량의 밀도 높은 정보를 제공할 수 있게 되었다(Jeong, 2018). 이에 따라 LTE-M을 활용한 e-Navigation 서비스가 2021년 개시되었으며 이는 기존 AIS에 비해 훨씬 높은 빈도로 배의 위치를 모니터링할 수 있는 기술적 기반이 되었다.

해상 교통 상황 모니터링의 주요 목적은 선박의 위치 정보 파악과 이를 통한 안전사고 예방이다. 해상 무선통신망으로 수집된 실시간 선박 항해 정보를 기준으로 선박의 다음 항적을 정확하고 신속하게 예측한다면 선박간 충돌 사고를 예방할 수 있다. 통신 속도와 빅데이터 환경에서 강점을 가진 LTE-M이 수집한 데이터를 항적 예측에 활용하여 기존 AIS 데이터를 기반으로 한 항적 예측 결과와 비교 분석한다면 최근 구축된 LTE-M의 실제 서비스 적용 가치를 정량적으로 실증할 수 있을 뿐만 아니라 향후 해상 교통 안전 서비스의 고도화에도 기여할 수 있다.

이에 본 연구에서는 AIS와 LTE-M 두 가지 해상 무선통신 시스템에서 수집된 동일 선박의 항적 데이터로 항적 예측을 수행하여 각 시스템에서의 예측 정확도를 비교하였다. AIS와 LTE-M에서 수집된 해사 데이터의 특징을 각각 분석하고, 항적 예측 오차를 계산하여 비교 분석한 결과를 기술한다.

2. 선행 연구 분석

2.1 통신 시스템에 관한 연구

해상 무선통신은 1912년 타이타닉호 사고로 선박의 무선통신기 탑재가 의무화되며 기술 발전을 시작하였다. 인공위성 통신 기술 적용을 통해 전 세계의 선박 위치 파악과 사고 예방을 가능케 하였고, 지속적으로 다양한 통신 시스템이 개발되었으나 급속도로 발전하는 육상 무선통신 기술에 비해 현저히 낮은 발전 속도와 성능을 보이고 있다(Jeong, 2018; Lim and Cho, 2018).

해상 무선통신은 지상파 아날로그 통신 기술에 의존해왔다. 그러나 아날로그 통신 기술은 기상 등 외부 환경에 영향에 취약하여 통신 품질이 보장되지 않으며, 조난 통신과 일반 통신이 혼신되는 등 안전 통신으로서의 역할 수행이 어렵다는 한계가 있었다(Park and Kim, 2012). 이에 IMO는 1992년 선박 통신체계에 위성 기술을 결합한 전세계 해상조난 안전제도(GMDSS, Global Maritime Distress and Safety System)를 시행하였다. GMDSS 시행을 통한 시스템 운용 자동화 및 위성 기술 활용으로 선박의 안전 통신이 크게 발전하였을 뿐만 아니라 육·해상 통신 시스템 통합의 기반을 마련하였다(Park and Kim, 2012).

기존 GMDSS는 DCS를 활용한 조난경보를 사용하였으나, 일반 통신과의 혼선으로 실패 확률이 높고 운용방식이 복잡하다는 문제점을 보완하고자 AIS 장치를 통한 조난 및 안전 경보 메시지 전송 방식을 채택하였다(Park and Kim, 2012). 이는 기상이나 장애물에 의한 통신 품질 영향이 없어 안정적인 정보 통신이 가능하다(Jeong, 2018). 다만 AIS의 데이터 송신 속도는 9.6kbps로 안전을 위한 필수 데이터만 전송할 수 있는 수준이다. 전송 데이터를 늘리기 위해 AIS 채널의 빈 슬롯을 활용하는 시도가 있었으나, 전송 가능 데이터양의 한계로 적용되지 못했다(Cho et al., 2013). AIS의 과부하를 방지하기 위해 VDES(VHF Data Exchange System) 기술이 제안되었다(Yun et al., 2014). VDES는 AIS와 동일하게 VHF 주파수 대역을 사용하나 별도의 채널을 활용하여 통신을 가능하게 했다(Yun et al., 2014). 이를 통해 데이터 전송 속도를 최대 약 307kbps까지 발전시켜 기존보다 많은 정보를 송신할 수 있게 되었다(Yun et al., 2014). 다만 기존 AIS 및 VDES 기술 모두 VHF 주파수 대역을 사용하기에 서비스 사용 선박이 증가할수록 주파수 충돌 위험이 증가하게 된다(Jeong, 2018).

이러한 AIS 기반 해상 무선통신의 한계를 극복하기 위하여 육상 무선통신 기술을 해상에도 적용하려는 다양한 시도가 있었다. 대표적으로는 WiBro, HSDPA 등을 해상 통신망에 확대 적용하거나, 육상 통신과 해상 통신을 혼합하여 근거리는 육상을 활용하고, 장거리는 위성을 활용하는 등의 방법이 제안되었다(Jeong, 2018). 그러나 WiBro는 통신 서비스의 커버리지가 최대 3.5km로 제한적이라는 것이 확인되었고, HSDPA는 최대 40km까지 통신이 가능하였으나 장거리 송신을 유지하며 충분한 데이터 전송 속도를 확보할 수 없어 멀티미디어 정보 송신 서비스를 제공할 수 없는 것이 확인되었다(Jeong, 2018).

육상에서 본격적으로 상용화된 기술인 LTE에 준하는 수준의 고속 무선통신을 국내 해상 무선통신에 적용한 것이 바로 초고속 해상무선통신망(LTE-M)이며, 이는 세계 최초로 구축된 시스템이다(Shim et al., 2021). 전술하였듯이 LTE-M을 적용한 해상 무선통신 서비스는 대용량 데이터에 대한 신속한 송·수신을 가능케 했으며, 통신 거리도 최대 100km에 이른다.

LTE-M과 관련된 기존 연구들은 대부분 통신 성능 검증과 성능 개선 방안 등의 주제에 집중되어 있다. LTE-M의 성능 검증과 관련된 연구들은 국내 실해역에서 스루풋(throughput), RSRP(Reference Signal Received Power), SINR(Signal to Interference-plus-Noise Ratio) 등 일반적으로 활용되는 무선통신 속도 및 LTE 통신 품질 관련 지표를 기준으로 그 성능을 측정 및 분석하였다(Jo et al., 2018; Jeong et al, 2018; Jo and Shim, 2019). 해상선박과 지상 기지국간의 대용량 데이터 송·수신이 예상되는 한국형 e-Navigation 서비스에의 적용을 감안하여 해안 권역별 선박 밀집도와 데이터 유형, 거리 등에 따른 필요 성능, 동시 사용률 등을 가정한 서비스 시나리오 하에서 통신 성능 품질을 검증 및 분석하는 연구도 이루어졌다(Kim and Shim, 2021).

2.2 항적 예측에 관한 연구

과거 및 현재 항적 데이터를 기반으로 가까운 미래 시점의 선박 위치를 예측하는 항적 예측(trajectory prediction)은 해운 산업에서의 비용 절감 및 효율화를 위한 최적 항로 설계, 공공 분야에서의 해사 안전 모니터링, 선박 통항량 관리, 항만 운영, 특히 선박 충돌 방지와 같은 해사 안전 관리 등 광범위한 목적에 활용 가치가 높아 다수 선행 연구의 성과가 집적된 분야다(Zhang et al., 2022).

기본적인 항적 예측 방법론으로는 속도, 침로, 회전 등 선박 거동 관련 데이터를 활용하는 Last el al.(2014)의 연구에서 고안한 선박 운동 모델이 있다. 이외에도 Perera et al.(2010)의 연구에서 적용된 확장된 칼만 필터(Extended Kalman filter), Scheepens et al.(2014)에서 활용한 몬테카를로 방법(Monte Carlo Method), Uney et al.(2019), Millefiori et al.(2016) 등의 연구에서 적용된 확률적 과정 기반 방법론(Stochastic Process-based methods) 등으로 대표되는 통계적 예측 등이 있다.

최근 항적 예측 분야에서는 머신러닝이나 딥러닝, 또는 여러 형식의 모델을 혼합한 방법론을 적용하는 경향이 두드러지며, 시계열 데이터 예측에 주로 활용되는 LSTM, GAN 등의 딥러닝 모델을 활용하는 연구가 대표적이다 (Wang and He, 2021).

AIS 데이터가 국제적으로 널리 사용되고 있는데다 연구 성과에 대한 활용 가치가 크므로, 항적 예측 분야에서는 AIS 데이터를 기반으로 한 연구가 대부분이다(Zhang et al., 2022). 한편 LTE-M은 국내에서 처음 선보인 해상 통신 시스템이므로 LTE-M 데이터를 활용한 항적 예측에 대한 연구는 아직 없다. AIS의 제한적인 통신 범위, 높은 레이턴시 등은 항적 예측의 성능을 저하시키는 주요 원인 중 하나로서 지적되는 만큼(Zhang et al., 2022) LTE-M 기반 항적 예측을 AIS 기반 수행과 비교 분석하는 시도는 항적 예측 방법론의 고도화에도 가치가 높을 것이다.

3. 데이터 특징 분석

본 연구에서는 AIS와 LTE-M 두 가지 통신 시스템에서 수집된 선박 항적 데이터를 기반으로 항적 예측을 진행하고, 각 시스템의 데이터에 대한 예측 오차를 비교 분석하였다. 항적 데이터는 AIS 또는 LTE-M, 혹은 두 시스템 모두와 데이터를 송·수신하는 장치를 부착한 선박들이 특정 기간에 국내 전 해역을 운행한 시계열 데이터로서 암호화된 MMSI 번호와 같은 선박 정적 정보와 데이터 송·수신 시점의 선박 위치 및 거동 관련 정보를 가지고 있다. 선박 위치 데이터는 위도 및 경도로 표현되며, 선박 거동 관련 데이터는 대지침로(COG, Course Over Ground), 대지속력(SOG, Speed Over Ground), 선회율(ROT, Rate Of Turn) 등이 있다.

데이터 송·수신 간격은 두 시스템별로 다르다. AIS는 선박별 장비 유형 및 이동 속도에 따라 2초에서 3분 간격으로 이러한 데이터를 수집하는 한편, LTE-M은 초고속 무선 통신망과 GPS 모듈을 기반으로 1초 간격으로 송·수신된 실시간 선박 위치 정보를 수신한다(Jeong, 2018).

항적 예측 오차 비교 분석을 위해서는 전체 항적 데이터로부터 선박별 항적 데이터를 구분하는 작업이 필요하며, 이 과정에서는 암호화된 MMSI 번호를 활용하였다. 이외에도 정박 상태의 선박 항적 데이터 또한 수집될 수 있다는 점과 시계열 데이터의 특성상 수집 데이터에 대한 정상 여부가 구분되어 있지 않은 점 등을 감안하여 별도 전처리 과정을 거친 데이터를 정상 데이터로 가정하고 분석에 활용하였다.

4. 항적 예측 알고리즘

4.1 다음 항적 위치 예측

본 연구에서 적용한 항적 예측 알고리즘은 Last et al. (2014)의 연구에서 활용된 AIS 데이터 기반 선박 운동 예측 모델을 활용하였다. 최근 항적 예측 분야에서 가장 성과를 보인 연구들은 머신러닝 또는 딥러닝 방법론 등을 활용하였으나, 본 연구의 실험용 데이터는 단 하루에 수집된 항적 데이터를 활용하였으므로 특정 선박의 항적을 예측하기 위한 머신러닝 또는 딥러닝 예측 모형에 대한 훈련 데이터로서 그 수가 충분하지 않다는 점, 그리고 전처리된 실험용 항적 데이터의 데이터간 송·수신 시간 간격이 선박 거동 예측 모형을 활용해도 충분할 만큼 조밀하다는 점을 고려하였다.

본 연구에서는 AIS와 LTE-M 항적 데이터를 기반으로 수행한 항적 예측 정확도를 비교하기 위하여 예측된 항적과 실제 항적과의 오차, 즉 예측 오차를 계산한다. 해당 항적 예측 알고리즘에서는 특정 선박 X의 데이터에서 특정 시간 t의 항적 데이터를 식 (1)과 같이 표현한다(Last et al., 2014).

(1) Xt=[Latt,Lont,SOGt,COGt]

선박이 평면 지도에서 움직인다고 가정하고, 다음 시점까지 동일한 대지속력을 유지한다고 가정할 때, t+1 시점에 대한 선박 X의 데이터는 식 (2)와 같이 표현할 수 있다(Last et al., 2014).

(2) Xt+1=[Latt+Δt160cos(COGt)SOGtLont+Δt160sin(COGt)SOGtcos(Latt)SOGt+1COGt+1]

경도와 위도 계산 식 모두 시점 t와 시점 t+1의 차이값인 △t를 사용하며, 단위는 시간이다. 경도 계산의 경우 대지침로와 대지속력값으로 다음 경도를 계산하고, 각도 값으로 단위 변환을 위해 결과값을 60nm로 나누어준다. 경도 계산에서 평면에서의 호의 각도는 동일하다고 가정하여 계산하였으나, 위도 계산의 경우 호의 각도의 변화를 반영하여 계산해야 하므로 현재 시점 위도에 코사인을 취한 값으로 나누어주어야 한다(Last et al., 2014).

4.2 예측 항적과 실제 항적 비교

시스템으로부터 수신된 위치 정보를 정상 데이터로 가정하고, 식 (2)를 통해 계산된 예측 항적과의 거리를 계산한다. 정상 데이터와 예측 항적간의 거리값이 작을수록 정확도가 높고, 거리값이 클수록 정확도가 낮다. 거리 계산은 아래와 같이 두 가지 계산 방식을 사용하였다.

1) 유클리드 거리 계산(Euclidean distance calculation)

유클리드 거리는 두 벡터간의 거리정보를 나타낸다. 본 논문에서는 위·경도 값이 평면 좌표 위에 있다고 가정하고 두 위치 사이의 유클리드 거리를 계산한다. 유클리드 거리 계산 식에 위·경도 값을 대입한 결과는 식 (3)과 같다. 계산된 거리는 위·경도 단위와 동일한 각도 단위이며, 실제 거리 정보보다는 정상 데이터와 예측 데이터간의 유사도 파악에 용이한 정보를 담고 있다.

(3) distance=(°)=(Latt+1-Latt)2+(Lont+1-Lont)2

2) 하버사인 거리 계산(Haversine distance calculation)

하버사인 공식은 위·경도 값의 3차원 공간 정보를 반영하여 거리를 계산한다. 직선거리를 나타내는 유클리드 거리와 달리 지구의 반지름을 기준으로 한 호의 길이를 계산하여 실제 해상에서의 거리를 계산할 수 있다. 하버사인 공식은 식 (4)와 같이 표현된다. 계산된 거리는 km 단위로 데이터간의 유사도 정보보다는 해상 거리를 파악하는 데에 용이하다.

(4) distance(km)=2×6367×arcsin(sin2(Latt+1-Latt2)+cos(Latt)×cos(Latt+1)×sin2(Lont+1-Lont2))

5. 실험 및 고찰

5.1 실험용 데이터 분석

본 연구에서는 해상 무선통신 시스템의 실제 데이터를 활용하여 예측 알고리즘을 적용하고, 각 무선통신 시스템의 특징을 비교하였다. 실험 대상은 동일 기간(’21.12.30 00:00∼24:00) 내 AIS 및 LTE-M으로부터 수집된 국내 전체 해역에서 운항한 항적 정보를 활용하였다. AIS는 6,482척, LTE-M은 1,595척의 선박에 대한 24시간 데이터를 포함하고 있다. 하나의 선박에 대한 데이터는 AIS가 19,575개, LTE-M이 15,180개를 최대로 포함하고 있다. 각 시스템에 대한 수집 데이터에 대한 정보는 Table 1과 같다.

Collected data

1) 데이터 송·수신 시간 간격 비교

AIS와 LTE-M 통신망의 대표적인 차이 중 하나는 데이터 송·수신 시간 간격이다. 이론적으로 AIS는 최소 2초에서 최대 3분 간격으로 데이터를 송·수신하며, LTE-M은 1초 간격으로 데이터를 송·수신하도록 설계되었다. 수집된 데이터의 송·수신 시간 간격 분포를 Table 2와 같이 확인하였다. 해당 분포는 이상치 제거 등 데이터 전처리 과정을 거치지 않은 수집 데이터로서 LTE-M은 AIS 대비 평균 약 24초 적은 간격으로 데이터를 송·수신하였으며, 두 통신 시스템의 데이터 송·수신 시간 차이 분포의 표준편차는 2분 이상 차이가 난다는 것이 확인된다. 이는 LTE-M이 AIS 대비 균일하고 적은 간격으로 데이터를 송·수신하고 있음을 나타낸다. 그러나 최대 송·수신 시간 간격은 두 시스템 모두 12시간 이상으로 확인되어 수집된 데이터의 이상치에 대한 전처리가 필요하다는 것을 확인하였다.

Distribution of time interval per vessel

2) 데이터 측정 위치간 거리 비교

AIS와 LTE-M에서 수집된 각 항적에 대해 이전 항적과의 거리를 식 (4)를 활용해 계산하였다. 계산된 결과에 따라 데이터간 거리 분포를 확인한 결과는 Table 3과 같다. LTE-M은 평균 0.009km마다 데이터를 수집한 것을 확인하였으며 이는 AIS 대비 약 20배 더 적은 간격이다. LTE-M의 표준편차는 0.112로 이는 AIS 표준편차보다 100배 낮은 값이다. 이는 LTE-M이 AIS보다 훨씬 안정적으로 항적 데이터를 수신한다는 것을 방증한다. 그러나 항적간의 차이가 AIS는 최대 약 6,000km 이상, LTE-M은 약 170km 이상으로 확인되어 측정값의 이상치 제거가 선행되어야 함을 알 수 있다.

Distribution of distance interval per vessel

(Unit: km)

5.2 데이터 전처리

1) 유효 선박 구분

① 정박 여부 구분

정확한 항적 예측을 위하여 수집된 데이터 중 정박 상태의 선박 데이터가 제거되어야 한다. 이 과정에서는 선박별 최대 대지속력 값을 활용하였다. 항만에서의 강풍 및 파도와 같은 환경 영향을 고려하였을 때 최대 속력이 2knot(3.7km/h) 이하의 선박은 움직임이 없다고 가정하였다. 이에 해당하는 선박은 AIS에서 1,526척 LTE-M에서 618척으로 확인되었고 이는 전체 선박 중 하위 20∼30%에 속하며 분석 대상에서 제외되었다. 움직임이 없는 선박과 움직임이 있는 선박 각각의 항적 예시는 Fig. 1과 같다.

Fig. 1.

Sample trajectory plots for two vessels. a) a vessel with SOG < 2knot b) a vessel with SOG > 2knot

② 동일 선박 구분

앞서 가정한 기준으로 유효한 움직임을 가진 선박들을 구별하였으나, 각 통신 시스템에서의 항적 예측 오차에 대한 비교 분석을 위해서는 동일 선박, 즉 AIS와 LTE-M 송·수신 장치를 모두 장착한 선박에서 발생한 두 시스템의 항적 데이터를 선별하여야 한다. 구분된 유효 선박 데이터 중 동일 선박을 구분하기 위해 해시함수로 암호화된 선박 MMSI 값을 활용하였다. 동일 입력값에는 동일 해시값을 출력하는 해시함수의 특성상 AIS와 LTE-M 데이터에서 암호화된 선박 MMSI 값이 같으면 분석 대상 선박으로 간주하여 해당 선박들의 항적 데이터를 선별하고 이외의 선박들은 분석 대상에서 제외하였다. 이에 해당하는 선박은 총 560척으로, 동일 선박에 대한 두 시스템 데이터의 항적 그래프의 예시는 Fig. 2와 같다.

Fig. 2.

A Sample trajectory plot for the same vessel with AIS and LTE-M

2) 선박별 유효 항적 데이터 구분

수집된 데이터 내에는 선박별 입·출항 시간에 대한 정보가 없기에 항적 데이터 분석을 통해 유효한 운행 구간을 구분하고, 대기 시간에 대한 위치 데이터 및 통신 오류에 의한 이상 데이터 등을 제거해야 한다. 이를 감안하여 이전 항적과의 송·수신 시간 간격이 1시간 이상인 시점, 그리고 이전 항적과의 위도 및 경도값 차이가 각 시스템의 항적 데이터를 기준으로 한 분포의 상위 10% 이상인 시점을 상태 변화 시점으로 가정하고, 이를 기준으로 하나의 시점과 다음 시점 사이에 있는 구간을 유효 구간으로 구분하였다. 각 선박에 적용한 결과, 하나의 선박에 대한 데이터는 AIS는 5,800개, LTE-M은 10,687개를 최대로 포함하고 있는 것을 확인하였다. 해당 데이터의 송·수신 시간 간격 분포와 측정 데이터간 거리 분포는 Table 4Table 5에서 확인되는 것과 같이 각각 Table 2Table 3 대비 평균치는 20∼30% 감소하고 특히 데이터간 편차가 크게 줄었음을 알 수 있었다. Fig. 3에서 동일 선박에 대한 유효 항적 데이터 구분 전후의 항적 데이터의 예시를 확인할 수 있다.

Distribution of the time interval per vessel in preprocessed data

Distribution of the distance interval per vessel in preprocessed data

(Unit: km)

Fig. 3.

Sample trajectory plots for the same vessel a) Data before preprocessing b) Data after preprocessing

5.3 데이터 예측 결과

1) 오차 분석 결과

전처리된 선박 항적 데이터를 기준으로 식 (2)를 활용해 각 항적의 다음 측정 시각에 대한 예측 항적을 계산하였다. 이때 다음 측정 시각은 각 항적의 바로 다음 항적이 송·수신된 시각으로서 분석 대상 데이터의 실제 송·수신된 시각을 활용하였다. 항적 예측 후에는 식 (3), (4)를 활용하여 동일 시간에 대한 예측 항적과 실제 항적과의 오차를 계산하였다. 유클리드 거리를 기준으로 한 오차 단위는 각도, 하버사인 거리를 기준으로 한 오차 단위는 km이다. 전체 선박 데이터의 오차값에 대한 분포는 Table 6와 같다. 하버사인 오차를 기준으로 AIS 대비 LTE-M 오차의 평균은 약 6배 적은 약 0.017km였고, 표준편차는 약 29배 적은 약 0.0052로 전체적으로 유사한 수준의 오차가 있음을 확인할 수 있었다. 그러나 두 시스템 모두 오차의 최대값이 AIS에서는 약 56km, LTE-M에서는 약 4km로 예측 정확도가 다소 떨어지는 것을 확인하였다. 이러한 오차는 운항 중 급변침 등의 궤적을 그린 선박에 의해 유발된 것으로, 활용한 항적 예측 알고리즘 자체의 한계와 맞물려 발생한 것으로 보인다.

Distribution of prediction error

2) 회귀분석 결과

두 시스템의 예측 오차가 평균 6배 이상 차이 나는 원인을 분석하기 위하여 예측 오차에 대한 회귀분석을 실시하였다. 종속변수는 유클리드 오차, 하버사인 오차 두 가지로 설정하였고, 그에 대한 독립변수는 통신망 종류(LTE-M일 경우 1, AIS일 경우 0), 대지속도, 대지침로, 송·수신 간격으로 설정하여 각 종속변수에 대한 회귀분석을 실행하였다.

예측 오차에 대한 회귀분석 결과는 Table 7에서 확인할 수 있다. 모델 (1)은 유클리드 오차에 대한 회귀분석 모델로 설정하였으며, 오차값 변화에 가장 많이 영향을 주는 독립변수는 데이터간 송·수신 시간 간격으로 확인되었다. 송·수신 시간 간격이 0.02초 길어질수록 예측 오차가 1° 증가하는 것으로 나타났다. 그러나 그 외의 변수들인 통신망 종류나 선박의 대지속도, 대지침로 등은 p 값이 높으며 모델 자체의 설명력이 낮았다. Table 4에서 확인한 전처리된 항적 데이터의 송·수신 시간 간격의 분포와 Table 6에서 확인한 예측 오차의 분포에서 평균과 표준편차에 비해 큰 최댓값이 있음을 감안하였을 때, 이들 변수에 대한 로그변환으로써 각 변수의 분포의 정규성을 높여 모델 (1)의 낮은 설명력을 개선할 수 있다.

Regression results for error term

모델 (1)에서 로그를 취한 하버사인 오차를 종속변수로 하고, 독립변수 중 데이터간 송·수신 간격 변수에 로그를 취한 것이 모델 (2)이다. 모델 (1)과 동일하게 데이터 송·수신 시간 간격이 가장 큰 인자였으며, 모델 (1)에 비해 높은 모델 설명력을 확보할 수 있었으나, 여전히 통신망 종류와 선박의 대지침로 변수는 p값이 높았다. 특히 통신망 종류의 p값이 높은 이유는 항적 데이터 한 개 자체로는 각 통신망의 특성을 반영하지 못하기 때문이다. 그러므로 통신망 종류 변수는 독립변수가 아닌 조절변수로 다루어야 한다. 그리고 조절변수가 독립변수와 종속변수의 상관관계에 미치는 영향을 파악하기 위해서는 상호작용항(interaction tern)이 회귀분석에 추가되어야 한다.

모델 (1)과 (2)의 결과를 종합적으로 고려하여 로그를 취한 하버사인 오차를 종속변수로, 로그를 취한 통신망 종류와 송·수신 시간 간격을 결합한 상호작용항, 그리고 통신망 종류와 대지속도값을 결합한 상호작용항을 추가한 모델 (3)을 설정하였다. 분석 결과, 상호작용항의 계수값을 근거로 LTE-M 항적 데이터인 경우 AIS 대비 오차에 대한 송·수신 시간 간격의 영향이 약 17% 적은 것을 확인할 수 있다. 다만 통신망 종류와 대지속도값을 결합한 상호작용 변수는 p값이 높아 통계적인 의미가 없었다. 이러한 회귀분석 결과를 종합하였을 때, 조밀한 시간 간격으로 수집되는 특성의 LTE-M 데이터를 기반으로 한 항적 예측이 AIS 데이터로써 수행한 것에 비해 정확하다고 할 수 있다.

6. 결 론

본 연구에서는 다른 종류의 통신망으로 수집되는 항적 데이터를 비교 분석하고, 두 가지 항적 데이터를 기반으로 실제 해상 안전사고 예방에 활용될 수 있는 항적 예측을 수행하였다. 예측 결과를 분석하여 기존 AIS에서 수집된 데이터에 비해 LTE-M을 활용하여 수집된 데이터의 시간 및 지리적 간격이 조밀하고 균일하며, 이러한 특성으로 인해 항적 예측 오차가 비교적 작은 것을 알 수 있었다. 특히 데이터 송·수신 시간으로, 해당 변수는 통신망 종류에 따라 그에 대한 영향이 달라지는데 LTE-M에서 수집된 데이터의 경우 AIS 대비 그 영향이 17% 적은 것을 확인하였다.

본 연구에서는 AIS와 LTE-M 항적 데이터에 대한 분석을 넘어서 다양한 해사 안전 관리 서비스에 광범위하게 활용할 수 있는 항적 예측을 수행함으로써 LTE-M의 적용 가치를 실증하였다. 본 연구에서는 비교적 단순한 선박 거동 기반 예측 알고리즘을 항적 예측에 적용하였고, 실험용 데이터로서 짧은 기간에 수집된 항적 데이터를 활용하는 데 그쳤으나 향후 연구에서는 보다 장기간에 수집된 항적 데이터를 대상으로 다양한 항적 예측 알고리즘을 활용하여 비교 연구를 진행한다면 본 연구의 논지를 발전시킬 수 있을 것이다. 나아가 본 연구가 항적 예측 정확도에 영향을 미치는 주요 변수들로서 지적한 데이터 송·수신 시간 간격 등을 활용한 파생변수나 입출항기록, 해역 정보 등 여타 해사 관련 데이터와의 융·복합을 통해 창출한 새로운 변수들을 예측 과정에 투입함으로써 발전된 수준의 항적 예측을 구현할 수도 있을 것이다.

후 기

본 논문은 해양수산부 재원으로 국가연구개발사업인 “지능형 해상교통정보 서비스 기반의 해상디지털 정보활용 기술개발”에 의해 수행되었습니다(1525012276).

References

1. Cho KM, et al. 2013;A MAC Protocol for Integrated Service in the Multi-Hop Ad-Hoc Maritime Communication Network. Journal of Korean Institute of Communication and Information Sciences 38(7):603–611.
2. Jeong NJ. 2018. LTE-based High-speed Maritime Wireless Communication System for e-Navigation. Dissertation. Pai Chai University.;
3. Jeong NJ, et al. 2018;LTE based High-speed Maritime Wireless Communication(LTE-M) Router System. Journal of the Korea Institute Of Information and Communication Engineering 22(3):542–547.
4. Jo SW, Shim WS. 2019;LTE-maritime: High-speed maritime wireless communication based on LTE technology. IEEE Access 7:53172–53181.
5. Jo SW, et al. 2018;A validation of field test results for LTE-maritime. IFAC-PapersOnLine 51(29):153–158.
6. Kim BY, Shim WS. 2021;Performance Analysis on Speed Quality of LTE-Maritime Considering Scenario of e-Navigation Service and the Modulation Coding Scheme(MCS). Journal of Korean Navigation and Port Research 45:360–365.
7. Last P, et al. 2014;Comprehensive analysis of automatic identification system (AIS) data in regard to vessel movement prediction. The Journal of Navigation 67(5):791–809.
8. Lim HT, Cho YG. 2018;A Study on Policy Making for e-Navigation from the Viewpoint of a Maritime Digital Communication Network. Journal of the Korean Society of Marine Environment & Safety 24(6):679–685.
9. Millefiori LM, et al. 2016;Modeling vessel kinematics using a stochastic mean-reverting process for long-term prediction. IEEE Transactions on Aerospace and Electronic Systems 52(5):2313–2330.
10. Oh JY, et al. 2018;Detection of ship movement anomaly using AIS data: a study. Journal of Navigation and Port Research 42(4):277–282.
11. Park OS, Kim DH. 2012;Technical Trends in Maritime Radio Communications for e-Navigation. Electronics and Telecommunications Trends 27(2)
12. Perera LP, Soares CG. 2010;Ocean vessel trajectory estimation and prediction based on extended Kalman filter. Proc. of the Second International Conference on Adaptive and Self-Adaptive System Applications, IARIA :14–20.
13. Scheepens R, et al. 2014;Contour based visualization of vessel movement predictions. International Journal of Geographical Information Science 28(5):891–909.
14. Shim WS, et al. 2021;Novel Maritime Wireless Communication based on Mobile Technology for the Safety of Navigation: LTE-Maritime focusing on the Cell Planning and its Verification. Journal of Navigation and Port Research 45(5):231–237.
15. Uney M, et al. 2019;Data driven vessel trajectory forecasting using stochastic generative models. Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing, CMRE :8459–8463.
16. Wang S, He Z. A prediction model of vessel trajectory based on generative adversarial network. The Journal of Navigation 74(5):1161–1171.
17. Yang WJ, et al. 2003;A Study on the Application Plan of Automatic Identification System. Journal of the Korean Society of Marine Environment & Safety 2003(5):69–75.
18. Yun CH, et al. 2014;Performance Analysis of Multiple Access Protocol for Maritime VHF Data Exchange System(VDES). Journal of the Korea Institute Of Information and Communication Engineering 18(12):2839–2846.
19. Zhang X, et al. 2022;Vessel trajectory prediction in maritime transportation: current approaches and beyond. IEEE Transactions on Intelligent Transportation Systems 11(11):19980–19998.

Article information Continued

Fig. 1.

Sample trajectory plots for two vessels. a) a vessel with SOG < 2knot b) a vessel with SOG > 2knot

Fig. 2.

A Sample trajectory plot for the same vessel with AIS and LTE-M

Fig. 3.

Sample trajectory plots for the same vessel a) Data before preprocessing b) Data after preprocessing

Table 1.

Collected data

AIS LTE-M
# Columns 17 19
# Rows 6,960,710 13,833,942
Max # points/vessel 19,575 15,180
# Vessel 6,482 1,959

Table 2.

Distribution of time interval per vessel

AIS LTE-M
Mean 31.06s 7.21s
Std. Div 3m 29s 57.16s
Max 12h 10m 42s 12h 2m 41s

Table 3.

Distribution of distance interval per vessel

(Unit: km)

AIS LTE-M
Mean 0.187 0.009
Std. Div 10.325 0.112
Max 6689.860 170.931

Table 4.

Distribution of the time interval per vessel in preprocessed data

AIS LTE-M
Mean 22.81s 4.97s
Std. Div 1m 3.04s 3.34s
Max 59m 44s 3m 25s

Table 5.

Distribution of the distance interval per vessel in preprocessed data

(Unit: km)

AIS LTE-M
Mean 0.091 0.028
Std. Div 0.111 0.022
Max 7.169 2.307

Table 6.

Distribution of prediction error

AIS LTE-M
Euclidean (°) Haversine (km) Euclidean (°) Haversine (km)
Mean 0.0001 0.0108 0.0000 0.0017
Std. Div 0.0016 0.15 0.0001 0.0052
Max 0.5879 55.8265 0.0376 3.8156

Table 7.

Regression results for error term

(1) Euclidean Error (2) (Log) Haversine Error (3) (Log) Harversine Error
LTE 0.000 (0.000) −0.019 (0.046) −1.009 (0.178)
Time interval 0.022 (0.006)
SOG 0.000 (0.000) 0.018 (0.003) 0.023 (0.006)
COG 0.000 (0.000) 0.000 (0.000)
(Log) time interval 0.790 (0.029)
LTE x (Log) time interval −0.175 (0.027)
LTE x SOG −0.006 (0.008)
N 821,735 821,735 821,735
F 59.32 448.57 608.25
Adjusted R2 0.096 0.348 0.350

Note: Robust standard errors, clustered by vessel, are in parenthesis.