apcc logo

이상기후 예측을 위한 인공지능 기술 개발(I)

저자
김미애, 이윤영, 정유란
 
작성일
2026.01.12
조회
72
  • 요약
  • 목차

기후변화로 인해 날로 빈번해지는 기후 관련 위험·재난에 대비하기 위한 계절 내 시간 규모의 이상기후 예측 기술 개발은 매우 시의적절하다. 본 과제는 동아시아 영역의 이상고온(Anomalously High Temperature), 폭우(Heavy Rainfall), 해양열파(Marine HeatWave)에 대한 선행 3-4주 주별 예측 인공지능 기반 원형 모델 개발을 목표로 한다. 이상고온은 유럽중기예보센터(ECMWF,European Centre for Medium-Range Weather Forecasts) 예측 앙상블의 오차 보정방식을 적용하고, 폭우·해양열파는 최신 가용 관측 자료를 활용한 직접 예측 방식으로 접근하였다. ECMWF 역학 모델 성능을 기초선으로 삼아, 유의미한 성능을 보이는 인공지능 모델 setup을 탐색하고 그 결과를 제시한다.

 

이상고온의 경우 ECMWF S2S 예측 앙상블 오차 보정을 통한 이상치 탐지 성능이 라벨링 방식에 따라 어떻게 달라지는지를 정량적으로 평가하였다. ECMWF-S2S(2024 버전)의 3주 평균 최고기온(TMAX)과 ERA5 재분석 자료를 대상으로, 90백분위수 기반의 이진 라벨과 75·90백분 위수 기반의 다중 클래스 라벨을 각각 적용하였다. 이후 U-Net과 Attention U-Net 두 가지 딥러닝 구조에 훈련하여, 고온 패턴의 공간 확률 분포를 예측하도록 설계하였다. 18년(2004~2021)년의 학습 기간과 2년(2022~2023)의 테스트 기간을 설정하여 모델을 평가한 결과, ECMWF 자체 Brier Skill Score(BSS)는 약  0.2 수준으로 낮았으나, 딥러닝 모델은 전체적으로 낮은 BSS에도 불구하고 ECMWF 대비 양(+)의 개선이 나타나는 격자들이 존재하였다. 특히 이진 라벨 + Attention U-Net 조합이 관측 패턴과 가장 유사한 확률 분포를 재현하며, BSS도 상대적으로 높은 개선 폭을 보였다. 이는 고온 탐지 문제에서 라벨 정의와 Attention 메커니즘이 매우 중요한 역할을 함을 시사한다.

 

다음으로, 격자점 단위의 선행 3-4주 폭우를 예측하기 위한 딥러닝 기반 초기 모형을 개발하였다. 연구는 Multi-task learning의 효과, 변수 조합과 스케일 분해 방식, 모델 구조가 예측 성능에 미치는 영향을 중심으로 수행되었다. Multi-task learning 기법은 강수량과 극한 강수일수를 함께 학습함으로써 강수의 시간적 변동성을 효과적으로 포착하고 주요 예측 성능 지표(CSI, TCC 등)에서 개선된 결과를 보였다. 또한 10-60일 대역 및 장주기 필터링 변수를 포함할 때 예측력이 향상되어 계절내 변동성과 배경장 변수를 분리하여 활용하는 것이 극한 강수 예측에 중요함을 확인하였다. ResNet에 LSTM을 결합한 구조는 시공간 패턴 인식에 강점을 보여 두 모델의 결합 효과가 검증되었다. 향후에는 확률 예측과 설명가능한 인공지능(XAI) 기법을 도입하여 예측의 불확실성을 정량화하고 폭우 주요 예측 요인을 분석하고자 한다.

 

마지막으로, 동아시아 해역 고수온 예측을 위해 이 지역을 포함하는 광역 지역의 해양 열용량·염분, 대기 표면 바람·온도, 강수 등 해양·대기 기본 관측 정보를 학습하여 주요 시그널을 추출하고, 이를 3주 이후의 동아시아 고수온 패턴으로 확장하는 UNet 구조의 원형 모델을 고안하였다. 개발 과정에서는 훈련 변수뿐 아니라 손실 함수와 모델 구조에 대한 다양한 민감도 조건을 적용하고, 교차 조건이 반영된 모든 모델을 사후에 종합 비교하여 선행 3주 동아시아 해역 고수온 예측의 최적 setup을 도출하였다. 결과적으로, 2.5도 해상도의 비교적 좁은 지역 도메인에서 기본 변수 외에 플럭스·정적 변수고수온 해양 정보를 적층하고, 이를 2:1 의 훈련/검증 샘플 비율로 swinUNet 모델에 학습·검증하는 방식이 가장 우수한 고수온 탐지력을 보였다. 또한 고수온 현상이 나타난 격자에 가중치를 부여하는 손실 함수 적용과, 하천유량 정보를 독립된 레이어로 추가하는 멀티모달 방식이 성능 개선에 기여하였다. 제시한 setup 의 모델들은 2023년 52주 테스트 기간 동안 평균적으로 ECMWF를 상회하는 고수온 탐지 성능을 보였다. 또한, 비슷한 조건의 고성능 개별 모델들의 앙상블 평균이 안정적이고 유의미한 성능을 보여 향후 다중 모델 인공지능 앙상블 예측의 가능성을 확인할 수 있었다.

 

원형 모델 개발 과정에서 얻어진 동아시아 기후 극한현상에 대한 자료와 통계 분석 결과를 체계화하고 공유하기 위해 저장소(GitHub)를 활용하였다. 이 저장소는 동아시아 지역(21-48°N, 114-141°E)을 대상으로 한 기후 극한현상 저장소(EastAsiaClimateExtremes, https://github.com/yyalexlee/EastAsiaClimateExtremes)를 구축하고, 이상고온(AHT), 폭우(HR), 해양열파(MHW) 등의 주요 극한 현상을 장기간 및 격자 기반으로 정량화한 자료와 시각화 코드를 제공한다. ERA5, OISST, ECMWF-hindcast(버전 2016  및 2024)를 활용하여 일별 및 주별 단위의 기온, 강수, 해수면온도 자료의 원시 시계열, 기후 평년값, 90/95백분위 임계값을 산출하였다. 이를 기반으로 지속일수(D), 허용간극(G), 규칙(D3G5 등)을 적용해 극한 이벤트의 발생 빈도, 지속기간, 평균 및 최대 강도, 영향지수 등 세부 프로파일과 주 단위 extremeness 지수(Extreme Days, Mean Intensity, Max Intensity, Impact Factor)를 생성하였다. 또한, 제공된 분석 코드는 시계열 그래프, 열지도(heatmap) 및 장기 평균 2차원 분포 등 다양한 형태의 시각화를 지원한다. 데이터(DATA) 및 코드(CODES) 인벤토리는 동아시아 기후 극한의 기작 분석, 장단기 예측, 그리고 AI 기반 기후 예측 모델의 학습 및 라벨링 자료로 활용될 수 있는 기반 자원으로서 구축되었다. 해당 자료와 도구의 통합 제공을 통해 기후 극한현상의 특성 진단과 예측 정확도 향상 연구에 실질적인 기여가 가능할 것으로 기대한다.