Ⅰ. 서론 항공안전이란 지속적인 위해요인의 발굴과 위 험관리를 통하여 인명피해나 재산 손실을 야기할 수 있는 위험을 수용 가능한 수준 이하로 유지하는 것을 말한다. 또한 항공안전 위해요인은 사고, 준 사고 및 항공안전을 해치거나 해칠 우려가 있는 잠 재적인 원인 또는 요인을 뜻한다[1]. 시스템 분석 또는 운영 단계에서 발견된 항공안 전 위험 분석을 위해서는, 안전활동에서 수집된 정 보로부터 사후적(Reactive) 또는 사전적(Proactive)으 로 위해요인, 발생 가능성, 심각도 등을 분석하여 잠재적 위험을 분석하고 정량화한다. 하지만, 이 러한 방식은 항공안전의 위험을 예방한다는 측면 에서 한계가 있으며, 항공비행자료(Flight Data)의 모니터링을 통한 예측적(Predictive) 방식으로 위해 요인을 식별할 필요가 있다. 항공산업은 과거의 기계적 결함을 거쳐 현대에 는 종합적 결함을 식별하고, 예방하여 항공사고와 사고율을 줄이기 위한 다양한 접근을 시도하고 있다. 국제민간항공기구(ICAO)는 항행 안전과 사고 예방을 위한 국제적 안전 표준 및 기준을 마련하 여 193개의 체약국이 따를 것을 권고하고 있으며 (ICAO Doc 10004, 2016), 전반적 안전관리 및 항공 안전 향상을 위해 항공안전관리시스템(SMS: Safety Management System)의 실시를 의무화하였다. 인천국제공항의 SMS에 따르면 위해요인 식별은 다음과 같은 경우에 시행한다. • 안전정보에서 사건의 원인, 불안전 상황, 위 험의 전조가 기존에 확인되지 않았던 새로운 사항이 발견될 경우 • 기존에 확인되지 않았던 새로운 비정상 상태 및 운영 상태가 발견되고, 그 원인과 영향도 를 평가할 수 없는 경우 • 정기적인 안전성과 모니터링 결과 설정된 관 리범위를 초과한 경우 • 위험경감을 위한 새로운 안전대책, 또는 수 정조치가 시행된 경우 • 조직의 변화, 규정의 변화, 새로운 기기의 도 입 등 변화가 발생한 경우 이와 같이, 정상적인 비행 운영 상태에서 기존에 없던 새로운 사항 및 비정상 상태, 즉 이상치를 탐 지(Anomaly Detection)하는 것은 항공안전 위해요인 식별에 중요한 역할을 한다. 이상치 탐지를 이용하 여 특정 상황에서 비정상 비행의 원인이 되는 요소 (Causal Factor)를 분석함으로써 항공안전 위험관리 가 가능하다. 이상치 검출은 항공 분야뿐만 아니라 다양한 분야에서 기계학습(ML: Machine Learning) 과 통계적 방법을 이용하여 연구가 진행되었다. 최 근 딥러닝(Deep Learning) 분야에서는 빅데이터의 특성상 데이터 자체를 AI가 분석하여(Data-driven) 정상 상태에서 이상치를 검출해내는 연구가 진행 되고 있다. Ⅱ. 이상치 탐지 학습 모델 이상치 탐지란 정상과 비정상 샘플을 구별해내 는 문제를 의미하며, 제조, CCTV, 의료 영상, 소 셜네트워크 등 다양한 분야에 활용되고 있다. 이상 치 검출은 Novelty 검출과 Outlier 검출로 구분할 수 있으며, Novelty는 데이터에서 새롭거나 관측되지 않은 패턴을 의미하며, Outlier는 데이터에 오염이 발생했을 가능성이 있는 샘플을 의미한다. 항공 분 야에서 이상치 검출은 Outlier를 검출하는 것으로 정의하며, 항공안전에 위해가 있을 상황을 야기하 는 다음의 3가지 유형을 감지하는 것을 목적으로 한다[2]. • 지점(Point): 비교 대상이 되는 나머지 데이터 지점들과 큰 차이를 보이는 데이터 지점 • 그룹(Collective): 개별 지점들은 이상치가 아 니지만, 데이터 그룹이 전체적으로 이상치를 나타내며, 순차적이거나 공간적인 데이터에 서 주로 발생 • 상황(Contextual): 특정 상황(Context) 및 조건 (Condition)에서 하나의 데이터 샘플이 이상 치를 보이며, 시계열 또는 위치 등에서 주로 나타남 시계열 데이터에 주로 적용이 되는 그룹형 또는 상황형 이상치 검출이 항공 분야와 관련이 있으며, 이상치 검출의 학습 모델은 데이터의 특성(레이블 유무, 데이터 속성의 개수 및 타입, 데이터 용량)과 검출 결과(레이블, 스코어) 등에 따라 달라진다. 또 한 데이터 특성이 연속적(Continuous)인지 범주형 (Categorical)인지에 따라 상이한 통계 모델이 적용 된다. 통계학적 모델 또는 ML 기반의 클러스터링 기법 등은 고차원 데이터와 데이터 희소성(Sparsity) 이라는 문제가 있을 수 있다. 항공 분야에 적합한