2-8. 장애 관리

OAM Client Framework – 목차

■ 운용관리에 관한 이론적 고찰
1-1. OAM의 정의  1-2. EMS의 정의  1-3. OAM 표준화 동향  1-4. 3GPP 32 Series

■ OAM 프레임워크
2-1. OAM 프레임워크 필요성  2-2. OAM 시스템의 구성  2-3. OAM 요구사항  2-4. OAM 배포 아키텍쳐  2-5. OAM을 위한 Database의 구성 2-6. OAM 인터페이스  2-7. 구성 관리  2-8. 장애 관리  2-9. 성능 관리  2-10. 보안 관리

■ OAM 클라이언트 프레임워크
3-1. OAM Client 프레임워크 개요  3-10. 효과분석  3-2. 개발방법  3-3. 요구사항  3-4. 산출물 정의  3-5. 개발환경  3-6. 아키텍쳐 3-7. UI 정의  3-8. 프레임워크의 개발  3-9. 프레임워크를 사용한 개발

2-8. 장애 관리

피 관리 시스템의 상태는 항상 감시되어야 하며, 장애가 발생하면 OAM Agent는 이를 감지하고 즉시 망 관리 시스템(NMS)와 OAM 클라이언트에 전달하여 한다. 장애를 빨리 조치하지 않으면 또 다른 논리적 장애 또는 물리적 장애가 발생할 수도 있기 때문에 OAM 클라이언트로 통보된 장애는 알람의 형태로 운용자에게 보고되어야 하며 운용자는 장애에 대한 알람을 인지하고 이에 상응하는 조치를 취해야 한다.[주:3GPP TS 32.111-1, “Telecommunication management; Fault Management”]

피 관리 시스템은 스스로 장애를 검출할 수 있어야 하기 때문에 측정 대상에 대한 점검, 측정 카운터, 임계값에 대한 정의가 필요하다. 측정 임계치는 일반적으로 피 관리 시스템을 제조한 업체에서 미리 정의한 값을 사용하며 구성 관리를 통해 변경할 수 있다.

이동통신망에서의 장애의 종류는 아래와 같이 구분할 수 있으며 ITU-T 권고 X.733에도 정의되어 있다.

  1. 하드웨어 장애 : 피 관리 시스템의 물리적 자원이 오작동. 심각한 서비스 중단을 야기할 수 있으므로 장애의 해제는 운용자가 직접하여야 하는 ADMC 장애이다.
  2. 소프트웨어 장애 : 소프트웨어의 서브 시스템의 내부 모듈에서 발생할 수 잇는 오류로서 프로토콜 수준의 오류, 예외 처리 오류, Database 오류 등이 포함된다.
  3. 기능 장애 : 피 관리 시스템의 소프트웨어 모듈에 기능적 문제가 있음을 나타낸다. 잠재적으로 서비스 제공에 문제가 발생할 수 있는 장애이다.
  4. 처리 능력 저하 : 망의 혼잡 또는 과부하 상태로 인해 피 관리 시스템의 기능의 일부 또는 전체에 대한 손실이 발생하는 장애이다.
  5. 연결 장애 : 피 관리 시스템이 다른 망 요소들과의 정상적인 통신이 실패하여 발생하는 장애이다.

장애가 검출되면 OAM 클라이언트에 보고되어야 하며, 장애의 경중에 따른 가시 알람, 가청 알람의 형태로 운용자에게 노출되어야 한다. 가청 알람은 경보음과 함께 장애의 종류를 음성으로 알려주는 기능을 말하며, 가시 알람은 OAM 클라이언트 화면에 알람의 대상과 알람의 등급을 시각적인 형태로 보여주는 기능이다. 알람의 등급은 ITU-T 권고 X.733에 의하면 아래와 같이 분류될 수 있다.

  1. 알 수 없음(indeterminate) : 장애의 상태를 알 수 없음을 의미.
  2. 경고 (warning) : 장애는 아니지만 장애에 준하는 위험을 알려줌.
  3. 일반 장애 (minor) : 피 관리 시스템에 큰 영향을 미치지 않는 장애. 가시 알람을 위해 노란색을 사용한다.
  4. 긴급 장애 (major) : 피 관리 시스템에 큰 영향을 미치는 장애. 가시 알람을 위해 분홍색을 사용한다.
  5. 주요 장애 (critical) : 피 관리 시스템에 치명적인 영향을 미치는 장애. 가시 알람을 위해 빨간색을 사용한다.

장애에 의한 알람은 기존에 발생한 알람과 비교하여 신규(new), 변경(changed), 해제(cleared)로 구분할 수 있다. 피 관리 시스템에 장애가 발생하였고 기존에 같은 관리 대상의 장애가 아니면 신규(new)장애로 구분되어 OAM 클라이언트에 전달되어 새로운 가시 알람과 가청 알람을 발생한다. 하지만 발생된 장애의 등급이 더 높아졌다거나 장애의 속성을 나타내는 파라메터가 바뀌었을 때는 변경(changed)된 장애로 OAM 클라이언트에 전달되어 기존 알람 정보가 갱신된다. 발생한 장애는 자동 또는 수동적으로 해결될 수 있으며 해제(cleared) 정보를 OAM 클라이언트에 전달하여 가청 알람과 가시 알람을 해제한다.

사용자 삽입 이미지

[장애 처리 절차]

장애는 해제(cleard)되는 방식에 따라 ADAC 장애와 ADMC 장애로 구분할 수 있다. ADAC (Automatically Detected and Cleared) 장애는 피 관리 시스템에서 발생한 장애가 복구되었을 때 이에 대한 알람도 자동으로 해제되는 장애이다. ADAC 장애는 알람이 발생 후에 자동적으로 해제되므로 운용에 방해를 최소화하여 주지만, 운용자가 장애에 대한 알람을 인지하지 못할 수도 있으므로 심각한(Critical) 장애가 아닌 경우에 사용하여야 한다. ADMC (Automatically Detected and Manually Cleared) 장애는 피 관리 시스템에서 발생한 장애는 자동으로 검출되지만, 해제는 자동으로 처리되지 않는다. 따라서 운용자는 장애에 대한 조치를 취한 후에 수동으로 해제하여야 한다. ADMC 장애는 OAM Agent가 장애 해제를 판단할 수 없거나, 하드웨어 장애와 같이 운용자가 반드시 장애를 인지하고 조치를 취해야 하는 장애이다.

CC BY-NC-ND 2.0 KR

이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. 크리에이티브 커먼즈 라이선스

저작권과 관련된 파일요청 및 작업요청을 받지 않습니다.

댓글 남기기