안녕하세요.
오늘은 Azure 리소스에 이상 발생 시 경고 알람을 구성하는 방법에 대해 알아보겠습니다.
# Azure Monitor 란?
Azure Monitor는 클라우드 및 온-프레미스 환경에서 모니터링 데이터를 수집 및 분석하여 적절하게 대응하는 포괄적인 모니터링 솔루션입니다.
즉, Azure Monitor 라는 하나의 서비스가 있는 것이 아닌 Azure Monitor 내에는 알람 자동화, 로그 분석, 시각화 등 다양한 서비스가 존재합니다.

저희는 그중에서도 알람 기능을 활용하여 리소스에 상태 이상 발생 시에 담당자에게 메일 또는 슬랙을 전송하는 자동화 기능을 테스트해 보겠습니다.
# 배포
이제 본격적으로 알람 구성을 해보겠습니다.
저희는 Azure VM이 중지되거나 호스트 레벨 장애가 발생되었을 때 알람이 발생되게 설정하겠습니다.
먼저 Azure 포탈에서 "서비스 상태" → "Resource Health" → "리소스 상태 경고 추가" 를 클릭합니다.

범위에 들어가서 얼럿을 만들고자 하는 리소스를 선택합니다.
저는 테스트용 VM을 하나 선택했습니다.
원하면 리소스 그룹단위로 정할 수도 있고 구독 단위로 정할 수도 있습니다.
"이후 리소스 모두 포함" 의 경우 추후 리소스 그룹 또는 구독 내에 생기는 모든 리소스를 포함시키겠다는 의미입니다.
(저는 해제하겠습니다.)

다음으로 "조건"에 들어와 설정합니다.
이벤트 상태 : 어떤 이벤트 상태일 때 알람을 발생시킬 것인가
→ Active : 현재 리소스에 장애나 문제가 발생된 상태
→ In Progress : Azure 측에서 해당 문제를 인식하고 수정 또는 복구 작업을 진행 중인 상태
→ Resolved : 장애가 해결된 상태
→ Update : 기존에 발생한 이벤트에 대해 새로운 정보나 메시지가 추가된 상태
(저는 단순 장애가 발생되었다는 사실만 알람으로 발송하려는 것이기에 여기서 Active만 선택하겠습니다.)

현재 리소스 상태는 말 그대로 현재 리소스 상태입니다.
"Degraded", "Unavailable" 을 선택하겠습니다.

이전 리소스 상태는 이전 리소스 상태를 의미하며 "Available" 을 선택합니다.
그러면 해당 알람은 이전에는 Available 상태였으나 현재 Unavailable 또는 Degraded 상태가 되었을 때 알람 발송이 됩니다.

이유 유형
→ Platform Initiated : Azure 인프라 측의 문제나 작업으로 인해 리소스 상태가 변한 경우입니다.
→ Unkown : 리소스 상태 변화의 명확한 원인을 즉시 식별할 수 없는 경우입니다.
→ User Initiated : 권한을 가진 사용자가 직접 수행한 작업으로 인해 리소스 상태가 변한 경우입니다.
(저는 3개 모두 선택하겠습니다. 그러면 사용자에 의도했거나 의도하지 않았거나 모든 상태에 대한 알람이 가능합니다.)

다음은 "작업" 으로 넘어갑니다.
작업은 조건이 달성되었을 때 무슨 행동을 할지 선택하는 것인데요.
일단 없으니 새로 만들어주겠습니다.

"작업 그룹 만들기"를 선택하면 아래와 같은 화면으로 넘어오는데요.
기본적인 이름과 리소스 그룹 선택 후 다음으로 넘어갑니다.

알림 형식은 두 가지가 있는데 "메일/SMS 메시지/푸시/음성" 을 선택합니다.
"메일 Azure Resource Manager 역할"의 경우 특정 Azure RBAC 권한을 가진 사용자에게 알림을 보내는 기능입니다.
예를 들어 앞서 저희가 설정한 리소스에 대해 소유자 권한을 갖고 있는 모든 사람에게 메일을 보낼 수 있습니다.

"메일/SMS/ 메시지/푸시/음성" 을 선택하면 옆에 아래와 같은 설정창이 나오는데 메일 선택 후 메일을 입력합니다.


이제 작업 그룹을 생성합니다.
참고로 작업의 경우 조건이 트리거가 되었을 때 다른 Azure 서비스와 연동할 수 있는 기능입니다.
예를 들어 Logic App과 연결하여 슬랙 또는 텔레그램을 발송하는 것도 가능합니다.

작업 그룹이 생성되었으면 다시 원래 경고 규칙 만들기로 자동으로 돌아오게 됩니다.

이름과 경고 규칙을 선택 후에 생성합니다.

생성 후 "모니터" → "경고 규칙" 에 들어가면 저희가 생성한 규칙이 보입니다.


이제 저희가 설정한 VM으로 돌아와 VM을 중지해 보겠습니다.
정상적으로 메일이 온 것을 확인 가능합니다.

모니터 경고에서도 정상적으로 발생된 로그를 확인 가능합니다.

감사합니다.
*참고 자료
https://learn.microsoft.com/ko-kr/azure/service-health/resource-health-alert-monitor-guide
Azure Portal의 Resource Health 경고 - Azure Service Health
리소스 상태 경고는 Azure 리소스를 사용할 수 없게 되면 사용자에게 알립니다.
learn.microsoft.com
https://learn.microsoft.com/ko-kr/azure/azure-monitor/alerts/action-groups
Azure Monitor에서 작업 그룹 만들기 및 관리 - Azure Monitor
작업 그룹을 만들고 관리하는 방법을 알아봅니다. 메일, 웹후크 및 Azure Functions와 같이 작업 그룹이 사용하도록 설정하는 알림 및 작업에 대해 알아봅니다.
learn.microsoft.com