IT InfraTree 문제 상세
문제 라이브러리로 돌아가기

Problem Detail

HPA가 붙어 있는데도 스케일이 오르지 않는 metrics 파이프라인 문제

Kubernetes 원문 시나리오에서 hpa를 기준으로 근본 원인과 안전한 복구 방향을 정리하는 문제입니다.

K8S 007L5 RecoverK8s26 min집계 준비 중힌트 3개Platform Reliability
K8sPlatform ReliabilityLevel 5Pro26 min시도 집계 준비힌트 사용률 준비평균 점수 준비

Scenario

현재 상황

HPA가 붙어 있는데도 스케일이 오르지 않는 metrics 파이프라인 문제 상황에서 메트릭 수집 경로와 오토스케일 기준을 함께 확인하는 과정를 중심으로 원인을 좁혀가는 시나리오입니다.

Telemetry & Logs

조사에 쓸 단서

Focus

이 문제에서 먼저 볼 것

  • 이벤트, 로그, 스펙 불일치를 빠르게 읽기
  • 서비스 경로와 스케줄링 조건을 함께 점검하기
  • 장애 증상과 리소스 정의를 연결해서 원인을 좁히기

Checklist

점검 체크리스트

  1. 증상이 Pod, Service, Ingress, Node 중 어디에 있는지 먼저 구분합니다.
  2. kubectl describe, logs, events 결과를 같은 타임라인으로 정리합니다.
  3. 재현 조건과 설정 오타를 분리해서 확인합니다.

Answer Draft

원인과 복구 방향 정리하기

로그인하면 답안 제출, 힌트 공개, 노트 저장 기능을 바로 사용할 수 있습니다.

힌트 FAQ 학습 허브

Hints

막히는 지점부터 차례대로 확인하기

FAQ

같이 보면 좋은 질문

이 문제에서 원문은 그대로 읽어야 하나요?

네. 제목과 시나리오는 실제 장애 단서이므로 그대로 유지합니다. 한국어 풀이는 판단 순서와 답안 구조를 돕기 위한 보조 설명입니다.

기술 용어와 명령어는 번역해야 하나요?

아니요. Pod event, rollout, Service/Endpoint 같은 기술 용어와 kubectl 같은 명령어는 영어 원문을 유지하세요.

답안에서 가장 중요한 기준은 무엇인가요?

사용자 영향, 관찰한 근거, 최근 변경, 안전한 복구 방향을 한 번에 연결해 설명하는 것입니다.

Field Notes

현장에서 본 비슷한 케이스

아직 공개된 검수 현장 메모가 없습니다.

비슷한 장애를 겪었다면 아래 양식으로 새 메모를 제안할 수 있습니다.

Notes

개인 노트