IT InfraTree 문제 상세
문제 라이브러리로 돌아가기

Problem Detail

고속 요청 구간에서 발생한 포트 고갈 문제와 커널 튜닝

Network 원문 시나리오에서 port-exhaustion를 기준으로 근본 원인과 안전한 복구 방향을 정리하는 문제입니다.

NETWORK-002L6 StabilizeNetwork30 min집계 준비 중힌트 2개Platform Reliability
NetworkPlatform ReliabilityLevel 6Pro30 min시도 집계 준비힌트 사용률 준비평균 점수 준비

Scenario

현재 상황

짧은 시간에 많은 outbound 요청을 보내는 작업이 늘어나면서, 일부 서버에서만 간헐적으로 upstream 연결 실패가 발생합니다. ss 결과에는 TIME_WAIT가 급격히 쌓이고, ephemeral port 범위와 재사용 정책이 현재 요청 패턴을 감당하지 못하는 상태입니다.

Telemetry & Logs

조사에 쓸 단서

Focus

이 문제에서 먼저 볼 것

  • 포트 고갈 문제를 애플리케이션 오류와 커널 정책의 결합 문제로 이해합니다.
  • TIME_WAIT 누적, ephemeral port 범위, 재사용 정책을 함께 읽는 방법을 익힙니다.
  • 튜닝과 애플리케이션 연결 전략 개선을 분리해 제안합니다.

Checklist

점검 체크리스트

  1. ss, netstat, sysctl 결과로 현재 포트 사용 패턴과 TIME_WAIT 누적 상태를 확인합니다.
  2. ephemeral port 범위와 연결 재사용 전략이 요청량에 비해 충분한지 검토합니다.
  3. 애플리케이션 keepalive 전략과 커널 튜닝 중 어느 조합이 적절한지 판단합니다.

Answer Draft

원인과 복구 방향 정리하기

로그인하면 답안 제출, 힌트 공개, 노트 저장 기능을 바로 사용할 수 있습니다.

힌트 FAQ 학습 허브

Hints

막히는 지점부터 차례대로 확인하기

FAQ

같이 보면 좋은 질문

이 문제에서 원문은 그대로 읽어야 하나요?

네. 제목과 시나리오는 실제 장애 단서이므로 그대로 유지합니다. 한국어 풀이는 판단 순서와 답안 구조를 돕기 위한 보조 설명입니다.

기술 용어와 명령어는 번역해야 하나요?

아니요. DNS, route, firewall 같은 기술 용어와 ping 같은 명령어는 영어 원문을 유지하세요.

답안에서 가장 중요한 기준은 무엇인가요?

사용자 영향, 관찰한 근거, 최근 변경, 안전한 복구 방향을 한 번에 연결해 설명하는 것입니다.

Field Notes

현장에서 본 비슷한 케이스

아직 공개된 검수 현장 메모가 없습니다.

비슷한 장애를 겪었다면 아래 양식으로 새 메모를 제안할 수 있습니다.

Notes

개인 노트