IT InfraTree 문제 상세
문제 라이브러리로 돌아가기

Problem Detail

/var 파티션 급증 원인을 du와 lsof로 좁혀가기

Linux 원문 시나리오에서 du를 기준으로 근본 원인과 안전한 복구 방향을 정리하는 문제입니다.

LINUX-002L3 ProbeLinux24 min집계 준비 중힌트 2개Foundation Ops
LinuxFoundation OpsLevel 3무료24 min시도 집계 준비힌트 사용률 준비평균 점수 준비

Scenario

현재 상황

운영자가 대용량 로그 파일을 삭제했지만 /var 사용량은 전혀 줄지 않았습니다. du 기준으로는 공간이 비어 보이지만, 실제로는 프로세스가 삭제된 파일 핸들을 붙잡고 있어 파티션 사용량이 회수되지 않는 상태입니다.

Telemetry & Logs

조사에 쓸 단서

Focus

이 문제에서 먼저 볼 것

  • 파일 시스템 사용량과 프로세스가 점유한 열린 파일을 함께 해석합니다.
  • du와 lsof 결과가 왜 다를 수 있는지 이해합니다.
  • 서비스 재시작이 필요한 상황과 로그 회전 정책 개선을 분리해 판단합니다.

Checklist

점검 체크리스트

  1. du 결과로 실제 디렉터리 점유 위치를 확인하고, 차이가 크면 열린 파일 핸들을 의심합니다.
  2. lsof +L1 또는 삭제된 파일 핸들을 통해 공간을 붙잡고 있는 프로세스를 찾습니다.
  3. 서비스 재시작 또는 로그 reopen이 필요한지, 로그 회전 정책이 정상인지 검토합니다.

Answer Draft

원인과 복구 방향 정리하기

로그인하면 답안 제출, 힌트 공개, 노트 저장 기능을 바로 사용할 수 있습니다.

힌트 FAQ 학습 허브

Hints

막히는 지점부터 차례대로 확인하기

FAQ

같이 보면 좋은 질문

이 문제에서 원문은 그대로 읽어야 하나요?

네. 제목과 시나리오는 실제 장애 단서이므로 그대로 유지합니다. 한국어 풀이는 판단 순서와 답안 구조를 돕기 위한 보조 설명입니다.

기술 용어와 명령어는 번역해야 하나요?

아니요. systemd, journal, permission 같은 기술 용어와 journalctl 같은 명령어는 영어 원문을 유지하세요.

답안에서 가장 중요한 기준은 무엇인가요?

사용자 영향, 관찰한 근거, 최근 변경, 안전한 복구 방향을 한 번에 연결해 설명하는 것입니다.

Field Notes

현장에서 본 비슷한 케이스

아직 공개된 검수 현장 메모가 없습니다.

비슷한 장애를 겪었다면 아래 양식으로 새 메모를 제안할 수 있습니다.

Notes

개인 노트