IT InfraTree 가이드 모음

Guides

인프라 문제 해결 가이드 모음

문제은행과 분리된 공개 가이드 페이지입니다. 오류 메시지, 증상, 체크리스트, 비교형 가이드를 먼저 보고 바로 관련 허브와 문제로 이어질 수 있게 구성했습니다.

오류 메시지형

오류 메시지 관련 가이드

x509, CrashLoopBackOff, ImagePullBackOff처럼 자주 마주치는 오류를 다룹니다.

CrashLoopBackOff 점검

CrashLoopBackOff가 뜰 때 가장 먼저 볼 것

CrashLoopBackOff 원인, Kubernetes 재시작 반복, readiness와 liveness 차이, 이전 로그 확인, ConfigMap/Secret 드리프트를 먼저 어떻게 점검하는지 찾는 검색 의도를 겨냥합니다.

가이드 보기
ImagePullBackOff 점검

ImagePullBackOff일 때 확인해야 할 4가지

ImagePullBackOff 원인, ErrImagePull, registry authentication, imagePullSecret, mutable tag drift, private registry timeout을 먼저 어떻게 점검하는지 찾는 검색 의도를 겨냥합니다.

가이드 보기
이미지 풀 점검 가이드

ImagePullBackOff일 때 확인해야 할 4가지

ImagePullBackOff, ErrImagePull, private registry 인증 실패, image tag not found, pull secret 누락을 먼저 점검할 때 적합합니다.

가이드 보기
TLS 신뢰 점검 가이드

x509 unknown authority가 뜰 때 가장 먼저 볼 것

x509 unknown authority, certificate signed by unknown authority, 중간 인증서 누락, TLS trust chain, mTLS 신뢰 불일치를 먼저 점검할 때 적합합니다.

가이드 보기

증상형 가이드

현상은 보이지만 원인이 넓게 퍼지는 문제를 먼저 분리하는 가이드

Pod는 Running인데 요청만 실패, firewalld는 열려 보이는데 접속이 막힘 같은 패턴을 다룹니다.

트래픽 점검

Pod는 Running인데 요청만 실패할 때 점검 순서

pod running but traffic fails, service no endpoints, ingress 404, endpoint mismatch, readiness는 실패인데 pod는 running 같은 증상을 어떻게 좁히는지 찾는 검색 의도를 겨냥합니다.

가이드 보기
DNS 점검

CoreDNS는 Running인데 DNS만 실패할 때

CoreDNS running but DNS fails, kube-dns troubleshooting, service discovery failure, SERVFAIL, node-local-dns, network policy DNS block을 먼저 어떻게 점검하는지 찾는 검색 의도를 겨냥합니다.

가이드 보기
Helm 점검

Helm values가 섞이면서 배포만 이상해질 때

Helm values merge issue, environment override drift, sync는 정상인데 rollout 실패, chart default drift를 먼저 어떻게 점검하는지 찾는 검색 의도를 겨냥합니다.

가이드 보기
ConfigMap 점검

ConfigMap은 바뀌었는데 Pod는 예전 값을 계속 쓸 때

ConfigMap changed but not reloaded, envFrom stale value, subPath old file, projected volume old config 같은 검색 의도를 겨냥합니다.

가이드 보기
자동화 점검

수동 실행은 되는데 cron에서만 실패할 때

cron works manually but fails automatically, command not found in cron, non-interactive shell sudo failure 같은 검색 의도를 겨냥합니다.

가이드 보기
권한 점검

권한은 고쳤는데 새 디렉터리만 그룹 상속이 계속 틀릴 때

permissions fixed but new directories wrong group, setgid inheritance issue, umask group ownership mismatch 같은 검색 의도를 겨냥합니다.

가이드 보기
자동화 점검

sudo는 되는데 자동화에서만 실패할 때

sudo works in shell but fails in automation, cron only permission denied, systemd no tty present, requiretty, command path 문제를 먼저 어떻게 점검하는지 찾는 검색 의도를 겨냥합니다.

가이드 보기
방화벽 점검

firewalld는 열려 보이는데 접속은 계속 막힐 때

firewalld open but blocked, runtime vs permanent rule drift, wrong zone binding, service listening but timeout 문제를 먼저 어떻게 점검하는지 찾는 검색 의도를 겨냥합니다.

가이드 보기

체크리스트·비교형

팀에 바로 공유하기 쉬운 점검 순서와 비교 가이드

OSPF, Router on a Stick vs SVI, 프록시 헤더 차이처럼 비교와 점검 순서를 함께 보는 가이드입니다.

롤아웃 점검

GitHub Actions는 성공인데 롤아웃만 실패할 때

GitHub Actions succeeded but rollout failed, deployment job green but release unhealthy, artifact promotion mismatch, health check after deploy failure 같은 검색 의도를 겨냥합니다.

가이드 보기
캐시 점검

CI cache가 복원됐는데 의존성 그래프가 계속 꼬일 때

CI cache restored wrong dependency graph, cache hit but stale dependency tree, lockfile promotion mismatch 같은 검색 의도를 겨냥합니다.

가이드 보기
프록시 헤더 비교 가이드

NGINX와 Azure 프록시 헤더 차이로 로그인 콜백이 꼬일 때

X-Forwarded-Proto, secure proxy header, callback scheme mismatch, reverse proxy vendor 차이를 먼저 비교할 때 적합합니다.

가이드 보기
OSPF 점검 가이드

OSPF adjacency가 안 잡힐 때 체크리스트

OSPF adjacency down, neighbor not full, EXSTART stuck, failover 후 route loss, 라우팅 경로 체크리스트를 먼저 점검할 때 적합합니다.

가이드 보기
라우팅 비교 가이드

Router on a Stick과 SVI를 실무에서 구분하는 법

Router on a Stick vs SVI, inter-VLAN routing 설계, gateway 위치, 장애 시 첫 점검 장비를 먼저 비교할 때 적합합니다.

가이드 보기

카테고리 가이드

영역 전체를 먼저 정리하는 기본 가이드

CI/CD, Kubernetes, Linux, Network, Security처럼 큰 주제를 먼저 잡을 때 보는 가이드입니다.

리눅스 운영 가이드

permission denied, inode 부족, systemd 실패를 빠르게 나누는 법

systemd 서비스 실패, inode 부족, permission denied, 디스크 압박, 프로세스 상태 이상을 먼저 점검할 때 적합합니다.

가이드 보기
네트워크 점검 가이드

timeout, DNS, 방화벽 문제를 경로 기준으로 점검하는 법

DNS 오류, 라우팅 문제, 방화벽 차단, 프록시 경로 이상, timeout, 지연 문제를 경로 중심으로 분석할 때 적합합니다.

가이드 보기
쿠버네티스 점검 가이드

Kubernetes 장애가 복잡해 보일 때 먼저 나누는 방법

CrashLoopBackOff, readiness probe 실패, ingress 404, 서비스 엔드포인트 없음, CoreDNS 혼선, kubectl 디버깅을 먼저 정리할 때 적합합니다.

가이드 보기
배포 점검 가이드

GitHub Actions는 성공인데 배포만 실패할 때 점검 순서

GitHub Actions 빌드 실패, 배포는 성공인데 롤아웃만 실패, 아티팩트 드리프트, self-hosted runner 배포 장애를 먼저 점검할 때 적합합니다.

가이드 보기
보안 점검 가이드

IAM, TLS, WAF 장애를 보안 운영 흐름으로 나누는 법

IAM 문제, TLS 인증서 신뢰 실패, WAF 오탐, 인증 실패, 사고 대응형 보안 장애를 먼저 나눌 때 적합합니다.

가이드 보기