문제
문제 상황
기능 배포 때마다 45분 이상 걸리는 파이프라인이 개발 흐름을 끊고 있었습니다. 빌드, 테스트, 배포가 순차 실행되어 병목이 발생했고, 실패 시 처음부터 재실행해야 했습니다.
접근
접근 방법
스테이지별 병렬 실행 구조로 재설계하고, 변경이 없는 레이어는 캐시를 재활용하도록 했습니다. 실패 지점만 재실행할 수 있는 부분 재시도 구조를 도입해 전체 파이프라인 재실행 빈도를 낮췄습니다.
결과
성과
배포 소요 시간이 45분에서 8분으로 줄었고, 하루 배포 횟수가 평균 2회에서 8회로 증가했습니다. 개발자 대기 시간이 줄면서 기능 출시 주기도 단축됐습니다.
- 배포 시간 45분 -> 8분 (5.6배 단축)
- 일일 배포 횟수 2회 -> 8회
- 스테이지 병렬 실행 및 레이어 캐시 최적화
- 실패 스테이지만 선택 재실행 구조