로드 밸런서 (Load Balencer)

도입

요청을 단순히 여러 서버에 나눠 보내는 데서 끝나지 않고, 들어오는 트래픽을 건강한 백엔드에 안정적으로 분산해 가용성과 확장성을 함께 높이는 데 있다

처음에는 로드 밸런서를 “트래픽을 여러 서버에 나누는 장비” 정도로 이해하기 쉽습니다. 방향은 맞지만, 실무에서는 그 설명만으로는 부족합니다.

로드 밸런서는 단순 분산 장치가 아니라, 헬스 체크, 백엔드 풀 관리, 알고리즘 선택, L4/L7 라우팅, 세션 선호도, TLS 종료 같은 역할을 함께 맡는 경우가 많습니다. 그래서 로드 밸런서를 이해한다는 것은 트래픽 분산만이 아니라, 서비스 진입점에서 장애와 확장을 어떻게 통제할지를 이해하는 일에 가깝습니다.

필요성

로드 밸런서를 이해하면 단순히 서버를 여러 대 두는 수준을 넘어서, 어떤 요청을 어디로 보낼지, 어떤 서버를 즉시 제외할지, 어떤 계층에서 트래픽을 제어할지를 구조적으로 설계할 수 있다

서버를 여러 대 두는 것만으로는 고가용성이 자동으로 생기지 않습니다. 사용자 요청이 여전히 특정 서버로만 몰리거나, 죽은 서버로 계속 전달되면 서비스는 쉽게 장애를 일으킵니다.

로드 밸런서는 이 문제를 줄이는 진입점입니다. 요청을 여러 백엔드로 나누고, 건강하지 않은 대상을 풀에서 빼고, 경우에 따라 특정 URL은 A 그룹으로, 다른 URL은 B 그룹으로 보내는 식의 규칙도 적용할 수 있습니다. 그래서 로드 밸런서는 확장성뿐 아니라 장애 회피 장치로도 중요합니다.

로드 밸런서를 특히 고려해야 하는 상황

같은 서비스를 여러 서버가 동시에 처리해야 할 때
서버 일부가 죽어도 트래픽을 우회해야 할 때
HTTP 경로, 호스트명, 포트 기준으로 라우팅을 나눠야 할 때
상태 저장 앱에서 세션 선호도(sticky session)가 필요할 때
쿠버네티스나 클라우드 환경에서 진입점을 표준화해야 할 때

정의

로드 밸런서는 클라이언트 요청을 하나의 진입점에서 받아 여러 백엔드 대상으로 분산하는 구성 요소이며, 목적은 주로 가용성 향상, 장애 회피, 수평 확장, 트래픽 제어에 있다

로드 밸런서는 보통 클라이언트가 가장 먼저 만나는 서버 측 네트워크 진입점입니다. 외부에서는 하나의 주소처럼 보이지만, 내부적으로는 여러 서버에 요청을 나눠 보냅니다.

중요한 점은 단순히 분산만 하는 것이 아니라는 점입니다. 실제 제품들은 종종 health check, TLS 종료, 라우팅 규칙, 세션 선호도, 접근 로그, WAF 연계 같은 기능까지 함께 제공합니다. 그래서 로드 밸런서는 “분산 장치”이면서 동시에 “트래픽 제어 계층”입니다.

핵심 문장

로드 밸런서는 “트래픽을 고르게 나누는 기능”에 그치지 않고, 어떤 요청을 어떤 상태의 어떤 백엔드에 보낼지 결정하는 진입 제어 계층입니다.

핵심 원리

로드 밸런서의 핵심 원리는 모든 서버가 동일하게 좋아 보인다고 가정하지 않고, 현재 건강한 대상만 풀에 남기고 정책에 맞게 요청을 분산하는 데 있다

단순 round robin만 있으면 로드 밸런서가 아닙니다. 실제 운영에서는 어떤 백엔드가 응답 가능한지, 어떤 서버가 이미 바쁜지, 어떤 요청은 특정 그룹으로 보내야 하는지를 계속 판단해야 합니다.

즉, 로드 밸런서는 “여러 서버가 있다”는 사실을 전제로 하지만, 실제로는 건강한 대상 선택, 분산 정책, 규칙 기반 라우팅이라는 세 축으로 동작합니다. 여기서 health check가 약하면 죽은 서버로 계속 보내고, 알고리즘이 서비스 특성과 맞지 않으면 특정 노드에 과부하가 집중됩니다.

기본 구조

로드 밸런서는 보통 리스너, 백엔드 풀, 헬스 체크, 라우팅 규칙, 세션 선호도, 로그 수집 같은 요소가 함께 있어야 실전에서 의미 있는 장치가 된다

구성 요소	역할	실무 포인트
Listener	어떤 프로토콜/포트 요청을 받을지 정의	HTTP, HTTPS, TCP, UDP 등 진입 규칙의 시작점
Backend / Target Group	실제 요청을 처리할 서버 묶음	인스턴스, 컨테이너, IP 단위로 구성 가능
Health Check	백엔드 상태를 주기적으로 확인	죽은 서버를 빨리 빼고, 살아난 서버를 다시 넣는 기준
Routing Rule	요청을 어떤 백엔드로 보낼지 결정	L7에서는 host/path/header 단위 규칙도 가능
Session Affinity	같은 클라이언트를 같은 서버로 보내는 옵션	상태 저장 앱에서 유용하지만 만능은 아님
Logs / Metrics	요청과 응답 흐름을 기록	장애 분석과 튜닝의 핵심 자료

기본 흐름
클라이언트 요청
   ↓
로드 밸런서
   ├─ 헬스 체크 결과 확인
   ├─ 라우팅 규칙 평가
   └─ 분산 알고리즘 적용
   ↓
건강한 백엔드 서버 중 하나로 전달

패턴 1. L4 와 L7 로드 밸런싱

로드 밸런서를 이해할 때 가장 먼저 나눠야 할 축은 L4와 L7이며, 전자는 연결 단위 분산에 가깝고 후자는 HTTP 의미를 이해하는 애플리케이션 단위 분산에 가깝다

L4 로드 밸런서는 주로 IP 주소, 포트, 프로토콜(TCP/UDP) 수준에서 동작합니다. 즉, 애플리케이션 메시지의 의미를 깊게 보지 않고 연결이나 패킷 수준에서 트래픽을 분산합니다.

반면 L7 로드 밸런서는 HTTP 같은 애플리케이션 프로토콜을 이해합니다. 그래서 URL 경로, Host 헤더, 요청 속성 등을 바탕으로 /api는 A 그룹으로, /static은 B 그룹으로 보내는 식의 더 세밀한 라우팅이 가능합니다. TLS 종료, 웹 방화벽, 쿠키 기반 세션 선호도도 L7 장치에서 자주 같이 보입니다.

구분	L4 로드 밸런서	L7 로드 밸런서
기준	IP, 포트, TCP/UDP 연결	HTTP/HTTPS 요청 의미
장점	빠르고 단순하며 범용적	경로/호스트 기반 라우팅 등 정교한 제어 가능
대표 기능	TCP/UDP 분산, 포트 단위 서비스 노출	Path 기반 라우팅, Host 기반 라우팅, TLS 종료
적합한 경우	DB, 게임, TCP 서비스, 일반 네트워크 분산	웹 애플리케이션, API 게이트웨이 성격의 트래픽

고급 메모

실무에서는 L4와 L7이 경쟁 개념이라기보다 서로 다른 층의 도구입니다. 어떤 구간은 L4로 받고, 그 위에서 다시 L7 규칙으로 세분화하는 형태도 흔합니다.

패턴 2. 헬스 체크와 분산 알고리즘

로드 밸런싱에서 진짜 성능 차이는 단순한 round robin보다, 어떤 백엔드가 지금 건강한지와 어떤 방식으로 다음 요청을 고를지에 따라 크게 갈린다

헬스 체크는 로드 밸런서의 가장 중요한 기본기입니다. health check가 없거나 너무 부정확하면, 로드 밸런서는 장애 난 서버에도 계속 요청을 보낼 수 있습니다.

알고리즘도 중요합니다. 가장 흔한 것은 Round Robin이지만, 연결 수가 불균형하면 Least Connections가 더 나을 수 있고, 같은 클라이언트를 같은 서버로 보내야 하면 IP Hash / Generic Hash 계열이 유리할 수 있습니다.

알고리즘	설명	언제 적합한가
Round Robin	백엔드에 순서대로 요청 분산	비교적 단순하고 서버 성능이 비슷할 때
Least Connections	현재 연결 수가 적은 서버 우선	연결 길이가 들쭉날쭉하고 편차가 클 때
IP Hash / Generic Hash	특정 키를 기준으로 같은 서버에 매핑	세션 선호도나 캐시 지역성이 필요할 때

로드 밸런서가 주기적으로 백엔드 상태를 확인한다.
비정상 서버는 풀에서 제외한다.
남은 healthy 대상 중 알고리즘으로 다음 서버를 선택한다.
장애가 회복되면 다시 풀에 편입한다.

패턴 3. 세션 선호도와 상태 저장 애플리케이션

상태 저장 애플리케이션에서 로드 밸런싱이 어려워지는 이유는 요청을 아무 서버로나 보낼 수 없기 때문이며, 이때 session affinity 또는 shared state 전략이 필요해진다

일반적인 웹/API 서버는 가능하면 무상태(stateless)로 만드는 편이 좋습니다. 그래야 어느 서버로 보내도 같은 처리가 가능하고, 로드 밸런서도 자유롭게 분산할 수 있기 때문입니다.

하지만 일부 애플리케이션은 특정 서버의 메모리에 세션 변수나 로컬 캐시를 들고 있습니다. 이런 경우에는 같은 클라이언트 요청을 계속 같은 백엔드로 보내는 session affinity 또는 sticky session이 필요할 수 있습니다. 다만 이는 확장성과 장애 회복을 약하게 만들 수 있으므로, 가능하면 세션 저장소를 외부화해 서버를 무상태에 가깝게 만드는 쪽이 더 좋습니다.

실전 기준

sticky session은 상태 저장 앱을 당장 살리는 데는 유용하지만, 장기적으로는 세션을 외부 저장소로 빼고 백엔드를 무상태화하는 편이 운영과 확장 면에서 더 유리한 경우가 많습니다.

쿠버네티스에서의 로드 밸런싱

쿠버네티스에서 로드 밸런싱은 단일 장비가 아니라 Service와 Ingress 같은 추상화를 통해 애플리케이션을 여러 Pod 뒤로 묶는 형태로 이해하는 편이 정확하다

쿠버네티스에서는 Service가 여러 Pod를 하나의 논리적 endpoint 뒤로 묶어 줍니다. 그래서 클러스터 내부에서는 Service IP 하나만 보면 되고, 실제 요청은 그 뒤의 여러 Pod로 자동 분산됩니다.

외부 노출이 필요하면 type: LoadBalancer Service를 통해 클라우드 외부 로드 밸런서를 만들 수도 있고, HTTP 계층 규칙이 필요하면 Ingress를 통해 host/path 기반 라우팅을 구성할 수 있습니다. 즉, 쿠버네티스에서 로드 밸런싱은 “하나의 장비”보다 네트워크 추상화와 컨트롤러의 조합에 가깝습니다.

apiVersion: v1
kind: Service
metadata:
  name: web
spec:
  type: LoadBalancer
  selector:
    app: web
  ports:
    - port: 80
      targetPort: 8080

로드 밸런서와 클러스터 차이

로드 밸런서는 들어오는 요청을 어느 백엔드로 보낼지 결정하는 진입 계층이고, 클러스터는 뒤쪽 서버들이 어떻게 협력하고 상태를 유지할지 정의하는 운영 구조라는 점에서 책임이 다르다

두 개념은 자주 함께 등장하지만 같은 말은 아닙니다. 로드 밸런서는 주로 입구에서 요청을 분배하는 역할을 하고, 클러스터는 뒤에서 여러 노드가 하나의 시스템처럼 동작하게 만드는 구조입니다.

즉, 로드 밸런서가 있다고 해서 자동으로 클러스터가 되는 것도 아니고, 클러스터가 있다고 해서 반드시 외부 로드 밸런서가 필요한 것도 아닙니다. 하지만 웹/API 서비스에서는 두 개념이 매우 자주 결합됩니다.

구분	로드 밸런서	클러스터
중심 역할	요청 분산과 진입 제어	여러 노드의 협력과 상태 유지
관심사	헬스 체크, 알고리즘, 라우팅 규칙	페일오버, 쿼럼, 동기화, 오케스트레이션
위치	서비스 앞단	서비스 내부 또는 백엔드 구조

한계와 주의점

로드 밸런서는 매우 중요하지만, 이 장치 하나만으로 애플리케이션의 상태 문제, 데이터베이스 병목, 지역 간 지연, 잘못된 아키텍처를 모두 해결해 주는 것은 아니다

로드 밸런서가 있어도 백엔드가 모두 같은 병목을 공유하면 결국 전체 서비스는 느려집니다. 예를 들어 앱 서버는 여러 대로 늘렸지만 데이터베이스가 단일 병목이면, 앞단 분산만으로는 큰 효과를 보기 어렵습니다.

또한 상태 저장 애플리케이션에 sticky session만 걸고 문제를 끝냈다고 생각하면 위험합니다. 특정 서버에 세션이 몰리고, 해당 서버가 죽었을 때 사용자 상태가 같이 날아갈 수 있기 때문입니다. 결국 로드 밸런서는 강력한 도구이지만, 애플리케이션 상태 모델과 저장소 구조까지 함께 맞아야 진짜 효과가 납니다.

꼭 기억할 한계

로드 밸런서는 진입 계층이지 전체 병목 해결기가 아님
헬스 체크가 부정확하면 오히려 장애를 확대할 수 있음
sticky session은 상태 저장 앱을 단기적으로만 편하게 만들 수 있음
L7 기능이 많아질수록 설정 복잡도와 운영 책임도 커짐

자주 하는 실수

로드 밸런서를 잘못 이해할 때 가장 흔한 오답은 트래픽 분산만 생각하고, 건강한 대상 판별·상태 저장 앱·L4/L7 차이·클러스터 구조를 함께 보지 않는 데서 나온다

로드 밸런서 = round robin 정도로만 생각함
헬스 체크 없이 분산만 하면 된다고 착각함
L4와 L7의 차이를 무시한 채 제품을 고름
상태 저장 앱에 sticky session만 걸고 구조 문제를 해결했다고 생각함
로드 밸런서와 클러스터를 같은 개념으로 봄
쿠버네티스 Service, Ingress, 외부 LoadBalancer의 역할을 섞어 봄
로그와 메트릭 없이 장애를 감으로만 분석함

실무 루틴

로드 밸런서를 설계할 때는 장비를 고르기 전에, 이 트래픽이 L4인지 L7인지, 백엔드가 무상태인지 상태 저장형인지, 장애 시 어떤 전환을 기대하는지부터 정리하는 순서가 맞다

먼저 트래픽이 L4 중심인지 L7 규칙이 필요한지 구분한다.
백엔드가 무상태인지 상태 저장형인지 확인한다.
헬스 체크 기준을 애플리케이션 특성에 맞게 정한다.
알고리즘을 round robin, least connections, hash 계열 중 서비스 특성에 맞게 고른다.
세션 선호도가 정말 필요한지, 아니면 세션 외부화가 가능한지 판단한다.
접근 로그, 에러 로그, 헬스 상태, 백엔드 메트릭을 함께 수집한다.
마지막으로야 제품과 배포 위치를 정한다.

디버깅

로드 밸런서 문제를 디버깅할 때는 “서비스가 느리다”라고 뭉뚱그리지 말고, 진입 계층 문제인지 백엔드 문제인지, 분산 정책 문제인지 헬스 판정 문제인지 먼저 나누는 것이 가장 빠르다

문제가 로드 밸런서 자체인지, 백엔드 애플리케이션인지 먼저 분리한다.

헬스 체크는 통과하지만 실제 요청은 실패하는지, 아니면 헬스 체크 자체가 잘못된지 구분한다.

특정 백엔드만 과부하라면 알고리즘, 세션 선호도, hot client 집중을 함께 본다.

L7 장치라면 경로/호스트 기반 규칙이 기대대로 매칭되는지 확인한다.

쿠버네티스라면 Service, Endpoint/EndpointSlice, Ingress, 외부 LB 중 어느 층에서 끊겼는지 분리한다.

로드 밸런서 장애를 볼 때 먼저 나눌 질문
- 백엔드가 정말 unhealthy 인가?
- health check 기준이 잘못된 것은 아닌가?
- L4/L7 계층 선택이 문제인가?
- 알고리즘이 서비스 특성과 맞는가?
- session affinity 때문에 특정 서버에 쏠리고 있지 않은가?
- 로드 밸런서 앞단 문제인가, 뒤쪽 앱/DB 문제인가?

요약

로드 밸런서의 본질은 여러 서버로 요청을 나누는 기능이 아니라, 건강한 백엔드 풀을 유지하면서 적절한 계층과 알고리즘과 규칙으로 트래픽을 제어해 가용성과 확장성을 확보하는 데 있다

✅ 로드 밸런서는 여러 백엔드 대상으로 요청을 분산하는 진입 계층이다.
✅ 핵심은 분산 자체보다 healthy target만 고르고 적절히 라우팅하는 데 있다.
✅ L4는 IP/포트/전송 계층 중심, L7은 HTTP 의미 중심 제어에 가깝다.
✅ 대표 알고리즘은 Round Robin, Least Connections, Hash 계열이다.
✅ session affinity는 상태 저장 앱에 유용하지만 장기 해법은 아닐 수 있다.
✅ 쿠버네티스에서는 Service와 Ingress가 로드 밸런싱 추상화의 핵심이다.
✅ 로드 밸런서와 클러스터는 자주 함께 쓰이지만 같은 개념은 아니다.
✅ 좋은 로드 밸런서는 “고르게 나누는 장치”가 아니라 “서비스 입구를 통제하는 장치”다.

728x90

저작자표시 (새창열림)

유쾌하게 풀어내고
깊이 있게 배우는 공간입니다.

도메인 기반 서비스 API 구축

배포와 데이터 흐름 안정화

구조 개선과 테스트 전략 정립

렌더링 성능과 관측성 개선

우수 멘티

우수 인재상

프로그래밍 우수상

AWS한국사용자모임 발표

ComputerScience

Development

Engineering

TroubleShooting

ComputerScience

Development

Engineering

TroubleShooting

우리의 소중한 기록

첫 마음부터
함께 나누는 온기

Contact Us

매일 도착하는 최신 글

최신소식을
편하게 만나보세요.

로드 밸런서 (Load Balencer)

도입

필요성

정의

핵심 원리

기본 구조

패턴 1. L4 와 L7 로드 밸런싱

패턴 2. 헬스 체크와 분산 알고리즘

패턴 3. 세션 선호도와 상태 저장 애플리케이션

쿠버네티스에서의 로드 밸런싱

로드 밸런서와 클러스터 차이

한계와 주의점

자주 하는 실수

실무 루틴

디버깅

요약

티스토리툴바

유쾌하게 풀어내고 깊이 있게 배우는 공간입니다.

도메인 기반 서비스 API 구축

배포와 데이터 흐름 안정화

구조 개선과 테스트 전략 정립

렌더링 성능과 관측성 개선

우수 멘티

우수 인재상

프로그래밍 우수상

AWS한국사용자모임 발표

ComputerScience

Development

Engineering

TroubleShooting

ComputerScience

Development

Engineering

TroubleShooting

첫 마음부터함께 나누는 온기

Contact Us

최신소식을 편하게 만나보세요.

로드 밸런서 (Load Balencer)

도입

필요성

정의

핵심 원리

기본 구조

패턴 1. L4 와 L7 로드 밸런싱

패턴 2. 헬스 체크와 분산 알고리즘

패턴 3. 세션 선호도와 상태 저장 애플리케이션

쿠버네티스에서의 로드 밸런싱

로드 밸런서와 클러스터 차이

한계와 주의점

자주 하는 실수

실무 루틴

디버깅

요약

티스토리툴바

유쾌하게 풀어내고
깊이 있게 배우는 공간입니다.

첫 마음부터
함께 나누는 온기

최신소식을
편하게 만나보세요.