Qual a diferença entre L4 e L7 load balancing?

L4 opera na camada de transporte, roteando baseado em IP e porta sem inspecionar conteúdo. É mais rápido mas menos flexível. L7 inspeciona HTTP headers, paths e cookies, permitindo routing sofisticado como canary deployments e routing por microsserviço.

Quando devo usar sticky sessions?

Apenas quando o estado de sessão é armazenado na memória do servidor e não pode ser externalizado facilmente. Para novos sistemas, prefira servidores stateless com sessão em Redis, eliminando a necessidade de sticky sessions e melhorando o balanceamento de carga.

O que acontece quando um backend falha o health check?

O load balancer remove o backend do pool após o número configurado de falhas consecutivas. Novas requisições são distribuídas apenas entre backends saudáveis. Quando o backend recupera e passa o número configurado de health checks com sucesso, ele é readicionado ao pool.

Por que fazer SSL termination no load balancer?

Centraliza gerenciamento de certificados, reduz overhead de CPU nos backends e simplifica a configuração. A rede interna entre load balancer e backends deve ser confiável (VPC privada). Para compliance que exige criptografia end-to-end, use re-encryption ou SSL passthrough.

ProxySQL ou pgBouncer — qual usar?

ProxySQL é para MySQL/MariaDB com recursos avançados de routing e query rewriting. pgBouncer é para PostgreSQL focado em connection pooling eficiente. Ambos resolvem o problema de custo alto de conexões de banco, mas em ecossistemas diferentes.

Load Balancer: algoritmos, L4 vs L7 e HA | 2026

Algoritmos de balanceamento, health checks, sticky sessions, L4 vs L7 e como garantir alta disponibilidade distribuindo carga entre instâncias.

O que é um load balancer e por que ele é necessário

Distribuindo carga para escalabilidade e alta disponibilidade

Um load balancer é um componente de infraestrutura que distribui requisições de entrada entre múltiplas instâncias de servidores backend, evitando que qualquer servidor individual se torne gargalo. Sem load balancing, escalar horizontalmente adicionando servidores seria inútil pois todo o tráfego continuaria indo para uma única instância. Além de distribuir carga, o load balancer é responsável por remover instâncias não saudáveis do pool de destinos, garantindo que requisições sejam enviadas apenas para servidores operacionais. Em arquiteturas cloud-native, load balancers são componentes fundamentais que permitem zero downtime deployments através de rolling updates.

L4 vs L7 load balancing — camada de transporte vs aplicação

Entendendo onde na pilha de rede o balanceamento ocorre

Load balancers L4 operam na camada de transporte, roteando conexões TCP ou UDP baseados em IP de origem e destino e número de porta, sem inspecionar o conteúdo das requisições. L4 load balancers são extremamente rápidos pois não precisam terminar a conexão TCP — apenas encaminham o fluxo de bytes para o backend escolhido. Load balancers L7 operam na camada de aplicação, podendo inspecionar headers HTTP, cookies, URL paths e corpo da requisição para tomar decisões de roteamento mais sofisticadas. A capacidade de fazer SSL termination, routing baseado em path e header-based routing torna L7 load balancers essenciais para arquiteturas de microsserviços e APIs complexas.

Algoritmos — round robin, least connections, IP hash

Como o load balancer decide para qual backend enviar cada requisição

Round robin é o algoritmo mais simples, distribuindo requisições sequencialmente entre os backends em ordem circular — ideal quando os servidores têm capacidade equivalente e as requisições têm custo similar. Least connections envia cada nova requisição para o backend com menor número de conexões ativas, sendo mais justo em cenários onde algumas requisições demoram mais que outras. IP hash usa o IP do cliente para determinar deterministicamente qual backend receberá a requisição, garantindo que o mesmo cliente sempre chegue ao mesmo servidor — essencial para aplicações com estado no servidor. Weighted variants de cada algoritmo permitem enviar proporcionalmente mais tráfego para servidores mais poderosos.

Health checks — não enviar tráfego para instâncias doentes

Monitoramento contínuo da saúde dos backends

Health checks são verificações periódicas que o load balancer faz em cada backend para determinar se ele está apto a receber tráfego. Checks passivos observam respostas de requisições reais, marcando backends como unhealthy após um número configurável de falhas consecutivas. Checks ativos enviam requisições sintéticas para endpoints de saúde específicos como /health ou /ready, independentemente do tráfego real, detectando falhas mais rapidamente. A configuração de thresholds — quantas falhas para marcar como unhealthy e quantos sucessos para restaurar — é crítica para evitar tanto remoção prematura de instâncias transitoriamente lentas quanto manter instâncias genuinamente falhas no pool.

Sticky sessions — manter o usuário na mesma instância

Quando e como manter afinidade entre cliente e servidor

Sticky sessions (ou session affinity) garantem que requisições de um mesmo cliente sejam sempre roteadas para o mesmo servidor backend, necessário quando estado de sessão é armazenado localmente na memória da aplicação. A implementação mais comum usa um cookie inserido pelo load balancer na primeira resposta, que é enviado de volta em requisições subsequentes para identificar o backend preferido. O problema fundamental de sticky sessions é que elas reduzem a efetividade do balanceamento — se um servidor fica sobrecarregado com sessões ativas, o load balancer não pode redistribuí-las facilmente. A alternativa preferida em sistemas modernos é armazenar estado de sessão externamente em Redis ou banco de dados, tornando os servidores stateless e eliminando a necessidade de sticky sessions.

SSL termination no load balancer

Centralizando gerenciamento de certificados e criptografia

SSL termination no load balancer significa que as conexões TLS são decriptadas nele, e a comunicação com os backends ocorre em HTTP simples dentro da rede privada. Essa abordagem centraliza o gerenciamento de certificados SSL em um único ponto, simplificando renovação e evitando que cada servidor backend precise lidar com criptografia. A comunicação interna em HTTP reduz overhead de CPU nos servidores de aplicação, mas exige que a rede interna seja confiável. Para ambientes com requisitos de segurança mais rigorosos, SSL passthrough repassa a conexão TLS intacta para o backend, ou re-encryption cria uma nova conexão TLS do load balancer para o backend, mantendo criptografia end-to-end.

Load balancer interno vs externo

Balanceamento na borda e dentro do cluster

Load balancers externos recebem tráfego da Internet e distribuem para instâncias em redes privadas, sendo o ponto de entrada público da aplicação com IP público e DNS configurado. Load balancers internos distribuem tráfego entre serviços dentro de uma VPC ou cluster Kubernetes, sem exposição à Internet, essenciais para comunicação entre microsserviços. Em Kubernetes, o Service type LoadBalancer cria um cloud load balancer externo, enquanto Services internos usam ClusterIP com o kube-proxy distribuindo conexões. Service meshes como Istio adicionam uma camada de load balancing L7 interno com capabilities avançadas como circuit breaking e traffic splitting para canary deployments.

HAProxy, NGINX e AWS ALB/NLB

Comparando as principais soluções de load balancing disponíveis

HAProxy é considerado o load balancer de alta performance mais confiável do mercado open-source, especializado em TCP e HTTP com configuração detalhada de algoritmos, health checks e ACLs para roteamento sofisticado. NGINX funciona como load balancer L7 além de servidor web e reverse proxy, sendo a escolha mais comum para quem já usa NGINX como proxy e quer adicionar balanceamento sem nova infraestrutura. O AWS ALB (Application Load Balancer) é um serviço gerenciado L7 com routing por path, host-based routing e suporte nativo a ECS e EKS, enquanto o NLB (Network Load Balancer) opera em L4 com latência ultra-baixa e suporte a IPs estáticos para whitelist de firewall.

Load balancing de banco de dados — ProxySQL e pgBouncer

Distribuindo conexões de banco de dados em ambientes de alta carga

ProxySQL é um proxy de alto desempenho para MySQL e MariaDB que faz load balancing entre réplicas de leitura, connection pooling, query routing e failover automático transparente para a aplicação. pgBouncer é um connection pooler leve para PostgreSQL que reutiliza conexões de banco de dados entre múltiplas aplicações, resolvendo o problema de custo alto de abertura de conexões no PostgreSQL. A separação de reads e writes via proxy é uma das otimizações mais impactantes em sistemas de banco de dados sob alta carga, direcionando escritas para o primary e leituras para réplicas. Ferramentas como Vitess para MySQL em Kubernetes levam esse conceito ainda mais longe com sharding automático e topologia flexível.

Conclusão — load balancer como pilar da disponibilidade

Escalabilidade horizontal e resiliência dependem de um bom balanceamento

Um load balancer bem configurado é o que separa um sistema que escala horizontalmente de um que apenas adiciona servidores sem benefício real. Entender os algoritmos, os tipos de health checks e as implicações de sticky sessions permite tomar decisões arquiteturais que impactam diretamente a disponibilidade e o custo de operação. Continue em: Fundamentos obrigatórios antes de produção.

Load Balancing no YouTube

Load Balancing explicado visualmente

L4 vs L7 load balancing na prática

HAProxy configuração e algoritmos

AWS ALB e NLB comparados

Health checks e alta disponibilidade

Load balancing de banco de dados

Conceitos de Load Balancing

Round Robin

Algoritmo que distribui requisições sequencialmente entre backends em ordem circular.

Least Connections

Algoritmo que envia cada nova requisição para o backend com menor número de conexões ativas.

Sticky Sessions

Configuração que garante que requisições do mesmo cliente sempre vão para o mesmo backend.

Health Check

Verificação periódica da saúde dos backends para remover instâncias com falha do pool.

SSL Termination

Processo de descriptografar conexões TLS no load balancer antes de encaminhar para o backend.

Connection Pooling

Reutilização de conexões de banco de dados entre múltiplas requisições para reduzir overhead.

Load Balancing no Instagram

@bytebytego

Reels — Sistemas e Arquitetura

@bytebytego

ByteByteGo no Facebook

Load Balancing no X

@mjovanovictech

Como testar que sua API é resiliente e segura para produção real

Ver post completo no X →

@mjovanovictech

Implementando padrões de resiliência em .NET Core com exemplos reais

Ver post completo no X →

@mjovanovictech

Vertical Slice Architecture — organizando sistemas para escala

Ver post completo no X →

@mjovanovictech

5 anos com Clean Architecture — lições de sistemas em produção

Ver post completo no X →

@mjovanovictech

Design de APIs resilientes — retry, backoff e idempotência juntos

Ver post completo no X →

@mjovanovictech

Monolito vs Microsserviços — como escolher para cada contexto

Ver post completo no X →

Links Úteis

HAProxy Documentation AWS Load Balancing Docs NGINX Load Balancing Guide Série completa: Fundamentos antes de produção

O que dizem

Marcos Oliveira ★★★★★

A diferença entre L4 e L7 finalmente ficou clara. Implementamos AWS ALB com routing por path seguindo as recomendações.

Camila Torres ★★★★★

A seção sobre sticky sessions e por que evitá-las mudou nossa arquitetura de sessão para Redis. Zero problemas desde então.

Tiago Moreira ★★★★☆

Conteúdo sólido sobre load balancing. ProxySQL para MySQL foi uma revelação para nosso sistema de alta carga.

Load Balancer: distribuindo tráfego sem sobrecarregar servidores

O que é um load balancer e por que ele é necessário

Distribuindo carga para escalabilidade e alta disponibilidade

L4 vs L7 load balancing — camada de transporte vs aplicação

Entendendo onde na pilha de rede o balanceamento ocorre

Algoritmos — round robin, least connections, IP hash

Como o load balancer decide para qual backend enviar cada requisição

Health checks — não enviar tráfego para instâncias doentes

Monitoramento contínuo da saúde dos backends

Sticky sessions — manter o usuário na mesma instância

Quando e como manter afinidade entre cliente e servidor

SSL termination no load balancer

Centralizando gerenciamento de certificados e criptografia

Load balancer interno vs externo

Balanceamento na borda e dentro do cluster

HAProxy, NGINX e AWS ALB/NLB

Comparando as principais soluções de load balancing disponíveis

Load balancing de banco de dados — ProxySQL e pgBouncer

Distribuindo conexões de banco de dados em ambientes de alta carga

Conclusão — load balancer como pilar da disponibilidade

Escalabilidade horizontal e resiliência dependem de um bom balanceamento

Perguntas Frequentes

Load Balancer: distribuindo tráfego sem sobrecarregar servidores

O que é um load balancer e por que ele é necessário

Distribuindo carga para escalabilidade e alta disponibilidade

L4 vs L7 load balancing — camada de transporte vs aplicação

Entendendo onde na pilha de rede o balanceamento ocorre

Algoritmos — round robin, least connections, IP hash

Como o load balancer decide para qual backend enviar cada requisição

Health checks — não enviar tráfego para instâncias doentes

Monitoramento contínuo da saúde dos backends

Sticky sessions — manter o usuário na mesma instância

Quando e como manter afinidade entre cliente e servidor

SSL termination no load balancer

Centralizando gerenciamento de certificados e criptografia

Load balancer interno vs externo

Balanceamento na borda e dentro do cluster

HAProxy, NGINX e AWS ALB/NLB

Comparando as principais soluções de load balancing disponíveis

Load balancing de banco de dados — ProxySQL e pgBouncer

Distribuindo conexões de banco de dados em ambientes de alta carga

Conclusão — load balancer como pilar da disponibilidade

Escalabilidade horizontal e resiliência dependem de um bom balanceamento

COMPARTILHE ESTE ARTIGO

Perguntas Frequentes

Veja Também

Snyk: Guia Completo de Segurança para Desenvolvedores

n8n: automação visual para integrar sistemas e IA

Replit Agent: desenvolvimento de aplicações direto no navegador