O que é o web.archive.org (Internet Archive)

A maior biblioteca digital gratuita do mundo

O Internet Archive é uma organização sem fins lucrativos fundada em 1996 por Brewster Kahle, sediada em San Francisco, Califórnia. Sua missão é preservar o conhecimento humano em formato digital para acesso público e gratuito. Além de bilhões de páginas web, o arquivo mantém milhões de livros digitalizados, gravações de áudio, filmes, programas de televisão e softwares antigos — tudo acessível em archive.org sem custo algum.

O que é a Wayback Machine e como ela funciona

A máquina do tempo da internet com mais de 1 trilhão de capturas

A Wayback Machine, disponível em web.archive.org, é o serviço de arquivamento web do Internet Archive. Lançada para o público em 2001, ela registra automaticamente como os sites da internet se parecem em diferentes momentos no tempo — desde páginas simples até portais completos com imagens, CSS e JavaScript. Com mais de 1 trilhão de capturas acumuladas, é possível visualizar como praticamente qualquer site famoso se parecia nos anos 1990, 2000 ou em qualquer data recente.

Como usar a Wayback Machine passo a passo

Três passos para viajar no tempo pela internet

Usar a Wayback Machine é simples: acesse web.archive.org, digite a URL do site que deseja consultar no campo de busca e clique em "Browse History". O sistema exibe um calendário interativo com todos os dias em que aquela página foi capturada, codificados por cor — azul para sucesso, verde para redirecionamento, laranja para erro do cliente e vermelho para erro do servidor. Clique em qualquer data para ver a versão arquivada exatamente como estava naquele momento.

Save Page Now — salve qualquer página em tempo real

Crie um link permanente para qualquer página da internet

Desde outubro de 2013, qualquer pessoa pode usar o recurso Save Page Now para criar um snapshot imediato de qualquer URL pública. Acesse web.archive.org, cole a URL desejada na caixa "Save Page Now" e clique em salvar. Em segundos, o sistema gera um link permanente para aquela versão da página — ideal para citar fontes que podem mudar, preservar notícias antes de edições ou guardar registros de sites temporários. O link gerado nunca expira.

Além da web: livros, músicas, filmes e softwares

O maior repositório de mídia digital de acesso livre

O Internet Archive vai muito além do arquivamento de sites. A plataforma mantém mais de 38 milhões de itens digitalizados: livros emprestáveis via Controlled Digital Lending, gravações de concertos ao vivo com licença Creative Commons, filmes em domínio público, programas de televisão, softwares antigos de MS-DOS e Apple II que rodam no navegador via emulação, e até gravações de rádio históricas. Tudo gratuito, sem cadastro obrigatório para a maioria dos conteúdos.

A Wayback Machine em investigações jornalísticas e jurídicas

Evidência digital aceita em tribunais e reportagens investigativas

A Wayback Machine tornou-se uma ferramenta indispensável para jornalistas investigativos e advogados. Ela permite recuperar páginas deletadas, comparar como um site mudou ao longo do tempo, verificar o que uma empresa publicava antes de um incidente e documentar promessas ou declarações que foram apagadas do ar. Tribunais nos Estados Unidos e em outros países já aceitaram capturas da Wayback Machine como evidência em processos. O serviço inclusive oferece certificação de capturas para uso jurídico formal.

O ataque de 2024 e a crise existencial do Internet Archive

Um hack de 31 milhões de contas e uma ação judicial de 700 milhões de dólares

Em outubro de 2024, o Internet Archive sofreu um ataque devastador: uma invasão expôs dados de 31 milhões de usuários, e um ataque de negação de serviço (DDoS) derrubou a Wayback Machine por semanas. Simultaneamente, grandes gravadoras entraram com uma ação judicial de 700 milhões de dólares relacionada ao arquivamento de discos de 78 rotações. O archive.org voltou a operar, mas o episódio evidenciou a fragilidade financeira de uma das instituições mais importantes da internet — mantida por doações.

Como a Wayback Machine ajuda desenvolvedores e pesquisadores

Recuperar código perdido, imagens deletadas e versões antigas de APIs

Para desenvolvedores, a Wayback Machine é uma ferramenta de emergência valiosa: é possível recuperar versões antigas de documentações que mudaram, resgatar código de projetos descontinuados, encontrar imagens de sites que saíram do ar e comparar como APIs públicas se comportavam em versões anteriores. Pesquisadores acadêmicos usam o arquivo para estudar a evolução da web, analisar desinformação histórica e mapear como notícias se espalharam antes de serem editadas ou removidas.

Limitações e desafios da preservação digital

Nem tudo é arquivado — e alguns sites pedem para ser excluídos

A Wayback Machine não consegue arquivar tudo: conteúdo protegido por login, páginas geradas dinamicamente por JavaScript complexo e redes sociais como Instagram e Facebook são capturadas de forma incompleta ou bloqueiam o arquivamento. Sites podem solicitar exclusão do arquivo via arquivo robots.txt. Em 2025, veículos como The Guardian e The New York Times começaram a bloquear o Wayback Machine por preocupações com scraping de IA, criando um dilema entre preservação histórica e controle editorial.

Por que o Internet Archive é um patrimônio da humanidade

Uma organização sem fins lucrativos que preserva a memória coletiva da era digital

Sem o Internet Archive, a web seria um meio de comunicação sem memória — cada site deletado, cada artigo editado e cada serviço encerrado desapareceria para sempre. A organização existe com doações e mantém uma missão clara: garantir que as gerações futuras possam acessar a cultura, o conhecimento e a história digital do século XX e XXI. Contribuir financeiramente ou simplesmente usar o Save Page Now para preservar páginas importantes já é uma forma de apoiar esse esforço coletivo.

Tutoriais em Vídeo

Conceitos-chave

Fundação

1996, por Brewster Kahle — organização sem fins lucrativos em San Francisco

Capturas

Mais de 1 trilhão de páginas web arquivadas desde 1996

Save Page Now

Salva qualquer URL pública em segundos e gera link permanente

Calendário

Azul = sucesso | Verde = redirect | Laranja = erro 4xx | Vermelho = erro 5xx

Acervo digital

38 mi de itens: livros, músicas, filmes, softwares, programas de TV

Lag

3 a 10 horas entre a captura e a disponibilização pública no arquivo

Internet Archive no Instagram

@internetarchive

Reels — Internet Archive

@internetarchive

Internet Archive no Facebook

Internet Archive no X (Twitter)

@internetarchive

Websites vanish. Links break. But knowledge can live on with your help. Use the Wayback Machine's Save Page Now tool to archive webpages that are important to you.

Ver post completo no X →
@internetarchive

Save Page Now is back online via the Wayback Machine. Web pages archived since October 9 will start being added to the Wayback Machine.

Ver post completo no X →
@internetarchive

The Internet Archive needs your help. At a time when information is being rewritten or erased online, a $700 million lawsuit from major record labels threatens to destroy the Wayback Machine.

Ver post completo no X →
@internetarchive

Latest update on our services — archives are safe and Wayback Machine is up in read-only mode.

Ver post completo no X →
@internetarchive

A brief power outage in one of our datacenters means the Wayback Machine has been down. We are working on it.

Ver post completo no X →
@internetarchive

The Wayback Machine and some other functions are offline because some network gear has failed. We apologize and are working on it.

Ver post completo no X →

O que dizem

Fernanda S. ★★★★★

Uso a Wayback Machine toda semana no meu trabalho de jornalismo investigativo. Já recuperei páginas deletadas de sites governamentais que faziam a diferença em reportagens. É uma ferramenta insubstituível.

Marcos T. ★★★★★

Como desenvolvedor, uso o archive.org para recuperar documentações de APIs descontinuadas. Já me salvou horas de trabalho várias vezes. E tem décadas de livros técnicos digitalizados que não existem em outro lugar.

Carolina L. ★★★★☆

Incrível poder ver como eram os sites nos anos 2000. JavaScript pesado nem sempre carrega direito nas capturas antigas, mas para ver layouts e conteúdo de texto funciona perfeitamente. Doei para o projeto depois de usar.