O ecossistema de CDN e edge computing atravessa uma transformação silenciosa, mas profunda, em 2026. Não se trata mais apenas de cachear conteúdo estático ou mitigar ataques DDoS — as plataformas de borda estão se tornando a espinha dorsal de arquiteturas serverless, pipelines de inteligência artificial e malhas de conectividade globais. Nesse cenário, a Cloudflare Workers infraestrutura se destaca como uma das plataformas mais ambiciosas do mercado, unindo execução de código serverless em 275+ pontos de presença, armazenamento consistente via Durable Objects, inferência de machine learning na borda com Workers AI e, agora, capacidades inéditas para agentes autônomos de IA. O que era um runtime para scripts leves evoluiu para um sistema operacional distribuído que cobre 1 em cada 5 requisições HTTP do planeta.
Nas últimas semanas, a Cloudflare anunciou um conjunto de melhorias que redefinem o que engenheiros de infraestrutura e desenvolvedores podem esperar de uma plataforma edge. As novidades incluem Temporary Accounts para agentes de IA que precisam provisionar Workers sem intervenção humana, novos location hints para Durable Objects na Ásia-Pacífico, a extensão do keep-alive de Durable Objects durante conexões outbound — um detalhe técnico que resolve dores reais de quem opera streaming via LLMs — e a abertura do Agents SDK para frameworks como o Flue. Tudo isso enquanto a plataforma passa por manutenções programadas e a malha de rede se expande, com anúncios de novos datacenters e melhorias no plano de controle unificado de rotas.
Para profissionais de TI e entusiastas que acompanham a evolução da borda, este post é um mergulho técnico nas capacidades atuais da Cloudflare Workers infraestrutura, com foco nos lançamentos recentes, na comparação com outros provedores de CDN e edge computing, e no impacto direto para empresas brasileiras que dependem de latência ultrabaixa, conformidade com a LGPD e arquiteturas distribuídas. Vamos explorar como as peças — Workers, Durable Objects, Queues, AI Gateway e agora agentes — se encaixam para formar uma plataforma que vai muito além de uma CDN tradicional.
Ao longo deste artigo, você vai entender por que a Cloudflare está investindo pesado em agentes de IA, como os novos location hints reduzem a latência para usuários na região Ásia-Pacífico (e o que isso sinaliza para a América Latina), e de que forma as conexões outbound persistentes em Durable Objects viabilizam cenários de streaming que antes exigiam workarounds complexos. Também incluímos comparações com Akamai, Fastly e AWS CloudFront, dados de latência no Brasil e um passo a passo prático para configurar Durable Objects com os novos parâmetros. Na JRT Technology Solutions, temos implementado e gerenciado soluções Cloudflare para clientes corporativos — de WAF a Zero Trust, de Workers a Magic Transit — e sabemos o quanto esses detalhes fazem diferença no mundo real.
O que aconteceu: Temporary Accounts, Agents SDK e manutenção da plataforma
No dia 12 de junho de 2026, a Cloudflare publicou um anúncio que chamou a atenção de desenvolvedores e arquitetos de agentes: Temporary Accounts for AI agents. A ideia é simples na superfície, mas revolucionária para o ecossistema de agentes autônomos. Sempre que um agente de IA — rodando em um runtime como LangChain, CrewAI ou no novo framework Flue — precisa fazer deploy de um Worker, ele esbarrava em um muro burocrático: autenticação via OAuth, criação de conta, clique em dashboard, geração de API token. Agora, com o comando wrangler deploy –temporary, qualquer agente pode provisionar um Worker em segundos, receber uma URL ativa e um link para o humano reivindicar a conta posteriormente. A conta temporária permanece viva por 60 minutos e suporta Workers, Static Assets, KV, D1, Durable Objects, Hyperdrive, Queues e certificados SSL/TLS.
Simultaneamente, a Cloudflare abriu os primitivos do Agents SDK, anunciando o Flue como o primeiro framework a mirar diretamente o SDK de agentes da plataforma. Isso significa que qualquer framework de agentes pode agora se integrar ao runtime da Cloudflare, usando Workers como plataforma de execução e Durable Objects como estado consistente para sessões de longa duração. O Cloudflare One stack também ganhou uma biblioteca de habilidades para agentes — agent skills — que permite a qualquer IA planejar, implantar e gerenciar ambientes Zero Trust sem chamadas de migração ou configuração manual.
Na frente de manutenção de infraestrutura, a Cloudflare agendou para 22 de junho de 2026 uma janela de manutenção no data store de configuração da plataforma Workers, entre 12:00 e 13:00 UTC. Durante até 3 minutos, implantações e modificações de configuração em Workers, Pages, Queues, Durable Objects, Workflows e Cron Triggers ficarão indisponíveis — mas o plano de dados continua operando normalmente. Trata-se de uma pausa cirúrgica no plano de controle, não no runtime. Outras manutenções de datacenters em Estocolmo (ARN) e Minneapolis (MSP) foram programadas para os dias 23 a 25 de junho, com possível re-roteamento de tráfego e aumento marginal de latência. Para clientes PNI/CNI, o failover deve ser planejado.
Esses movimentos, vistos em conjunto, revelam a direção estratégica da Cloudflare: transformar a Cloudflare Workers infraestrutura na camada de execução padrão para agentes de IA, mantendo a confiabilidade de uma rede que roteia centenas de terabits por segundo e absorve os maiores ataques DDoS já registrados (>2 Tbps em 2024).
Cloudflare Workers infraestrutura: a base técnica da edge computing moderna
Para entender a relevância dos anúncios recentes, é preciso revisitar a arquitetura fundamental dos Workers. Diferente de funções serverless tradicionais como AWS Lambda, que executam em regiões específicas dentro de datacenters convencionais, os Workers rodam diretamente nos servidores de borda da Cloudflare, espalhados por mais de 300 cidades em 100+ países. O runtime é baseado no motor V8 (JavaScript/WebAssembly) e, desde 2025, também oferece suporte a Python. O cold start é consistentemente inferior a 1 milissegundo, uma ordem de grandeza abaixo de concorrentes como Lambda@Edge ou CloudFront Functions.
A mágica da Cloudflare Workers infraestrutura está no modelo de isolamento: cada Worker executa em um isolate do V8, não em containers ou microVMs. Isolates são extremamente leves — compartilham o mesmo processo, mas mantêm contextos de execução separados. Isso permite que milhares de Workers coexistam em um único servidor, com inicialização praticamente instantânea e consumo de memória mínimo. A Cloudflare construiu um sistema de orquestração que distribui esses isolates pelos PoPs globais, utilizando roteamento Anycast (AS13335) para garantir que cada requisição seja atendida pelo datacenter mais próximo do usuário.
Além do runtime, a plataforma oferece uma família de primitivos de armazenamento e comunicação que transformam Workers em blocos de construção de sistemas distribuídos completos:
- Durable Objects: atores globais com estado consistente e coordenados via protocolo de consenso, ideais para sessões WebSocket, colaboração em tempo real e, agora, streaming de LLMs.
- KV: key-value store com consistência eventual e propagação global em segundos — útil para feature flags, configurações e dados que toleram staleness.
- R2: object storage compatível com S3, com zero custo de egress — um diferencial brutal contra AWS S3 ($0,09/GB de saída).
- D1: banco de dados SQLite distribuído, com queries executando em menos de 1ms em leituras de borda.
- Queues: fila de mensagens gerenciada, com entrega garantida e integração com Workers, similar ao SQS.
- Workers AI: inferência de modelos como Llama, Mistral, Whisper e Stable Diffusion diretamente na borda.
- AI Gateway: proxy com observabilidade para APIs de IA de terceiros (OpenAI, Anthropic, Google AI), com caching, rate limiting e logging centralizado.
Essa combinação de compute distribuído, armazenamento multi-modelo e IA na borda faz da Cloudflare Workers infraestrutura uma plataforma que compete diretamente com arquiteturas tradicionais de microsserviços em nuvem, mas com latência global drasticamente reduzida e sem a complexidade de gerenciar clusters Kubernetes ou configurações de VPC.
Durable Objects e location hints: latência sub-10ms na Ásia-Pacífico
Em 18 de junho de 2026, o changelog da Cloudflare registrou um aprimoramento sutil, mas impactante: novos location hints para Durable Objects na região Ásia-Pacífico. Até então, o hint apac cobria todo o continente, do Japão à Índia, da Coreia a Singapura. Agora, dois novos hints sub-regionais permitem um posicionamento mais preciso: apac-ne (Northeast Asia-Pacific: Japão, Coreia, China) e apac-se (Southeast Asia-Pacific: Singapura, Indonésia, Tailândia).
Para times de engenharia que operam na região, isso representa uma redução tangível de latência. Um Durable Object posicionado com apac-ne para usuários em Tóquio pode cortar dezenas de milissegundos em comparação com o hint apac genérico, que poderia instanciar o objeto em Singapura dependendo do primeiro request. O mesmo vale para audiências concentradas em Bangkok ou Jacarta com o hint apac-se.
Veja a tabela completa dos location hints suportados em Durable Objects:
A melhor prática da Cloudflare continua sendo não definir location hint a menos que estritamente necessário — sem hint, o Durable Object é instanciado no datacenter mais próximo da requisição inicial, o que tende a minimizar a latência global naturalmente. Mas em cenários onde a audiência está fortemente concentrada em uma sub-região, os novos hints apac-ne e apac-se oferecem um controle fino que antes não existia.
Outbound connections mantêm Durable Objects vivos: o fim do timeout no streaming
Outra mudança no ciclo de vida dos Durable Objects, anunciada também em 18 de junho, resolve uma das dores mais agudas para desenvolvedores que constroem aplicações de streaming na Cloudflare Workers infraestrutura. Anteriormente, um Durable Object era removido da memória (evicted) após 70 a 140 segundos sem tráfego de entrada, mesmo que ele mantivesse uma conexão outbound ativa — como um stream de tokens vindo de um modelo de linguagem (LLM) via TCP ou WebSocket. O resultado era um corte abrupto no streaming, forçando os desenvolvedores a implementar heartbeats artificiais ou reengenharia de fluxo.
Agora, qualquer conexão outbound criada via connect() (TCP) ou WebSocket outbound mantém o Durable Object vivo enquanto durar a conexão. Isso inclui fetch() que façam upgrade para WebSocket, mas não inclui subrequests fetch() simples — mesmo que a resposta ainda esteja em streaming. Conexões via bindings como Hyperdrive também não são cobertas. O limite máximo de keep-alive por conexão outbound é de 15 minutos, após os quais o Durable Object volta a ficar sujeito às regras normais de eviction.
Na prática, isso significa que um agente de IA que chama a API da OpenAI ou Anthropic via TCP e recebe um stream de tokens pode manter o Durable Object residente por toda a duração da resposta, sem risco de interrupção. Para quem implementa chat em tempo real, assistentes de voz ou pipelines de raciocínio multi-etapa na borda, essa mudança elimina uma classe inteira de bugs difíceis de diagnosticar. Na JRT Technology Solutions, temos utilizado esse novo comportamento para estabilizar agentes que orquestram fluxos de decisão longos, combinando Workers AI com modelos externos via AI Gateway — e a diferença é notável.
Cloudflare Workers infraestrutura para agentes de IA: o SDK Agents e o framework Flue
O dia 16 de junho trouxe o anúncio de que o Agents SDK da Cloudflare agora é um runtime aberto para qualquer framework de agentes. O primeiro a se integrar é o Flue, mas a arquitetura é extensível. O Agents SDK expõe primitivos que permitem a um agente gerenciar estado, invocar ferramentas, delegar tarefas a subagentes e interagir com APIs externas — tudo rodando em Workers e Durable Objects. A diferença para um framework tradicional é a localização: em vez de executar em um servidor centralizado, o agente vive na borda, o mais próximo possível do usuário final ou do ponto de ingestão de dados.
Essa abordagem resolve três problemas clássicos de agentes de IA: latência de primeira resposta, custo de transferência de dados e isolamento de sessão. Como o agente roda em um Durable Object, cada conversa ou tarefa tem seu próprio estado isolado, com consistência forte, sem depender de um banco de dados externo para cada transação. O roteamento automático do Durable Object garante que requisições subsequentes na mesma sessão cheguem à mesma instância, eliminando a complexidade de sticky sessions ou replicação de estado.
Além disso, a integração com o Cloudflare One stack — também anunciada em 16 de junho — significa que um agente pode, em teoria, planejar e implantar uma arquitetura Zero Trust completa: configurar túneis, políticas de Access, rotas de rede e regras de Gateway, tudo a partir de um prompt. A biblioteca de agent skills encapsula o conhecimento necessário para provisionar conectores, gerenciar virtual networks e aplicar políticas de segurança, reduzindo a curva de aprendizado para times que precisam escalar ambientes SASE sem uma equipe dedicada de network security.
Comparativo de mercado: Cloudflare vs. Akamai, Fastly e AWS CloudFront
A Cloudflare Workers infraestrutura não existe no vácuo. O mercado de CDN e edge computing é disputado por players consolidados, cada um com suas apostas tecnológicas. A Cloudflare se diferencia ao integrar CDN, segurança e plataforma de desenvolvimento em uma única pilha, mas como ela se compara objetivamente com Akamai, Fastly e AWS CloudFront?