PUBLICIDADE

Revolução em Silício: OpenAI Lança Chip Jalapeño para Reduzir Custo Bilionário de Infraestrutura de IA

25/06/2026
15 visualizações
4 min de leitura
Imagem principal do post

OpenAI apresenta chip próprio Jalapeño para reduzir custos bilionários com infraestrutura de inteligência artificial

A OpenAI anunciou o desenvolvimento do seu primeiro chip dedicado, batizado de Jalapeño, criado em parceria com a Broadcom com o objetivo de diminuir os altos custos de infraestrutura que sustentam o funcionamento de modelos de inteligência artificial em larga escala. O componente é um ASIC, circuito integrado projetado para uma finalidade específica, dedicado exclusivamente à inferência de grandes modelos de linguagem, ou seja, à etapa em que a IA já treinada responde às solicitações dos usuários.

Imagem complementar

A motivação central do projeto é financeira. Enquanto a Nvidia mantém uma margem de lucro estimada em 75% sobre seus processadores de alto desempenho, a OpenAI opera com margens bem mais apertadas, ficando com cerca de 33 centavos de lucro a cada dólar gerado depois de descontar as despesas operacionais. O peso dessas despesas é expressivo: apenas no ano passado, manter os servidores do ChatGPT em funcionamento custou 8,4 bilhões de dólares. Com a plataforma alcançando 900 milhões de usuários semanais, a projeção é que o custo operacional chegue a aproximadamente 14 bilhões de dólares neste ano. Nos próximos oito anos, a empresa já se comprometeu com cerca de 1,4 trilhão de dólares em capacidade computacional, uma aposta gigantesca considerando que sua receita anual atual gira em torno de 25 bilhões de dólares.

PUBLICIDADE

O Jalapeño foi batizado pela própria OpenAI como seu primeiro "Processador de Inteligência". A empresa definiu a arquitetura central do chip com base em seus modelos e sistemas de atendimento, enquanto a Broadcom ficou responsável pela engenharia de silício e pela integração de redes de alto desempenho. A fabricação física ficou a cargo da TSMC, em Taiwan, e a Celestica é a responsável pela montagem das placas e racks. Segundo a OpenAI, amostras iniciais de laboratório já executam cargas de trabalho de fronteira, incluindo um modelo ainda não lançado chamado GPT-5.3-Codex-Spark, na frequência e no consumo de energia previstos para a produção.

De acordo com Richard Ho, responsável pelo programa de hardware da OpenAI, a arquitetura foi desenhada para minimizar o deslocamento de dados dentro do sistema, fazendo com que o aproveitamento real se aproxime do máximo teórico de desempenho. Diferentemente de aceleradores genéricos adaptados de cargas de trabalho de IA legadas, o chip equilibra de forma personalizada os recursos de processamento, memória e rede para resolver os gargalos de movimentação de dados típicos do atendimento interativo de grandes modelos de linguagem. Para isso, a plataforma integra diretamente o silício de rede Tomahawk da Broadcom, permitindo que os processadores se comuniquem em ambientes de data center massivamente clusterizados.

A estratégia da OpenAI ao adotar silício próprio marca uma transição de empresa puramente de software para uma companhia de infraestrutura verticalmente integrada. O plano abrange toda a cadeia: arquitetura de chips, kernels de software, sistemas de memória, agendamento de rede e a camada final de aplicação. A comparação com a Apple é inevitável, já que a fabricante de iPhones historicamente combina hardware proprietário com o sistema iOS de forma tightly coupled, otimizando toda a experiência em torno de seus próprios padrões. No caso da OpenAI, a integração alimenta um ciclo operacional contínuo em que a maior eficiência da infraestrutura reduz os custos de treinamento e atendimento, o que permite oferecer produtos mais responsivos, que atraem mais usuários e geram mais receita, realimentando o investimento na próxima geração de hardware.

A entrada no mercado de chips próprios, porém, acontece em um cenário em que concorrentes já acumulam anos de experiência. O Google começou a implantar suas unidades de processamento tensorial, conhecidas como TPUs, em 2015 e hoje controla cerca de um quarto da capacidade global de computação de IA fora da cadeia de suprimentos da Nvidia. A Amazon já embarcou mais de um milhão de chips personalizados, enquanto Meta e Microsoft continuam expandindo suas próprias infraestruturas. Greg Brockman, presidente e cofundador da OpenAI, afirmou que o Jalapeño faz parte da estratégia de infraestrutura full stack para tornar a computação mais abundante, acrescentando que, ao projetar mais camadas internamente, a empresa consegue servir mais inteligência com maior eficiência.

Para reduzir essa diferença de tempo, a OpenAI acelerou drasticamente o desenvolvimento. O Jalapeño saiu de um projeto em branco até a fase final antes da produção, etapa conhecida como tape-out, em apenas nove meses. As equipes de engenharia conseguiram esse cronograma ao utilizar os próprios modelos de linguagem da OpenAI para automatizar e otimizar partes do processo de design de hardware, criando um ciclo único em que os modelos que atendem os usuários são usados ativamente para construir a infraestrutura física que rodará suas próximas versões. A implantação inicial do hardware em data centers está prevista para começar até o final de 2026, com escala que será expandida junto a parceiros de infraestrutura, incluindo a Microsoft, em direção a data centers de capacidade medida em gigawatts, conforme confirmou o CEO da Broadcom, Hock Tan.

PUBLICIDADE

Leitura recomendada

Comentários

Nenhum comentário ainda. Seja o primeiro a comentar!