OpenAI e Broadcom apresentam Jalapeño, primeiro chip de inferência dedicado a modelos de linguagem
A OpenAI e a Broadcom anunciaram nesta semana o Jalapeño, o primeiro processador de inteligência artificial desenvolvido pela própria OpenAI. O chip foi projetado especificamente para a fase de inferência de modelos de linguagem de grande porte, etapa em que sistemas de IA já treinados são utilizados para gerar respostas em tempo real a partir de consultas dos usuários.
De acordo com as informações divulgadas, o Jalapeño é descrito como um acelerador de IA, ou seja, um componente de hardware especializado em executar cálculos matemáticos de forma mais rápida e eficiente do que processadores convencionais. Ele foi arquitetado com base na visão da OpenAI sobre o futuro da inferência em modelos de linguagem e representa o primeiro lançamento de uma plataforma de computação que deve ter múltiplas gerações ao longo dos anos.
O anúncio marca o início de uma colaboração de longo prazo entre a OpenAI e a Broadcom, tradicional desenvolvedora de semicondutores e soluções de infraestrutura para grandes centros de dados. A proposta das duas empresas é construir uma plataforma que torne a inteligência artificial avançada mais rápida, confiável e acessível para um número maior de pessoas e organizações.
Um dos destaques técnicos do projeto é a flexibilidade do chip. Segundo a OpenAI, o Jalapeño foi projetado para funcionar com diferentes modelos de linguagem, aproveitando o conhecimento acumulado pela empresa sobre as necessidades de inferência dos modelos atuais e futuros do setor. A inferência é justamente a etapa que mais consome recursos computacionais em aplicações como chatbots, assistentes virtuais e ferramentas de geração de conteúdo, pois cada resposta gerada exige processamento intenso em tempo real.
A estratégia por trás do chip também inclui a chamada abordagem de infraestrutura completa, na qual a OpenAI busca controlar diferentes camadas da cadeia de computação, desde o design do hardware até o funcionamento dos modelos. Com o Jalapeño, a empresa pretende tornar a oferta de computação mais abundante, o que poderia resultar em sistemas de IA mais ágeis, com maior confiabilidade e potencialmente mais acessíveis em termos de custo para usuários finais e empresas.
O desenvolvimento do Jalapeño foi acelerado por meio da colaboração com a Broadcom e com a Celestica, parceira responsável por etapas industriais como implementação do chip, integração de placas e sistemas em rack, redes de alto desempenho e produção em escala. De acordo com materiais divulgados pelas empresas, o projeto avançou do design à produção em aproximadamente nove meses, com parte desse processo tendo sido acelerado com o auxílio dos próprios modelos da OpenAI durante fases de engenharia e validação.
O lançamento do Jalapeño acontece em um momento de forte expansão da demanda por capacidade de processamento em data centers voltados para inteligência artificial. A novidade também se soma a outras iniciativas recentes da OpenAI voltadas à ampliação de sua infraestrutura de computação, área em que a empresa vinha diversificando parcerias com diferentes fornecedores de hardware.
Com a apresentação do Jalapeño, OpenAI e Broadcom iniciam oficialmente a construção de uma plataforma de múltiplas gerações dedicada à inferência de modelos de linguagem, reforçando a tendência de empresas de IA investirem no desenvolvimento de chips próprios para ganhar eficiência, reduzir custos e ampliar o controle sobre sua infraestrutura tecnológica.