...

Perplexity AI Libera Ferramenta Open Source TransferEngine para Executar Modelos de IA Trilionários em Hardware Existente

A Perplexity AI, conhecida por sua inovação na área de inteligência artificial, acaba de lançar uma ferramenta de código aberto chamada TransferEngine, projetada para revolucionar a maneira como as empresas executam sistemas de IA em grande escala. A iniciativa visa resolver dois problemas críticos que afetam muitas organizações: a dependência de um único provedor de nuvem e a necessidade constante de investir em hardware de última geração para suportar modelos de linguagem massivos.

O Problema da Dependência de Fornecedores e Custos Elevados

Atualmente, muitas empresas se veem presas a ecossistemas de provedores de nuvem específicos devido a incompatibilidades técnicas entre diferentes infraestruturas. Isso significa que, para rodar modelos de IA complexos, como o DeepSeek V3 com 671 bilhões de parâmetros ou o Kimi K2 com um trilhão de parâmetros, as empresas muitas vezes precisam adquirir os hardwares mais recentes e caros, como os sistemas GB200 da Nvidia, que podem custar milhões de dólares e ainda enfrentar problemas de disponibilidade.

Essa dependência de fornecedores (vendor lock-in) é um grande obstáculo, pois limita a flexibilidade e aumenta os custos operacionais. A Perplexity AI identificou que os protocolos de rede para comunicação de alta velocidade entre GPUs variam entre os provedores de nuvem. Por exemplo, os chips ConnectX da Nvidia usam um padrão diferente do Elastic Fabric Adapter (AWS EFA) da Amazon, tornando difícil a interoperabilidade entre diferentes ambientes.

A Solução: TransferEngine como um Tradutor Universal

O TransferEngine surge como uma solução inovadora para esse problema. Ele atua como um tradutor universal, permitindo que modelos de linguagem grandes (LLMs) se comuniquem entre diferentes hardwares de provedores de nuvem em velocidade máxima. A ferramenta utiliza a tecnologia RDMA (Remote Direct Memory Access), que permite a transferência direta de dados entre placas gráficas sem envolver o processador principal, criando uma via expressa dedicada entre os chips. RDMA

Com o TransferEngine, as empresas podem executar modelos trilionários em sistemas GPU H100 e H200 mais antigos e acessíveis, em vez de esperar por hardware de última geração. A Perplexity AI demonstrou que sua implementação alcançou uma taxa de transferência de 400 gigabits por segundo tanto no Nvidia ConnectX-7 quanto no AWS EFA, igualando as soluções existentes de plataforma única. Além disso, o TransferEngine suporta o uso de várias placas de rede por GPU, agregando largura de banda para uma comunicação ainda mais rápida.

Impacto e Aplicações Práticas

A Perplexity AI já está utilizando o TransferEngine em produção para alimentar seu mecanismo de busca de IA. A ferramenta é utilizada em três sistemas críticos: inferência desagregada, onde o TransferEngine lida com a transferência em alta velocidade de dados em cache entre servidores; sistema de aprendizado por reforço, permitindo atualizações de peso para modelos trilionários em apenas 1,3 segundos; e roteamento Mixture-of-Experts (MoE), onde o TransferEngine igualou o desempenho do DeepEP da DeepSeek no hardware ConnectX-7 e criou a primeira implementação viável compatível com AWS EFA.AWS EFA

Nos testes com DeepSeek V3 e Kimi K2 em instâncias AWS H200, a Perplexity AI observou ganhos substanciais de desempenho ao distribuir os modelos em vários nós, especialmente em tamanhos de lote médios, que são ideais para o atendimento em produção. Esses resultados demonstram o potencial do TransferEngine para otimizar a execução de modelos de IA complexos em ambientes de nuvem heterogêneos.

A Aposta no Open Source e o Futuro da IA

A decisão da Perplexity AI de liberar o TransferEngine como código aberto contrasta com a abordagem de empresas como OpenAI e Anthropic, que mantêm suas implementações técnicas proprietárias. Ao adotar uma estratégia semelhante à da Meta com o PyTorch, a Perplexity AI busca estabelecer um padrão da indústria, beneficiar-se das contribuições da comunidade e acelerar o desenvolvimento de soluções de IA mais eficientes e acessíveis.

O TransferEngine representa um avanço significativo na infraestrutura de IA, oferecendo uma alternativa viável para empresas que buscam reduzir custos e evitar a dependência de fornecedores específicos. Ao democratizar o acesso a ferramentas de ponta, a Perplexity AI está contribuindo para um futuro onde a inteligência artificial seja mais acessível, flexível e inovadora.PyTorch

Conclusão: Um Passo Rumo à Democratização da IA

A iniciativa da Perplexity AI ao lançar o TransferEngine como open source é um marco importante no cenário da inteligência artificial. Ao resolver problemas críticos de dependência de fornecedores e custos elevados, a ferramenta capacita empresas de todos os tamanhos a explorar o potencial dos modelos de IA trilionários sem a necessidade de investimentos exorbitantes em hardware de última geração. Este movimento não apenas impulsiona a inovação e a eficiência, mas também promove uma maior democratização do acesso à tecnologia de IA, abrindo caminho para um futuro onde a inteligência artificial seja mais acessível, flexível e adaptável às necessidades de cada organização. A Perplexity AI, ao adotar uma abordagem transparente e colaborativa, está moldando o futuro da IA de forma significativa, incentivando a comunidade a contribuir e a construir sobre esta base sólida para criar soluções ainda mais avançadas e impactantes.

Compartilhe:

Descubra mais sobre MicroGmx

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue reading