...

Perplexity AI Libera Ferramenta Open Source para Modelos de Trilhão de Parâmetros, Rompendo Barreiras de Hardware e Cloud

A Perplexity AI, conhecida por sua inovação na área de inteligência artificial, acaba de lançar uma ferramenta de código aberto que promete revolucionar a forma como as empresas executam sistemas de IA. Chamada de TransferEngine, a solução visa eliminar duas grandes dores de cabeça: a dependência de um único provedor de nuvem e a necessidade constante de investir em hardware de última geração para rodar modelos massivos.

O fim da armadilha do Vendor Lock-in

O problema da dependência de um único fornecedor (vendor lock-in) é uma realidade para muitas empresas que utilizam serviços de nuvem. Cada provedor utiliza protocolos de rede diferentes para a comunicação de alta velocidade entre GPUs. Por exemplo, os chips ConnectX da Nvidia usam um padrão, enquanto o Elastic Fabric Adapter (AWS EFA) da Amazon Web Services utiliza um protocolo proprietário completamente diferente. Antes do TransferEngine, as soluções existentes funcionavam apenas em um sistema ou outro, forçando as empresas a se comprometerem com um único ecossistema ou a aceitarem um desempenho drasticamente inferior.

A ferramenta TransferEngine funciona como um tradutor universal para a comunicação GPU-para-GPU. Ela cria uma interface comum que funciona em diferentes hardwares, identificando a funcionalidade central compartilhada por vários sistemas. A solução utiliza a tecnologia RDMA (Remote Direct Memory Access), que permite que os computadores transfiram dados diretamente entre as placas gráficas sem envolver o processador principal –imagine como uma faixa expressa dedicada entre os chips.

Desempenho e escalabilidade sem precedentes

A implementação da Perplexity atingiu uma taxa de transferência de 400 gigabits por segundo tanto no Nvidia ConnectX-7 quanto no AWS EFA, igualando as soluções existentes de plataforma única. O TransferEngine também suporta o uso de várias placas de rede por GPU, agregando largura de banda para uma comunicação ainda mais rápida. Segundo a empresa, a tecnologia já está em uso em ambientes de produção para impulsionar seu mecanismo de busca de IA.

A empresa implementou o TransferEngine em três sistemas críticos. Para a inferência desagregada, a solução lida com a transferência de alta velocidade de dados em cache entre servidores, permitindo que as empresas escalem seus serviços de IA dinamicamente. A biblioteca também alimenta o sistema de aprendizado por reforço da Perplexity, alcançando atualizações de peso para modelos de trilhão de parâmetros em apenas 1,3 segundos.

Aposta no Open Source

A decisão da Perplexity de liberar sua infraestrutura de produção em código aberto contrasta fortemente com a postura de concorrentes como OpenAI e Anthropic, que mantêm suas implementações técnicas proprietárias. A empresa liberou a biblioteca completa, incluindo código, ligações Python e ferramentas de benchmarking, sob uma licença aberta. Essa estratégia se assemelha à da Meta com o PyTorch – abrir uma ferramenta crítica, ajudar a estabelecer um padrão da indústria e se beneficiar das contribuições da comunidade. A Perplexity afirmou que continua a otimizar a tecnologia para AWS, seguindo as atualizações das bibliotecas de rede da Amazon para reduzir ainda mais a latência.

A iniciativa da Perplexity AI com o TransferEngine representa um avanço significativo no campo da inteligência artificial, não apenas pela solução técnica inovadora que oferece, mas também pela sua abordagem aberta e colaborativa. Ao liberar o código fonte e permitir que a comunidade contribua para o seu desenvolvimento, a empresa está democratizando o acesso à tecnologia de ponta e acelerando o progresso da IA como um todo. Resta saber se outras empresas seguirão o exemplo da Perplexity, adotando uma postura mais aberta e colaborativa em relação ao desenvolvimento de IA.

Compartilhe:

Descubra mais sobre MicroGmx

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue reading