A Microsoft, após anos de forte依赖 nas fundações de modelos da OpenAI, sinaliza uma mudança estratégica ao lançar seus primeiros modelos de inteligência artificial (IA) desenvolvidos internamente: MAI-Voice-1 e MAI-1-preview. Este movimento sublinha a determinação da gigante do software em trilhar seu próprio caminho no competitivo cenário da IA.
MAI-Voice-1: A Voz Sintética da Microsoft
O MAI-Voice-1, um modelo de geração de fala natural, destaca-se pela sua eficiência. A Microsoft afirma que ele consegue gerar um minuto de áudio em menos de um segundo, utilizando uma única GPU. Este modelo já está integrado no Copilot Daily, gerando resumos de notícias com IA, e na funcionalidade Copilot Podcasts, que permite aos usuários criar podcasts sob demanda a partir de prompts. Demonstrações revelam a capacidade do MAI-Voice-1 de criar áudio expressivo e de alta fidelidade em cenários com um ou múltiplos falantes.
MAI-1-preview: Testando os Limites da IA Textual
Paralelamente, a Microsoft iniciou os testes do MAI-1-preview na LMArena, uma plataforma comunitária onde usuários avaliam diferentes modelos de IA. Desenvolvedores também poderão acessar a API do modelo, mediante inscrição. A empresa planeja implementar o MAI-1-preview em casos de uso textual no Copilot, nas próximas semanas, visando aprimorá-lo com base no feedback dos usuários.
Um Passo Rumo à Independência em IA
O MAI-1-preview utiliza uma arquitetura de “mistura de especialistas” treinada em 15.000 GPUs Nvidia H100, uma infraestrutura considerável, embora menor que os clusters de 100.000 H100 usados por alguns concorrentes. A Microsoft AI agora executa o MAI-1-preview no cluster GB200 da Nvidia, buscando otimizar o desempenho.
Até então, a Microsoft dependia dos modelos da OpenAI, empresa na qual investiu cerca de US$ 13 bilhões desde 2019 e que utiliza a plataforma Azure para hospedar seus modelos e serviços. A contratação de Mustafa Suleyman, ex-fundador da DeepMind, e sua equipe da Inflection AI, para desenvolver modelos de IA independentes da OpenAI, surpreendeu a indústria. A Inflection AI continua a desenvolver sua própria IA corporativa, enquanto os ex-fundadores e a equipe principal trabalham nos produtos Copilot da Microsoft. [Veja mais sobre a aquisição da Inflection AI pela Microsoft](https://www.theverge.com/2024/3/12/24098588/microsoft-inflection-ai-mustafa-suleyman-karén-simonyan).
O Futuro da Parceria Microsoft-OpenAI
Microsoft e Suleyman têm mantido silêncio sobre o impacto desta mudança na relação com a OpenAI. Suleyman, em entrevista, destacou o compromisso da Microsoft em ter “opcionalidade”, indicando que a empresa poderá usar modelos de terceiros e continuará a utilizar os modelos da OpenAI, além de modelos de código aberto. Ele acredita que uma plataforma intermediária, que encaminha as consultas para diferentes modelos de IA com base na capacidade, é crucial para a estratégia futura da empresa. [Acompanhe as declarações de Mustafa Suleyman](https://www.semafor.com/article/03/12/2024/microsoft-hires-inflection-ai-cofounder-for-new-ai-group).
Foco no Consumidor
Outro aspecto relevante é que o desenvolvimento dos modelos de IA da Microsoft está, a curto prazo, direcionado para o Copilot no espaço do consumidor, em vez de empresas. A empresa almeja orquestrar uma variedade de modelos especializados para atender diferentes intenções e casos de uso, desbloqueando um valor imenso.
O anúncio dos modelos MAI-Voice-1 e MAI-1-preview representam um passo significativo na estratégia da Microsoft em busca de maior autonomia no desenvolvimento de inteligência artificial. Embora a parceria com a OpenAI permaneça relevante, a empresa demonstra um claro interesse em diversificar suas opções e construir suas próprias capacidades internas. O futuro da IA da Microsoft parece promissor, com um foco tanto na inovação tecnológica quanto na aplicação prática para melhorar a experiência do usuário.