Stable Audio Open: uma nova IA de código aberto para gerar áudio
Notícias

Stable Audio Open: uma nova IA de código aberto para gerar áudio

Uma das possibilidades mais empolgantes trazidas pela IA, é o acesso a ferramentas de baixo custo para a criação de áudio e vídeo, permitindo pequenos criadores produzirem conteúdo com melhor qualidade. Hoje apresentamos o Stable Audio Open, uma nova IA de código aberto para gerar arquivos de áudio, feita pela Stability AI.

Mais do que uma IA para gerar áudio, um material de estudo

Capaz de gerar até 47 segundos de áudio de alta qualidade a partir de um comando em texto, o Stable Audio Open é especializado em produzir trechos instrumentais, batidas de bateria e som ambiente. Seu código é aberto segundo a licença “Stability AI Non-Commercial Research Community”, que proíbe toda forma de uso comercial, sendo principalmente um material de estudo em IA.

Ele foi treinado com 486.492 gravações de áudio, dentre elas, 472.618 vieram do Freesound e 13.874 do Free Music Archive, todas com licenças abertas, do tipo CC0, CC BY, ou CC Sampling+. Para garantir que nenhum material fechado fosse utilizado, confrontaram todos os arquivos com bases de dados consolidadas.

Também contém meios facilitados para os usuários fazerem ajustes, de modo a produzir arquivos mais personalizados, por exemplo, um baterista pode utilizar suas gravações para criar uma nova batida.

Há algumas limitações comentadas pelos seus criadores, como:

  • O modelo não consegue crias vozes realísticas;
  • Foi treinado em inglês, sendo incapaz de entender outros idiomas;
  • O desempenho pode variar conforme o estilo musical, devido à base de dados limitada;
  • Ele é melhor em gerar efeitos sonoros e sons ambientes do que música;
  • Seu sistema de prompt ainda não está refinado, podendo demandar ajustes pelo usuário.

A Stability AI ressalta que o Stable Audio Open é diferente de seu produto comercial, o Stable Audio, que permite criar arquivos de som de alta qualidade de até 3 minutos, com uma estrutura mais complexa e coerente. 

Para testar o Stable Audio Open, você pode baixá-lo e implementá-lo em seu computador acessando o site Hugging Face, um dos maiores repositórios abertos de IA.

Uma das principais empresas desenvolvedoras de IA, a Stability AI começou a ganhar notoriedade pelo Stable Diffusion, um dos principais geradores de imagem de código aberto que você pode testar em seu computador. Conheça mais sobre este software e mais, aprenda a instalá-lo em seu computador!

Diolinux Ofertas - Aproveite os melhores descontos em diversos produtos!