A inteligência artificial está se tornando parte cada vez mais presente dos sistemas operacionais modernos. Enquanto empresas como Google, Microsoft e Apple apostam fortemente em assistentes conectados à nuvem, a Canonical decidiu seguir um caminho um pouco diferente para o Ubuntu.
A empresa anunciou oficialmente o Project Myna, uma nova iniciativa que levará recursos de reconhecimento de voz nativos para o Ubuntu Desktop a partir do Ubuntu 26.10, codinome Stonking Stingray.
Com isso, o Ubuntu irá permitir que usuários transformem fala em texto de forma rápida, integrada ao sistema e, principalmente, preservando sua privacidade.
Um recurso de acessibilidade que beneficia todo mundo
Ferramentas de ditado por voz costumam ser associadas a recursos de acessibilidade, ajudando pessoas com dificuldades motoras ou outras limitações a utilizarem o computador com mais facilidade. Mas a Canonical destaca que o recurso também pode funcionar como uma ferramenta de produtividade para qualquer usuário.
A ideia é que o usuário pressione um atalho de teclado, comece a falar e veja o texto aparecer automaticamente no aplicativo que estiver em uso naquele momento, tal como se fosse um escriba.
Segundo os desenvolvedores, o foco inicial será oferecer uma experiência simples e confiável, com indicadores visuais mostrando quando a captura de voz estiver ativa.
Particularmente, este é o sonho deste redator que vos escreve, desde o início da carreira.
Nada de assistente virtual… pelo menos por enquanto
Quem espera algo parecido com Siri, Google Assistant ou Copilot talvez precise segurar a empolgação. A Canonical deixou claro que o escopo inicial do Project Myna será bastante restrito. Entre os recursos que não estarão presentes na primeira versão, estão:
- Assistentes virtuais;
- Comandos de voz para controlar o sistema;
- Tradução automática;
- Automação de tarefas;
- Controle da área de trabalho por voz;
- Detecção automática de idioma.
Segundo a equipe, antes de pensar em funcionalidades mais complexas, é necessário acertar o básico: um sistema de ditado eficiente e confiável.
IA local e sem a necessidade de internet
Um aspecto interessante do projeto é a forma como ele utiliza inteligência artificial. Em vez de enviar gravações para servidores remotos, como acontece em muitas soluções comerciais, o Project Myna utilizará modelos de reconhecimento de fala executados localmente na máquina do usuário.
Depois que os modelos necessários forem instalados, não será necessária conexão com a internet para utilizar o recurso.
Isso traz algumas vantagens importantes:
- Menor dependência de serviços externos;
- Maior privacidade;
- Menor latência;
- Funcionamento mesmo sem conexão de rede;
- Redução do envio de dados para terceiros.
A proposta acompanha uma tendência crescente da indústria de mover determinadas cargas de IA para o próprio dispositivo do usuário, aproveitando o aumento de capacidade dos processadores modernos e da eficiência dos novos modelos de inteligência.
Privacidade como prioridade
A Canonical também enfatizou que a privacidade foi um dos pilares do projeto desde as primeiras etapas de desenvolvimento.
Segundo a documentação divulgada, a implementação inicial seguirá algumas regras importantes:
- O microfone só será acessado quando o usuário ativar explicitamente o recurso;
- Os dados de áudio serão processados apenas na memória;
- As gravações serão descartadas após o processamento;
- Nenhum áudio será enviado automaticamente para serviços externos.
Embora a arquitetura não impeça futuras integrações com modelos remotos, a prioridade atual é oferecer uma experiência totalmente local.
Inicialmente, o Project Myna será desenvolvido com foco no Ubuntu Desktop utilizando Wayland. O GNOME será o ambiente oficialmente validado pela Canonical durante a primeira fase do projeto.
Isso não significa que outros ambientes gráficos ficarão de fora para sempre. Segundo os desenvolvedores, a arquitetura foi projetada para permitir expansão futura para outros desktops.
Uma arquitetura pensada para crescer
Outro ponto do Project Myna que se destaca é sua arquitetura modular. Em vez de criar uma aplicação monolítica, a Canonical está separando diferentes responsabilidades em componentes independentes.
O sistema será dividido entre:
- Reconhecimento de fala;
- Gerenciamento da sessão de ditado;
- Interface de usuário;
- Inserção de texto nos aplicativos.
Essa abordagem facilita futuras melhorias e mudanças sem exigir grandes mudanças na estrutura geral do projeto. Também abre espaço para a substituição de componentes individuais à medida que novos modelos de reconhecimento de voz surgirem.
Ubuntu entra de vez na era da IA local
O anúncio do Project Myna mostra que a Canonical não pretende ficar de fora da corrida pela integração de inteligência artificial aos sistemas operacionais.
Mas, ao contrário de outras empresas que têm concentrado esforços em assistentes conversacionais, novas formas de monetização e recursos baseados na nuvem, o Ubuntu parece estar começando por uma abordagem mais pragmática.
Se a Canonical conseguir entregar uma experiência realmente integrada e precisa já na estreia do Ubuntu 26.10, o Project Myna pode se tornar uma das adições mais interessantes ao desktop Linux nos últimos anos.
Fique por dentro das principais novidades da semana sobre tecnologia e Linux: receba nossa newsletter!




