A Alibaba, empresa por detrás da AliExpress e outras plataformas, apresentou na quarta-feira (27) a actualização “Wan2.2-S2V” do seu modelo de Inteligência Artificial (IA) para transformar fotografias, texto e áudio em vídeo. A ferramenta tem um canal de testes gratuito e é de código aberto para que qualquer programador a possa executar no seu dispositivo. O lançamento é virado para a plataforma de IA generativa da empresa chinesa, conhecida como Wan e funciona de forma semelhante ao Veo 3 e ao Sora, alternativas da Google e da OpenAI para edição de conteúdo audiovisual com a tecnologia. Segundo o site Canaltech, o Wan permite aos utilizadores enviar áudio e fotografias juntamente com um comando de texto para transformar o conjunto numa animação. Com o Wan2.2-S2V, a empresa reforçou as capacidades da funcionalidade, de modo a proporcionar uma edição melhor e mais eficiente. A nova versão suporta vídeos em 480p e 720p e tem como objectivo “transformar” áudios em vídeos. O aplicativo Wan oferece outras opções de edição, como o mecanismo de transformação de texto em conteúdo audiovisual. De acordo com a empresa, a família Wan2.2 concentra-se em quatro inovações, a começar pela arquitectura Mixture-of-Experts (MoE), que aumenta a capacidade do modelo sem accionar o uso de recursos computacionais para entregar os resultados. Além disso, o padrão de qualidade das entregas recebeu grande atenção: “O Wan2.2 incorpora dados estéticos meticulosamente seleccionados, completos com etiquetas detalhadas para iluminação, composição, contraste, tom de cor e muito mais. Isto permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis”, afirma. A geração actual tem também a capacidade de trabalhar com exigências mais complexas, graças à formação com uma base de dados mais extensa e a mecanismos de compressão eficientes para garantir imagens mais definidas sem depender necessariamente de recursos avançados para funcionar. Assim como as outras soluções da empresa, como os modelos de chatbot Qwen, o Wan2.2 está disponível para qualquer utilizador. No caso do aplicativo Wan, disponível em versão Web (wan.video), os utilizadores contam com um plano gratuito para edições limitadas. Para aumentar o limite e obter créditos, é preciso optar por um pacote pago, que pode custar até 26 dólares por mês (1643 meticais). Já os programadores e entusiastas podem aceder ao código da IA através de repositórios hospedados no Hugging Face (huggingface.co) ou no GitHub (github.com) gratuitamente.
Painel