A Moonshot AI, uma empresa de Inteligência Artificial (IA) sediada em Pequim, na China, lançou o Kimi K2.5, um modelo de IA de última geração focado em agentes multimodais autónomos. A empresa descreve o Kimi K2.5 como “o modelo de código aberto mais poderoso até ao momento”, com capacidade de executar tarefas e criar interfaces web a partir de referências visuais. Ao contrário dos chatbots tradicionais, que dependem de um comando do utilizador para funcionar, o sistema foi projectado para executar tarefas completas de forma independente e sem supervisão constante. É a chamada “inferência”, apontada por grandes nomes do sector como a nova fase da IA. Segundo a Moonshot AI, o Kimi K2.5 é capaz de executar várias tarefas, desde navegar na web até escrever códigos e analisar documentos. É uma evolução directa do Kimi K2 e passou por um pré-treino contínuo com cerca de 15 biliões de tokens, a partir da combinação de textos, códigos, imagens e vídeo. Dessa forma, consegue igualmente reconhecer, na interface de um site, os botões de acção e campos de entrada de informação, como formulários. O modelo baseia-se numa arquitectura de Mistura de Especialistas (MoE) com um bilião de parâmetros totais, activando apenas 32 mil milhões por token durante a inferência, o que o permite utilizar apenas a informação necessária em cada tarefa e reduzir significativamente o custo computacional. Incorpora ainda o mecanismo de Multi-Head Latent Attention (MLA), que diminui o consumo de memória e possibilita uma janela de contexto alargada até 256 mil tokens. No domínio visual, integra o codificador MoonViT, com 400 milhões de parâmetros, responsável pelo processamento nativo de imagens e vídeos. “Nas nossas avaliações internas, o novo modelo proporciona uma redução de 80% no tempo de execução de ponta a ponta, ao mesmo tempo que possibilita cargas de trabalho mais complexas e de longo prazo”Moonshot AI O Kimi K2.5 recorre a um enxame de agentes autónomos para executar tarefas longas e complexas de forma eficiente. Sempre que recebe uma solicitação extensa, o sistema divide o trabalho em subtarefas e cria dinamicamente até 100 subagentes especializados que actuam em paralelo, realizando até 1500 chamadas de ferramentas num único fluxo de trabalho, incluindo pesquisas na web, leitura de ficheiros, execução de código e análise de dados. Um agente central coordena todas as acções, gere erros e consolida os resultados, permitindo, segundo a empresa, uma redução do tempo de execução até 4,5 vezes face às abordagens tradicionais. “Nas nossas avaliações internas, ele proporciona uma redução de 80% no tempo de execução de ponta a ponta, ao mesmo tempo que possibilita cargas de trabalho mais complexas e de longo prazo”, escreveu a empresa. Um dos focos do Kimi K2.5 é desenvolver interfaces e aplicações web por meio de recursos de imagens, como capturas de tela e vídeos, ou descrições em linguagem natural. O modelo consegue gerar código “front-end” (a parte visível e interactiva de um site ou aplicativo) só com esses recursos, sem que o utilizador tenha de escrever códigos ou descrições técnicas detalhadas. A partir dessas referências, o sistema converte layouts em aplicações funcionais em frameworks como React, Vue e Tailwind, já com animações, efeitos de rolagem e elementos interactivos incluídos. “O K2.5 Agent consegue lidar com tarefas de escritório de alta complexidade e grande escala de ponta a ponta”, sublinhou a Moonshot AI, acrescentando que o modelo coordena a utilização de ferramentas em várias etapas e entrega resultados de nível especializado – seja em documentos, folhas de Excel, PDF e apresentações de slides, por meio de conversação. Fonte: Revista Exame

Post a comment

Your email address will not be published.

Related Posts