A OpenAI apresentou uma nova versão do Codex chamado GPT-5.3-Codex, que mistura as funcionalidades do agente de programação com as do ChatGPT, num ritmo mais acelerado e preciso do que a versão anterior (GPT-5.2-Codex). O novo modelo é descrito como o “mais capaz” até então por conseguir juntar tarefas de pesquisa com pedidos para codificar programas em conversas feitas para simular debates “em tempo real” com humanos. Assim, o GPT-5.3-Codex pode ser utilizado por uma variedade de profissionais ao conseguir atender a diversas procuras seguidas, uma estratégia similar à nova versão do Opus, da Anthropic, que agora realiza pedidos simultâneos com uma equipa de assistentes virtuais. O foco do novo Codex ainda é profissional, mas passa por todas as etapas de conversação, testes e análise que envolvem a criação de um código exacto e funcional. De acordo com um comunicado oficial da empresa, o modelo foi desenvolvido especificamente para fluxos de trabalho profissionais, onde o agente não apenas sugere o código, mas opera o sistema de ponta a ponta. No SWE-bench Pro (Public), que avalia engenharia de software em múltiplos idiomas, o GPT-5.3-Codex atingiu 56,8% de precisão. O salto mais expressivo ocorreu no Terminal-Bench 2.0, focado em comandos de terminal, onde o modelo ultrapassou os 64,0% (versão anterior) para 77,3%. Um dos diferenciais técnicos é o desempenho no OSWorld-Verified, benchmark que mede a capacidade de os agentes utilizarem visão computacional para realizar tarefas em computadores de mesa. O GPT-5.3-Codex alcançou 64,7%, aproximadamente 72% de média humana e superou largamente os 38,2% da geração anterior. A empresa introduziu a capacidade de “direccionamento” no Codex app. Agora, os programadores podem interagir com o modelo durante a execução de tarefas complexas, através de abordagens ajustadas e discutir soluções em tempo real, sem que a Inteligência Artificial perca o contexto do código que está ser gerado ou depurado. O treino e a operação do novo modelo ocorrem em sistemas NVIDIA GB200 NVL72, resultado de um co-design entre as duas empresas para optimizar a pilha de inferência. Essa sinergia permitiu que o modelo processasse tarefas complexas ao utilizar uma quantidade significativamente menor de tokens em comparação aos seus antecessores. Para o sector, a utilização do modelo para treinar a si mesmo (auto-depuração) sinaliza o início de um ciclo de melhoria exponencial, que reduz a dependência de intervenção humana na infra-estrutura de treino. Além disso, a empresa anunciou que planeia lançar uma rede social com leitura de íris para barrar bots (programas de software automatizados, projectados para executar tarefas repetitivas). O projecto procura criar um ambiente exclusivo para pessoas reais, com recurso a biométrica avançada para validar cada novo utilizador. Segundo a revista Exame, até ao momento, a nova versão do Codex só está disponível para utilizadores de planos pagos do ChatGPT, mas a empresa informou que disponibilizará o modelo do programa “em breve”. Aos utilizadores que pagam, já é possível ter acesso à nova versão das IA combinadas pelo aplicativo, pelas extensões CLi e IDE e pelo site oficial do GPT na Internet. Fonte: Tudo Celular
Painel